ในการเคลื่อนไหวอย่างกล้าหาญเพื่อแข่งขันในอุตสาหกรรมปัญญาประดิษฐ์ที่กำลังเติบโตอย่างรวดเร็ว (AI) บริษัท เทคโนโลยีจีนอาลีบาบาเมื่อวันพุธที่ผ่านมาได้เปิดตัวรุ่น AI รุ่นใหม่ Qwen 2.5-Max โดยอ้างว่าเกินกว่าประสิทธิภาพของรุ่นที่รู้จักกันดีเช่น AI ของ Deepseek ของ Deepseek , GPT-4O ของ Openai และ Meta's Llama
การเปิดตัว Qwen 2.5-max ในวันแรกของปีใหม่ทางจันทรคติเวลาที่คนจีนจำนวนมากออกไปทำงานตามธรรมเนียมและใช้เวลากับครอบครัว มีเพียงคู่แข่งในต่างประเทศ แต่ยังรวมถึงคู่แข่งในประเทศเช่น Tencent Holdings Ltd. และ Baidu Inc.
มีรายงานว่าโมเดลใหม่ของ บริษัท ได้รับการพัฒนาในโทเค็นกว่า 20 ล้านล้านโทและได้รับการฝึกอบรมเพิ่มเติมด้วยการปรับแต่งการปรับแต่ง (SFT) และการเรียนรู้การเสริมแรงจากวิธีการตอบกลับของมนุษย์ (RLHF)
“ Qwen 2.5-max มีประสิทธิภาพสูงกว่า…เกือบทั่วกระดาน GPT-4O, Deepseek-V3 และ LLAMA-3.1-405B” หน่วยคลาวด์ของอาลีบาบากล่าวในประกาศที่โพสต์ไว้ในบัญชี WeChat อย่างเป็นทางการ
อาลีบาบาประกาศว่า QWEN2.5-MAX นั้นมีประสิทธิภาพสูงกว่า DEEPSEEK V3 ในการเปรียบเทียบหลายแบบรวมถึง Arena-Hard, LiveBench, LiveCodeBench และ GPQA-Diamond
นอกจากนี้ยังแสดงให้เห็นถึงผลลัพธ์ที่น่าประทับใจในการประเมินอื่น ๆ รวมถึง MMLU-PRO
โมเดลพื้นฐานของ บริษัท ได้แสดงการปรับปรุงอย่างมากในมาตรฐานส่วนใหญ่และมั่นใจว่าความก้าวหน้าในวิธีการฝึกอบรมหลังการฝึกอบรมจะยกระดับ QWEN2.5-MAX รุ่นต่อไปเพื่อประสิทธิภาพที่สูงขึ้น
“ เมื่อเปรียบเทียบแบบจำลองพื้นฐานเราไม่สามารถเข้าถึงโมเดลที่เป็นกรรมสิทธิ์เช่น GPT-4O และ Claude-3.5-Sonnet ดังนั้นเราจึงประเมิน QWEN2.5-MAX กับ Deepseek V3 ซึ่งเป็นโมเดล MOE ที่มีน้ำหนักเปิดชั้นนำ LLAMA-3.1-405B ซึ่งเป็นรุ่นหนาแน่นแบบเปิดที่ใหญ่ที่สุดและ QWEN2.5-72B ซึ่งเป็นหนึ่งในอันดับต้น ๆ แบบจำลองความหนาแน่นของน้ำหนัก” บริษัท กล่าวในกบล็อก-
นอกจากนี้ Qwen ของ Alibaba เพิ่ม:“ ตอนนี้ Qwen2.5-Max มีให้บริการใน Qwen Chat และคุณสามารถแชทกับโมเดลโดยตรงหรือเล่นกับสิ่งประดิษฐ์การค้นหา ฯลฯ ”
ทั้งหมดนี้เป็นเพราะ Deepseek การเริ่มต้นของจีนก่อตั้งขึ้นในปี 2566 ในบ้านเกิดของ Alibaba ที่หางโจว
ด้วยการเปิดตัวรุ่น Deepseek-V3 และ R1 Deepseek ได้ส่งคลื่นกระแทกข้ามภูมิทัศน์ AI ของสหรัฐอเมริกา
นอกจากนี้ยังได้รับความสนใจทั่วโลกอย่างรวดเร็วสำหรับต้นทุนที่ต่ำและกำลังการคำนวณอย่างมีนัยสำคัญโดยนักลงทุนที่ตั้งคำถามถึงความมีชีวิตของโครงการ AI ที่มีราคาแพงจาก บริษัท ในสหรัฐอเมริกา
ความสำเร็จของการเริ่มต้นในประเทศจีนได้จุดประกายการแข่งขันที่รุนแรงในหมู่ยักษ์ใหญ่ด้านเทคโนโลยีของประเทศ
ตัวอย่างเช่นเพียงสองวันหลังจาก Deepseek เปิดตัวโมเดล R1 บริษัท แม่ของ Tiktok ได้ตอบกลับด้วยการอัปเดตโมเดล AI เรือธงโดยอ้างว่ามีประสิทธิภาพสูงกว่า Openai Openai ใน AIME ในการทดสอบมาตรฐานที่สำคัญ .
อย่างไรก็ตาม Deepseek ได้เรียกร้องตัวเองเป็นตัวของตัวเองโดยอ้างว่าโมเดล R1 ของมันสามารถเป็นคู่แข่งหรือเกิน Openai ของ Openai ในการวัดประสิทธิภาพการทำงานที่หลากหลาย