อาลีบาบาอ้างว่าโมเดล AI ใหม่มีประสิทธิภาพสูงกว่า Deepseek & Chatgpt

ในการเคลื่อนไหวอย่างกล้าหาญเพื่อแข่งขันในอุตสาหกรรมปัญญาประดิษฐ์ที่เติบโตอย่างรวดเร็ว (AI) บริษัท เทคโนโลยีจีนอาลีบาบาเมื่อวันพุธที่ผ่านมาได้เปิดตัวรุ่น AI รุ่นใหม่ Qwen 2.5-Max โดยอ้างว่ามันเกินกว่าการแสดงของรุ่นที่รู้จักกันดีเช่น Llama ของ OpenAi และ Meta ของ Meta

การเปิดตัว Qwen 2.5-max ในวันแรกของปีใหม่ทางจันทรคติเวลาที่คนจีนจำนวนมากออกไปทำงานตามธรรมเนียมและใช้เวลากับครอบครัวของพวกเขาตอกย้ำกลยุทธ์การเพิ่มขึ้นของความกดดันในช่วงสามสัปดาห์ที่ผ่านมา

มีรายงานว่าโมเดลใหม่ของ บริษัท ได้รับการพัฒนาในโทเค็นกว่า 20 ล้านล้านโทและได้รับการฝึกอบรมเพิ่มเติมด้วยการปรับแต่งการปรับแต่ง (SFT) และการเรียนรู้การเสริมแรงจากวิธีการตอบกลับของมนุษย์ (RLHF)

“ Qwen 2.5-max มีประสิทธิภาพสูงกว่า…เกือบทั่วกระดาน GPT-4O, Deepseek-V3 และ LLAMA-3.1-405B” หน่วยคลาวด์ของอาลีบาบากล่าวในประกาศที่โพสต์ไว้ในบัญชี WeChat อย่างเป็นทางการ

อาลีบาบาประกาศว่า QWEN2.5-MAX นั้นมีประสิทธิภาพสูงกว่า DEEPSEEK V3 ในการเปรียบเทียบหลายแบบรวมถึง Arena-Hard, LiveBench, LiveCodeBench และ GPQA-Diamond

นอกจากนี้ยังแสดงให้เห็นถึงผลลัพธ์ที่น่าประทับใจในการประเมินอื่น ๆ รวมถึง MMLU-PRO

โมเดลพื้นฐานของ บริษัท ได้แสดงการปรับปรุงอย่างมากในมาตรฐานส่วนใหญ่และมั่นใจว่าความก้าวหน้าในวิธีการฝึกอบรมหลังการฝึกอบรมจะยกระดับ QWEN2.5-MAX รุ่นต่อไปเพื่อประสิทธิภาพที่สูงขึ้น

“ เมื่อเปรียบเทียบแบบจำลองพื้นฐานเราไม่สามารถเข้าถึงโมเดลที่เป็นกรรมสิทธิ์เช่น GPT-4O และ Claude-3.5-Sonnet ดังนั้นเราจึงประเมิน QWEN2.5-MAX กับ Deepseek V3 ซึ่งเป็นโมเดล MOE ที่มีน้ำหนักเปิดชั้นนำ LLAMA-3.1-405B ซึ่งเป็นรุ่นหนาแน่นแบบเปิดที่ใหญ่ที่สุดและ QWEN2.5-72B ซึ่งเป็นหนึ่งในรุ่นหนาแน่นแบบเปิดกว้างบล็อก-

นอกจากนี้ Qwen ของ Alibaba เพิ่ม:“ ตอนนี้ Qwen2.5-Max มีให้บริการใน Qwen Chat และคุณสามารถแชทกับโมเดลโดยตรงหรือเล่นกับสิ่งประดิษฐ์การค้นหา ฯลฯ ”

ทั้งหมดนี้เป็นเพราะ Deepseek การเริ่มต้นของจีนก่อตั้งขึ้นในปี 2566 ในบ้านเกิดของ Alibaba ที่หางโจว

ด้วยการเปิดตัวรุ่น Deepseek-V3 และ R1 Deepseek ได้ส่งคลื่นกระแทกข้ามภูมิทัศน์ AI ของสหรัฐอเมริกา

นอกจากนี้ยังได้รับความสนใจทั่วโลกอย่างรวดเร็วสำหรับต้นทุนที่ต่ำและกำลังการคำนวณอย่างมีนัยสำคัญโดยนักลงทุนที่ตั้งคำถามถึงความมีชีวิตของโครงการ AI ที่มีราคาแพงจาก บริษัท ในสหรัฐอเมริกา

ความสำเร็จของการเริ่มต้นในประเทศจีนได้จุดประกายการแข่งขันที่รุนแรงในหมู่ยักษ์ใหญ่ด้านเทคโนโลยีของประเทศ

ตัวอย่างเช่นเพียงสองวันหลังจาก Deepseek เปิดตัวโมเดล R1 บริษัท แม่ของ Tiktok ได้ตอบกลับด้วยการอัปเดตโมเดล AI เรือธงโดยอ้างว่ามีประสิทธิภาพสูงกว่า Openai Openai ใน AIME ในการทดสอบมาตรฐานที่สำคัญซึ่งประเมินประสิทธิภาพ AI ในการทำความเข้าใจ

อย่างไรก็ตาม Deepseek ได้เรียกร้องตัวเองเป็นตัวของตัวเองโดยอ้างว่าโมเดล R1 ของมันสามารถเป็นคู่แข่งหรือเกิน Openai ของ Openai ในการวัดประสิทธิภาพการทำงานที่หลากหลาย

相關貼文