中國科技公司阿里巴巴(Alibaba)週三推出了其AI型號2.5-max的新版本,以大膽地參加快速發展的人工智能(AI)行業,Qwen 2.5-max發起了新版本,聲稱它超過了諸如DeepSeek的AI之類的著名模型的性能,Openai的GPT-4O和Meta的駱駝。
在農曆新年的第一天,Qwen 2.5-Max發行了,這是許多中國人傳統上下班並與家人共度時光的時期,從戰略上講,過去三週內的壓力是DeepSeek的流放崛起,這是不可能的。只有其海外競爭對手,也只有其國內競爭對手,例如Tencent Holdings Ltd.和Baidu Inc.
據報導,該公司的新模型是針對超過20萬億代幣開發的,並通過策劃的監督微調(SFT)和增強人類反饋(RLHF)方法進行了進一步的培訓。
“ QWEN 2.5-MAX的表現都勝過……幾乎在GPT-4O,DeepSeek-V3和Llama-3.1-405B上,”阿里巴巴的雲部隊在其官方微信帳戶上發布的公告中說,指的是Openai和Meta等國際巨頭。
阿里巴巴宣布,其QWEN2.5-MAX在多個基準測試中勝過DeepSeek V3,包括Arena-Hard,LiveBench,LiveCodeBench和GPQA-Diamond。
它還在包括MMLU-Pro在內的其他評估中顯示出令人印象深刻的結果。
該公司的基本模型在大多數基準測試中都顯示出很大的改進,並且有信心培訓後方法的進步將使下一個版本的QWEN2.5-MAX提高到更高的性能水平。
“在比較基本模型時,我們將無法訪問專有模型,例如GPT-4O和Claude-3.5-Sonnet。因此,我們評估了QWEN2.5-MAX針對DeepSeek V3的QWEN2.5-MAX,這是領先的開放式MOE模型,Llama-3.1-405b,最大的開放量密度密度模型和QWEN2.5-72B,也是最高的開放式開放式。重量緻密模型。”該公司在部落格。
此外,阿里巴巴的Qwen補充說:“現在可以在QWEN聊天中使用QWEN2.5-MAX,您可以直接與模型聊天,或者與文物,搜索等一起玩。”
這全都是由於DeepSeek是一家中國初創企業,成立於2023年,位於阿里巴巴的家鄉杭州。
隨著DeepSeek-V3和R1車型的發布,DeepSeek在整個美國AI景觀中派出了衝擊波。
它還因其巨大的低成本和計算能力而迅速引起了全球關注,投資者質疑來自美國公司的昂貴AI項目的可行性。
這家初創企業在中國的成功激發了該國科技巨頭之間的激烈競爭。
例如,在DeepSeek啟動R1模型僅兩天后,Tiktok的母公司Bontedance響應了其旗艦AI模型的更新,聲稱它在重要的基準測試中勝過Aime上的Openai O1,以評估AI在理解和執行複雜說明方面的AI績效。
但是,DeepSeek已經提出了自己的大膽主張,聲稱其R1模型可以在多個性能基准上與Openai的O1相匹配或超過Openai的O1。