為了在快速發展的人工智能(AI)行業中競爭,中國科技公司阿里巴巴週三推出了新版本的人工智能模型Qwen 2.5-Max,聲稱它超越了 DeepSeek 的 AI、OpenAI 的 GPT-4o 和 Meta 的 Llama 等知名模型的性能。
Qwen 2.5-Max 在農曆大年初一發布,這個時候很多中國人傳統上都下班和家人團聚,這從戰略上凸顯了 DeepSeek 在過去三週的迅速崛起不僅給其海外競爭對手帶來了壓力,也給騰訊和百度等國內競爭對手帶來了壓力。
據報導,該公司的新模型是在超過 20 萬億代幣上開發的,並通過精心策劃的監督微調 (SFT) 和人類反饋強化學習 (RLHF) 方法進行了進一步的後期訓練。
“Qwen 2.5-Max 的性能幾乎全面優於 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B,”阿里巴巴雲部門在其官方微信賬戶上發布的公告中表示,指的是 OpenAI 和 Meta 等國際巨頭。
阿里巴巴宣布其Qwen2.5-Max在多項基準測試中均優於DeepSeek V3,包括Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond。
它還在其他評估中展示了令人印象深刻的結果,包括 MMLU-Pro。
該公司的基礎模型在大多數基準測試中都顯示出顯著的改進,並且有信心訓練後方法的進步將使 Qwen2.5-Max 的下一版本達到更高的性能水平。
“在比較基本模型時,我們無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等專有模型。因此,我們將 Qwen2.5-Max 與 DeepSeek V3(領先的開放權重 MoE 模型)、Llama-3.1-405B(最大的開放權重密集模型)和 Qwen2.5-72B(也是頂級開放權重密集模型之一)進行評估,”該公司在一份報告中表示。部落格。
此外,阿里巴巴的Qwen補充道:“現在Qwen Chat中提供了Qwen2.5-Max,你可以直接與模型聊天,或者玩文物,搜索等。”
這一切都歸功於 DeepSeek,一家於 2023 年在阿里巴巴故鄉杭州成立的中國初創公司。
隨著 DeepSeek-V3 和 R1 模型的發布,DeepSeek 給美國人工智能領域帶來了衝擊。
它還因其顯著的低成本和計算能力而迅速引起全球關注,投資者質疑美國公司昂貴的人工智能項目的可行性。
這家初創公司在中國的成功引發了中國科技巨頭之間的激烈競爭。
例如,就在 DeepSeek 推出 R1 模型兩天后,TikTok 的母公司字節跳動對其旗艦 AI 模型進行了更新,聲稱其在 AIME 上的表現優於 OpenAI 的 o1,這是一項評估 AI 在理解和執行複雜指令方面的性能的關鍵基準測試。
然而,DeepSeek 已經做出了自己的大膽聲明,聲稱其 R1 模型在多個性能基准上可以與 OpenAI 的 o1 相媲美或超越。






![Google Play 商店交易被拒絕 [OR-FGEMF-20] [ 修復 ]](https://webbedxp.com/tech/kourtney/wp-content/uploads/2024/10/Transaction-was-declined.jpg)


