阿里巴巴聲稱其新的人工智能模型優於 DeepSeek 和 ChatGPT

為了在快速發展的人工智能（AI）行業中競爭，中國科技公司阿里巴巴週三推出了新版本的人工智能模型Qwen 2.5-Max，聲稱它超越了 DeepSeek 的 AI、OpenAI 的 GPT-4o 和 Meta 的 Llama 等知名模型的性能。

Qwen 2.5-Max 在農曆大年初一發布，這個時候很多中國人傳統上都下班和家人團聚，這從戰略上凸顯了 DeepSeek 在過去三週的迅速崛起不僅給其海外競爭對手帶來了壓力，也給騰訊和百度等國內競爭對手帶來了壓力。

據報導，該公司的新模型是在超過 20 萬億代幣上開發的，並通過精心策劃的監督微調 (SFT) 和人類反饋強化學習 (RLHF) 方法進行了進一步的後期訓練。

“Qwen 2.5-Max 的性能幾乎全面優於 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B，”阿里巴巴雲部門在其官方微信賬戶上發布的公告中表示，指的是 OpenAI 和 Meta 等國際巨頭。

阿里巴巴宣布其Qwen2.5-Max在多項基準測試中均優於DeepSeek V3，包括Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond。

它還在其他評估中展示了令人印象深刻的結果，包括 MMLU-Pro。

該公司的基礎模型在大多數基準測試中都顯示出顯著的改進，並且有信心訓練後方法的進步將使 Qwen2.5-Max 的下一版本達到更高的性能水平。

“在比較基本模型時，我們無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等專有模型。因此，我們將 Qwen2.5-Max 與 DeepSeek V3（領先的開放權重 MoE 模型）、Llama-3.1-405B（最大的開放權重密集模型）和 Qwen2.5-72B（也是頂級開放權重密集模型之一）進行評估，”該公司在一份報告中表示。部落格。

此外，阿里巴巴的Qwen補充道：“現在Qwen Chat中提供了Qwen2.5-Max，你可以直接與模型聊天，或者玩文物，搜索等。”

這一切都歸功於 DeepSeek，一家於 2023 年在阿里巴巴故鄉杭州成立的中國初創公司。

隨著 DeepSeek-V3 和 R1 模型的發布，DeepSeek 給美國人工智能領域帶來了衝擊。

它還因其顯著的低成本和計算能力而迅速引起全球關注，投資者質疑美國公司昂貴的人工智能項目的可行性。

這家初創公司在中國的成功引發了中國科技巨頭之間的激烈競爭。

例如，就在 DeepSeek 推出 R1 模型兩天后，TikTok 的母公司字節跳動對其旗艦 AI 模型進行了更新，聲稱其在 AIME 上的表現優於 OpenAI 的 o1，這是一項評估 AI 在理解和執行複雜指令方面的性能的關鍵基準測試。

然而，DeepSeek 已經做出了自己的大膽聲明，聲稱其 R1 模型在多個性能基准上可以與 OpenAI 的 o1 相媲美或超越。