阿里巴巴声称其新的AI模型优于DeepSeek＆Chatgpt

中国科技公司阿里巴巴（Alibaba）周三推出了其AI型号2.5-max的新版本，以大胆地参加快速发展的人工智能（AI）行业，Qwen 2.5-max发起了新版本，声称它超过了诸如DeepSeek的AI之类的著名模型的性能，Openai的GPT-4O和Meta的骆驼。

在农历新年的第一天，Qwen 2.5-Max发行了，这是许多中国人传统上下班并与家人共度时光的时期，从战略上讲，过去三周内的压力是DeepSeek的流放崛起，这是不可能的。只有其海外竞争对手，也只有其国内竞争对手，例如Tencent Holdings Ltd.和Baidu Inc.

据报道，该公司的新模型是针对超过20万亿代币开发的，并通过策划的监督微调（SFT）和增强人类反馈（RLHF）方法进行了进一步的培训。

“ QWEN 2.5-MAX的表现都胜过……几乎在GPT-4O，DeepSeek-V3和Llama-3.1-405B上，”阿里巴巴的云部队在其官方微信帐户上发布的公告中说，指的是Openai和Meta等国际巨头。

阿里巴巴宣布，其QWEN2.5-MAX在多个基准测试中胜过DeepSeek V3，包括Arena-Hard，LiveBench，LiveCodeBench和GPQA-Diamond。

它还在包括MMLU-Pro在内的其他评估中显示出令人印象深刻的结果。

该公司的基本模型在大多数基准测试中都显示出很大的改进，并且有信心培训后方法的进步将使下一个版本的QWEN2.5-MAX提高到更高的性能水平。

“在比较基本模型时，我们将无法访问专有模型，例如GPT-4O和Claude-3.5-Sonnet。因此，我们评估了QWEN2.5-MAX针对DeepSeek V3的QWEN2.5-MAX，这是领先的开放式MOE模型，Llama-3.1-405b，最大的开放量密度密度模型和QWEN2.5-72B，也是最高的开放式开放式。重量致密模型。”该公司在博客。

此外，阿里巴巴的Qwen补充说：“现在可以在QWEN聊天中使用QWEN2.5-MAX，您可以直接与模型聊天，或者与文物，搜索等一起玩。”

这全都是由于DeepSeek是一家中国初创企业，成立于2023年，位于阿里巴巴的家乡杭州。

随着DeepSeek-V3和R1车型的发布，DeepSeek在整个美国AI景观中派出了冲击波。

它还因其巨大的低成本和计算能力而迅速引起了全球关注，投资者质疑来自美国公司的昂贵AI项目的可行性。

这家初创企业在中国的成功激发了该国科技巨头之间的激烈竞争。

例如，在DeepSeek启动R1模型仅两天后，Tiktok的母公司Bontedance响应了其旗舰AI模型的更新，声称它在重要的基准测试中胜过Aime上的Openai O1，以评估AI在理解和执行复杂说明方面的AI绩效。

但是，DeepSeek已经提出了自己的大胆主张，声称其R1模型可以在多个性能基准上与Openai的O1相匹配或超过Openai的O1。