中国科技公司阿里巴巴(Alibaba)周三推出了其AI型号2.5-max的新版本,以大胆地参加快速发展的人工智能(AI)行业,Qwen 2.5-max发起了新版本,声称它超过了诸如DeepSeek的AI之类的著名模型的性能,Openai的GPT-4O和Meta的骆驼。
在农历新年的第一天,Qwen 2.5-Max发行了,这是许多中国人传统上下班并与家人共度时光的时期,从战略上讲,过去三周内的压力是DeepSeek的流放崛起,这是不可能的。只有其海外竞争对手,也只有其国内竞争对手,例如Tencent Holdings Ltd.和Baidu Inc.
据报道,该公司的新模型是针对超过20万亿代币开发的,并通过策划的监督微调(SFT)和增强人类反馈(RLHF)方法进行了进一步的培训。
“ QWEN 2.5-MAX的表现都胜过……几乎在GPT-4O,DeepSeek-V3和Llama-3.1-405B上,”阿里巴巴的云部队在其官方微信帐户上发布的公告中说,指的是Openai和Meta等国际巨头。
阿里巴巴宣布,其QWEN2.5-MAX在多个基准测试中胜过DeepSeek V3,包括Arena-Hard,LiveBench,LiveCodeBench和GPQA-Diamond。
它还在包括MMLU-Pro在内的其他评估中显示出令人印象深刻的结果。
该公司的基本模型在大多数基准测试中都显示出很大的改进,并且有信心培训后方法的进步将使下一个版本的QWEN2.5-MAX提高到更高的性能水平。
“在比较基本模型时,我们将无法访问专有模型,例如GPT-4O和Claude-3.5-Sonnet。因此,我们评估了QWEN2.5-MAX针对DeepSeek V3的QWEN2.5-MAX,这是领先的开放式MOE模型,Llama-3.1-405b,最大的开放量密度密度模型和QWEN2.5-72B,也是最高的开放式开放式。重量致密模型。”该公司在博客。
此外,阿里巴巴的Qwen补充说:“现在可以在QWEN聊天中使用QWEN2.5-MAX,您可以直接与模型聊天,或者与文物,搜索等一起玩。”
这全都是由于DeepSeek是一家中国初创企业,成立于2023年,位于阿里巴巴的家乡杭州。
随着DeepSeek-V3和R1车型的发布,DeepSeek在整个美国AI景观中派出了冲击波。
它还因其巨大的低成本和计算能力而迅速引起了全球关注,投资者质疑来自美国公司的昂贵AI项目的可行性。
这家初创企业在中国的成功激发了该国科技巨头之间的激烈竞争。
例如,在DeepSeek启动R1模型仅两天后,Tiktok的母公司Bontedance响应了其旗舰AI模型的更新,声称它在重要的基准测试中胜过Aime上的Openai O1,以评估AI在理解和执行复杂说明方面的AI绩效。
但是,DeepSeek已经提出了自己的大胆主张,声称其R1模型可以在多个性能基准上与Openai的O1相匹配或超过Openai的O1。