在生成AI的小世界中的风暴。一家未知的中国聊天机器人,DeepSeek,在App Store排名的顶部,开源技术的发展成本为600万美元……用于接近Chatgpt的成绩。
它在美国AI中间感到恐慌,人造卫星时刻“担心唐纳德·特朗普(Donald Trump)的投资者兼密闭顾问马克·安德森(Marc Andreessen)指的是苏联于1957年发起的第一颗卫星,这使美国短缺。中国聊天机器人,DeepSeek在过去的几天中,全世界最受欢迎的免费应用程序的分类。
大卫反对歌利亚
机器人DeepSeek-R1提出的最先进的语言模型(LLM)比O1模型,最先进的Openai根据DeepSeek的基准,关于数学和推理问题。默认情况下,聊天机器人与DeepSeek-V3合作,开发的成本不到600万美元。例如,在设计高性能LLM所需的数千亿美元中,一滴水一直在不断回忆起该领域的美国巨人 - 例如,通过星际之门项目。
DeepSeek拥有这个小的David Battant Goliath,这可能会动摇美国(和欧洲)行业的确定性:其开源模型的质量比西方冠军的筹码效率低,而中国机器人会做得更好……甚至更少亲爱的。根据Epoch AI的说法,DeepSeek模型将是如此有效,以至于其训练只需要Meta Llama 3.1模型的十分之一。
谁说中国机器人还涉及对某些“敏感”请求的限制。例如,不可能提出与Tien-Anmen或XI Jinping的起义有关的Deepseek问题。
自2021年以来,由于白宫施加的限制,在中国获得最先进的美国硅非常复杂。为了能够继续工作,中国IA开发人员在他们之间分享他们的工作,并正在尝试新的方法。 “”DeepSeek专注于通过软件解决方案优化资源”,解释有线悉尼技术大学副教授Marina Zhang。
中国技术专家继续:”DeepSeek通过汇总集体专业知识并促进协作创新采用了开源方法。这种方法不仅克服了资源限制,而且要加快高级技术的发展,这将DeepSeek与更封闭的竞争对手区分开»。
DeepSeek是由Liang Wenfeng在Hangzhou创建的。这位电子工程师已经收集了来自NVIDIA的10,000张H100芯片的电池,这些电池现在被禁止进口到中国。对于这一基础架构,将始终添加功能较低的芯片以进口,并进行优化,以限制成本并降低LLM培训所需的计算能力。
DeepSeek的成功是Western AI的真正电击。中国的例子可能会促使其更加共同点,并在现有基础设施中寻求更高的效率。
来源 : 有线