Meta 的新主要语言模型 Llama 3.1 希望与该领域的大牌 GPT-4o 和 Claude 3.5 Sonnet 并肩。他口袋里有一张王牌可以赢得赌注:该模型是开源的,因此每个人都可以免费使用。
«开源人工智能对世界有利»,断言马克·扎克伯格。秉持着这样的信念,创始人兼老板元宣布免费开放分发骆驼3.1,该公司开发的大语言模型(LLM)的新“丰富”版本。事实上,共有三种模型:8B 模型(80 亿个参数)、70B(700 亿个参数)和最大的 405B(4050 亿个参数)。
针对苹果及其封闭模式的攻击
参数的数量是模型容量的衡量标准,它并不是唯一必须考虑的因素(训练数据的质量也同样重要)。但面对 OpenAI 的激烈竞争,Meta 想要给予重击(GPT-4o)和人类(克劳德 3.5 十四行诗),因此通过在 16,000 个 Nvidia H100 GPU 上训练 Llama 3.1 来给自己提供了方法。
尽管 LLM 培训产生了成本,但 Meta 仍将其作为向社区的“礼物”。马克·扎克伯格坚信:开放的人工智能模型将取代专有模型,就像 Linux 已成为云计算行业的基础以及大多数移动设备运行的操作系统一样。
如果我们必须看看人类从 Llama 中得到什么,这对 Meta 有什么好处?马克·扎克伯格讨论了他的公司与苹果公司遇到的挫折:
“我的成长经历之一是在苹果平台施加的限制下开发我们的服务。从他们向开发者征税的方式、他们执行的任意规则,以及他们阻止的所有产品创新,很明显,如果我们能够开发出最好的版本,Meta 和许多其他公司需要自由地为用户提供更好的服务我们的产品,而我们的竞争对手无法限制我们的创造。”
为了避免被锁定在封闭的生态系统中,Llama 必须成为一个完整的生态系统,拥有只有开源才能提供的工具、效率、芯片优化和其他集成。此外,出售人工智能模型的访问权并不是 Meta 的商业模式:以开源方式发布 Llama 不会损害收入或投资研究的能力。
这也是一种公平的回报,知道 Meta 有“节省了数十亿» 感谢开放计算项目等项目,并通过发布 PyTorch 和 React 等工具从生态系统创新中受益。 Meta 没有等到 7 月 23 日就开始发号施令:25 个合作伙伴都参与其中,包括 Nvidia、Amazon Web Services、Google Cloud、SNCF Gares & Connexions 等。
SNCF Gares & Connexions 正在试验 Llama 3.1 的新功能,包括法语、英语、德语、西班牙语、意大利语和葡萄牙语的多语种信息和旅客定位。为了加强该系统,还可以通过 WhatsApp 聊天机器人获得快速、个性化的体验,该机器人为旅行者提供实时信息,例如他们前往车站的信息。
如果 Meta 愿意打透明度牌来提升其新法学硕士的能力,那么另一方面,它总是对了解更多有关培训数据的信息守口如瓶,这被认为是行业机密。 Meta 简单地解释说它使用“综合数据» 由模型而不是人类生成。如何避免掠夺审判?没有什么比这更确定的了。
同时,公司还矛Meta AI 助手的多语言版本现已在 22 个新国家/地区推出。该服务已集成到 WhatsApp、Instagram、Messenger 和 Facebook 应用程序中,现在支持法语、德语、西班牙语甚至葡萄牙语。另一方面,它在欧盟仍然不可用,并且不可能很快发生。
来源 : 元