在巴黎 VivaTech 展会期间,严乐存负责Meta人工智能的法国研究员公布了一种新的AI模型“JEPA”(“联合嵌入预测架构”)。
该型号适用于“克服当今最先进人工智能系统的主要局限性”,Meta 在新闻稿中解释道。在演示过程中,Yann LeCun 还强调了“JEPA”与其他模型的区别,例如 GPT,它运行基本的聊天GPTd'OpenAI。
“今天的人工智能和机器学习真的很糟糕。人类有常识,但机器没有””Yann LeCun 宣称。
研究人员总是表现出自己非常关键关于市场上的语言模型。一月份的时候,LeCun 就已经预估 ChatGPT离革命还很远。对他来说,“ChatGPT 并不是特别创新”在技术层面上。
一种新型人工智能模型
Meta 决心比竞争对手做得更好,因此提供了一种可以学习一些知识的 AI 模型就像人类的智慧一样。因此,该系统的操作与 Google 的 GPT 或 PaLM2 等模型有很大不同。这些工作依赖于一个巨大的数据库。通过利用这些信息,人工智能模型试图根据用户的问题猜测最符合逻辑的单词顺序。事实上,这些人工智能并不理解它们生成的文本。他们只是模拟思考。图像生成器,例如 DALL-E、Adobe Firefly 或中途,以同样的方式工作。
新的 Meta 模型并非如此。 JEPA 没有聚合大量人工创建的数据,而是比较抽象表征图像或声音。这种方法需要AI来设置“外部世界的内部模型”,这使他能够更轻松地学习。
通过这种方式,该模型模仿了人脑的功能。每天,您的大脑都会无意识地分析大量数据,以了解周围的世界。就像人类的智力一样,该模型可以兼顾抽象概念而不是单词序列。
“我们的工作 [...] 是基于这样一个事实:人类仅通过被动观察就可以了解世界的大量基本知识”,元进步。
通过这种方法,模型真正理解委托给它的数据。人工智能不会被迫根据最可能的单词序列来猜测用户问题的答案。因此,从理论上讲,“JEPA”不应产生“幻觉”,即产生事实上错误的信息。这是生成式人工智能的主要缺陷。他们的说法根本不可靠,因为他们并没有真正理解自己在说什么。这就是为什么生成器很难设计某些元素,比如人的手或耳朵。
«如果你用 1 万亿或 2 万亿个 token 来训练(一个模型),它似乎能够理解。但他犯了愚蠢的错误,无论是事实还是逻辑»,Yann LeCun 强调道。
此外,“JEPA”以其极高的效率在其他主要语言模型中脱颖而出。根据 Meta 的新闻稿,与 GPT 等要求更高的系统不同,人工智能不需要大量资源即可运行。
生成式人工智能的终结?
对于元,«生成方法过于关注细节,而不是捕捉大局概念。”就像他的新系统一样。 Yann LeCun 认为,生成式人工智能注定会消失,因为“我们会有更好的东西来取代他们”:
“宽语言模型今天仍然有用,但五年后我们将不再使用它们”。
从理论上讲,该模型代表了在实现目标的道路上迈出了新的一步。通用人工智能,OpenAI 和其他科技巨头的伟大目标。这种类型的人工智能距离当前技术还很远,但它能够进化并适应委托给它的任务,即使它没有被编程来执行这些任务。
“生成模型已成为过去,我们将放弃它们而采用预测架构”,研究人员宣称,荣获2019年阿兰图灵奖。
一如既往,Meta 已将整个“JEPA”代码提供给研究人员。这开源战略旨在通过鼓励开发人员掌握这项技术来刺激人工智能研究。门洛帕克集团已经通过之前的创新做到了这一点,例如音乐生成器,根据短文本生成音乐的人工智能,或者LLaMA,大型语言模型元人工智能。
来源 : 元