你可能知道聊天GPT。 ChatGPT 应用程序是您可以与之交互的用户界面,经常与 GPT 4 和 GPT 3.5 混淆,后者是在后台用于处理用户请求的模型。
对于谷歌的人工智能巴德,我们现在知道了它背后的模型的名字:Gemini。根据谷歌的说法,这是“最雄心勃勃、最高效的人工智能模型”。
双子座,多模式模式
事实上,双子座甚至还不止于此。这是一个多式联运模型。具体来说,这意味着它不是一个只能对用户的书面请求做出反应的人工智能模型,而是一个能够对不同类型的来源做出反应的模型。用谷歌的话来说就是“能够概括、流利地理解、处理和组合不同的信息媒体,包括文本、代码、音频、图像和视频”。
要完全理解,只需观看山景城巨头在 YouTube 上发布的演示即可:
我们看到谷歌的人工智能实时描述眼前绘制的图画,实时发明游戏,立即理解向其提出的谜语并解决它,在两个对象之间建立联系,提出逻辑解释。简而言之,该演示不言而喻,并展示了强大的多功能性。
谷歌在一份新闻稿中详细介绍了实现这一结果的方法。谷歌背后的公司详细介绍了为什么 Gemini 在其眼中比以前的多式联运模型更高效。“迄今为止,创建多模式模型的常用方法是为每种用途训练单独的组件,然后将它们组装起来以某种方式重建集成功能。 »我们解释说,这种方法取得了令人尊敬的结果,但一旦被要求执行更复杂的任务,它就会陷入困境。
“Gemini 被设计为原生多模式l,添加新闻稿。他已经接受过处理各种方式的预先培训。随后,额外的多模式数据才增强了其有效性。这种方法使双子座能够理解和推理所有类型的输入。这就是为什么它的性能远远超过现有模型,并且其功能几乎在所有领域都突破了现有技术的极限。 »
不是一个双子座,不是两个,而是三个双子座
双子座其实一共有三个。 Gemini Pro、Gemini Nano 和 Gemini Ultra。
Gemini Pro 将从今天起集成到 Google bard 中(不幸的是只有英文版)。目标是让谷歌的生成式人工智能“更有能力理解、总结、推理、提出想法、写作或计划»。
Gemini Nano 则将集成到 Pixel 8 Pro 中。目标:装备智能手机“新功能,例如记录器应用程序的“摘要”功能,或 Gboard 中生成的自动响应——首先在 WhatsApp 中出现,从明年开始在其他消息应用程序中出现。 »
最后,Gemini Ultra 在供货之前将首先由客户、开发商、合作伙伴、网络安全专家进行测试。“2024 年初”Bard 的改进版本,逻辑上称为 Bard Advanced。
Opera One - AI 驱动的网络浏览器
作者:歌剧