谷歌已尽最大努力以最好的方式展示其新人工智能 Gemini。山景公司甚至修改了生成人工智能模型的演示视频之一。谷歌非常热衷于与竞争对手 OpenAI 竞争,其所采取的自由行为被强调:布隆伯格。
本星期,谷歌揭开了双子座的面纱,其人工智能模型的新版本。与最新传言相反,谷歌并未推迟人工智能的推出,尽管它周围的系统似乎已经大大减少了。
借助这一被称为多模式的新迭代,这家山景城巨头正在攻克 GPT-4,即 ChatGPT 付费版本背后的语言模型。谷歌希望双子座专业版,该模型的变体之一,将使 Bard(专为在线研究而设计的聊天机器人)超越 OpenAI 的基本对话机器人。
谷歌解释了 Gemini 演示是如何改变的
谷歌急于以最好的方式展示双子座,因此毫不犹豫地编辑其中一个视频人工智能演示。据我们的同事说布隆伯格事实上,这家美国公司已经承认对 Gemini 入门视频进行了修改。下面显示的序列显示了用户和人工智能之间的多次交互。特别是,用户要求多模态模型从一开始就预测一幅画的外观,或者跟踪硬币从一只手到另一只手的进展。
在 YouTube 上可见的描述中,谷歌表示这个六分钟的演示并没有没有在真实条件下进行。实际上,“为了简洁起见,延迟已减少,双子座的响应也已缩短”,该公司承认。显然,人工智能并没有对其对话者提供的图像立即做出反应和反应,这与视频所示的相反。谷歌没有实时拍摄未经编辑的交流,而是使用了序列的组合。
此外,谷歌并没有真正让个人通过语音与 Gemini 进行互动。据接受采访的发言人称布隆伯格,“序列中的静态图像”并使用了文本查询。然后这些请求被记录并添加到视频中。编辑后,视频给人的印象是用户与人工智能进行口头交流,但事实并非如此。最后,双子座的真实表现,无论是反应速度还是与人对话的能力,似乎都与演示相去甚远。
更糟糕的是,谷歌将查询缩短为 Gemini。为了获得完整且相关的答案,你实际上必须向 AI 提出冗长、详细的问题。在视频中,添加到蒙太奇中的画外音仅限于简短且相当模糊的问题。因此,令人惊讶的是,该模型能够如此轻松地理解对话者的意思。最后,Gemini 需要非常完整的查询才能有效,就像它的竞争对手 GPT-4 一样。
根据布隆伯格,谷歌的自由行为还不止于此。据媒体报道,演示是使用最强大、最复杂的人工智能模型版本 Gemini Ultra 进行的。不过,谷歌很谨慎,没有具体说明视频的来源是哪个版本,而 Ultra 版本尚未提供。该公司刻意利用含糊之处,暗示 Gemini 1.0 版本是该序列壮举的起源。
Une « 概念证明 »
在他的帐户Gemini 背后的 Google 子公司 DeepMind 研究副总裁兼深度学习负责人 Oriol Vinyals(前 Twitter)坚决捍卫该小组团队所做的修改。经理提醒,视频中看到的请求和响应完全真实:
“视频中的所有用户问题和答案都是真实的,为简洁起见进行了缩短。该视频展示了使用 Gemini 构建的多模式用户体验是什么样子。我们创建它是为了激励开发人员 »。
因此,它可能更多的是« 概念证明 »,或法语中的概念验证,即旨在说明技术的可行性和可行性的实际演示,而不是演示。显然,谷歌呈现与 Gemini 互动的方式可能与最终结果有很大不同。
Opera One - AI 驱动的网络浏览器
作者:歌剧
来源 : 布隆伯格