要知道什么
- Gemini Live 是令人印象深刻的数字助理语音模式功能,具有 10 种不同的声音、快速对话响应和聊天记录。
- 不幸的是,它的反应受到底层人工智能模型的阻碍。 Gemini Live 的演讲也可能有点过于正式,而且其回应感觉被截断。
- 依赖 Gemini Live 是愚蠢的。更糟糕的是要为此支付 20 美元。幸运的是,谷歌现在为 Android 用户提供了所有免费服务。
Gemini Live 早先通过 Gemini Advanced 订阅提供,自在 Made by Google 2024 活动上推出以来一直是最受关注的功能,甚至将 Pixel 9 的发布降级为仅仅是脚注。但早期的评论虽然最初给人留下了深刻的印象,但并不对其有利,这就是为什么谷歌不再向你收取费用,并将其作为所有 Android 用户的免费功能。
因此,像大多数技术评论家一样,我决定亲自尝试一下 Gemini Live,看看整个事情是关于什么的。为了简洁起见,我不会告诉你我谈到的一切(谁有时间?)。但你会得到总体的想法。
Gemini Live – 一款受人工智能模型限制的高级数字助理
现在,双子座直播,我也没有拥有一年免费 Gemini Advanced 订阅的 Pixel 9。因此,我获得了免费试用机会,并且可以立即使用 Gemini Live,这真是太棒了。
现在,您不必担心这一点。只需确保您的 Gemini 和 Google 应用程序已更新即可。但即使谷歌免费提供了该功能,它还值得使用吗?让我们来看看吧。
双子座直播有什么好处?
双子座直播来了,您可以轻松地从 Gemini 的设置中进行选择。但请注意,Google 要求您将英语(美国)设置为默认值才能执行此操作,这是一个无意识的要求。我的意思是,那里有一个英国声音(卡佩拉)。
不管怎样,一周中的每一天都有足够的声音,然后还有一些。
和其他人一样,我对 Gemini Live 的第一印象是积极的。考虑到谷歌过去的生硬的合成声音,Gemini Live 是一股新鲜空气。然而,声音有点正式——你不会听到很多“嗯”和“啊”(以及其他感叹词)。由于这个原因,以及其他潜意识的原因,我确实发现这些声音有点冷静和克制,大概是为了让用户最终不会形成情感纽带——这是 OpenAI 所认为的ChatGPT 自带的语音模式可能就是这种情况,还是好很多。
回复很快,所以感觉就像是在和一个随叫随到的朋友交谈。但与故事永远不会结束的朋友不同,你可以随时打断双子座。也许你已经知道了。但它仍然值得一提,因为如果它开始说出你知道不正确的内容(稍后会详细介绍),你可以让它嗡嗡作响。
结束对话后,您会发现文字记录已准备好可供您阅读。对我来说,这是最好的功能之一。查看文本中的对话内容并与他人分享确实很有帮助。
改进空间
Gemini Live 有些事情做得很好。但它也有很多未开发的潜力。
首先,与 Gemini Live 的对话无疑是简短的。当你提出问题时,Gemini Live 会尽可能用简短的语言来回答,就好像它正忙于迎合其他人一样。你不会发现它与你无关或随地吐痰,很多人会说这是一件好事。但是,尽管有奥卡姆剃刀原理,所有的想法都能简单明了地表达出来吗?
例如,我要求它将飞马座(因为我使用了那个声音)与伊卡洛斯(都是希腊神话的一部分)进行比较。虽然有几个比较的节点,但Gemini Live给了我简短、中肯的答案。我带来了哈努曼(来自印度教神话)来给它另一个比较的角度。再说一遍,不超过几句话。事情变得令人沮丧。
在多次尝试让它说更多内容后,我询问是否有一个设置可以让我调整其冗长程度。它告诉我它无法改变这一点,但非常权威地给了我如何自己做的指示,我愚蠢地遵循了这些指示,因为不存在这样的设置。
这让我想到……
哪里受苦了?
双子座的捏造事实和产生幻觉的倾向并没有完全培养用户之间的信任。过去它也因其图像生成错误而受到了很多批评。不幸的是,尽管模式发生了变化,并且底层模型更新为 Gemini 1.5 Flash,但该问题在 Gemini Live 上仍然普遍存在。
尽管在大多数情况下,它的响应都是基于事实信息,但它时不时会凭空生成答案。
毫无疑问,为人工智能提供声音如何激发用户之间的更多信任是有道理的。有了类似人类的声音,你就更容易信任它,并被给出的答案所带来的信心所左右。但如果你不保持警惕,或者对可疑的回复进行事实核查,你可能会发现自己被愚弄了,就像我一样。
该技术的发展速度比任何人预期的都要快,但聊天机器人一如既往地容易产生幻觉。因此,即使在知道人工智能提供不良信息的倾向之后,如果你继续盲目依赖它,也许也不是人造的您需要的情报。
和我一起说吧:骗我一次,你就丢脸了;骗我两次,我真丢脸。
Gemini Live 与 ChatGPT 的高级语音模式相比如何?
现在,让我们考虑一下房间里的大象。 Gemini Live 与 ChatGPT 的高级语音模式相比如何?说实话,Gemini Live 并不像 ChatGPT 的语音模式那样冗长、引人入胜或有趣。虽然后者可能有点也迷人的(甚至是调情的),而且奇怪地像人类,尽管它有各种沉思的声音和举止,但它至少可以作为一种取乐的工具。另一方面,Gemini Live 过于认真地对待自己,这可能不会对它有利,特别是因为它的反应受到人工智能模型的阻碍。
但两者最大的区别或许在于:Gemini Live 将语音解释为文本,然后给出回应,而 ChatGPT 的语音模式则直接处理语音。
判决
Gemini Live 是一个很好的工具,比旧版的 Google Assistant 有了明显的进步。有能力很方便,而且 10 个声音足以满足他们的需要。但依赖它来做任何专业的事情就太疯狂了。就我个人而言,我宁愿把钱捐给一个我一无所知的慈善机构,也不愿单独为 Gemini Live 支付 20 美元。幸运的是,您不再需要付费才能使用 Gemini Live。如果您是 Android 用户,这一切都是免费的。
就目前情况而言,将人工智能视为正在康复的精神分裂症患者是件好事,无论其形式如何。虽有所好转,但仍容易复发。唯一的区别是,你的口袋里没有精神分裂症患者,你也不会花钱去买一个。
您对双子座直播有何看法?你认为谷歌会扼杀这篇热情洋溢的评论吗?请在下面的评论中告诉我们。