要知道什麼
- Gemini Live 是令人印象深刻的數位助理語音模式功能,具有 10 種不同的聲音、快速對話回應和聊天記錄。
- 不幸的是,它的反應受到底層人工智慧模型的阻礙。 Gemini Live 的演講也可能有點過於正式,回應感覺被截斷。
- 依賴 Gemini Live 是愚蠢的。更糟糕的是要為此支付 20 美元。
Gemini Live 透過 Gemini Advanced 訂閱提供,自在 Made by Google 2024 活動上推出以來一直是最受關注的功能,甚至將 Pixel 9 的發布降級為僅僅是腳註。但早期的評論雖然最初給人留下了深刻的印象,但並不贊成它。
因此,像大多數技術評論家一樣,我決定親自嘗試 Gemini Live,看看整個事情是關於什麼的。為了簡潔起見,我不會告訴你我談到的一切(誰有時間?)。但你會得到整體的想法。
Gemini Live – 一款受人工智慧模型限制的高級數位助理
現在,雙子座直播,我也沒有擁有一年免費 Gemini Advanced 訂閱的 Pixel 9。因此,我獲得了免費試用機會,並且可以立即使用 Gemini Live,這真是太棒了。
但是 Gemini Live 20 美元的訂閱費用值得嗎?讓我們來看看。
雙子座直播有什麼好處?
雙子座直播來了,您可以輕鬆地從 Gemini 的設定中進行選擇。但請注意,Google 要求您將英語(美國)設定為預設值才能執行此操作,這是一個無意識的要求。我的意思是,那裡有一個英國聲音(卡佩拉)。
不管怎樣,一週中的每一天都有足夠的聲音,然後還有一些。
和其他人一樣,我對 Gemini Live 的第一印像是正面的。考慮到谷歌過去的生硬的合成聲音,Gemini Live 是一股新鮮空氣。然而,聲音有點正式——你不會聽到很多“嗯”和“啊”(以及其他感嘆詞)。由於這個原因,以及其他潛意識的原因,我確實發現這些聲音有點冷靜和克制,大概是為了讓用戶最終不會形成情感紐帶——這是 OpenAI 所認為的ChatGPT 自帶的語音模式可能就是這種情況,還是好很多。
回覆很快,所以感覺就像是在和一個隨叫隨到的朋友交談。但與故事永遠不會結束的朋友不同,你可以隨時打斷雙子座。也許你已經知道了。但它仍然值得一提,因為如果它開始說出你知道不正確的內容(稍後會詳細介紹),你可以讓它嗡嗡作響。
結束對話後,您會發現文字記錄已準備好可供您閱讀。對我來說,這是最好的功能之一。查看文本中的對話內容並與他人分享確實很有幫助。
改進空間
Gemini Live 有些事情做得很好。但它也有很多未開發的潛力。
首先,與 Gemini Live 的對話無疑是簡短的。當你提出問題時,Gemini Live 會盡可能用簡短的語言來回答,就好像它正忙於迎合其他人一樣。你不會發現它與你無關或隨地吐痰,很多人會說這是一件好事。但是,儘管有奧卡姆剃刀原理,所有的想法都能簡單明了地表達出來嗎?
例如,我要求它將飛馬座(因為我使用了那個聲音)與伊卡洛斯(都是希臘神話的一部分)進行比較。雖然有幾個比較的節點,但Gemini Live給了我一個簡短、中肯的答案。我帶來了哈努曼(來自印度神話)來給它另一個比較的角度。再說一遍,不超過幾句話。事情變得令人沮喪。
在多次嘗試讓它說更多內容後,我詢問是否有一個設定可以讓我調整其冗長程度。它告訴我它無法改變這一點,但非常權威地給了我如何自己做的指示,我愚蠢地遵循了這些指示,因為不存在這樣的設定。
這讓我想到…
哪裡受苦了?
雙子座的捏造事實和產生幻覺的傾向並沒有完全培養使用者之間的信任。過去它也因其圖像生成錯誤而受到了很多批評。不幸的是,儘管模式發生了變化,並且底層模型更新為 Gemini 1.5 Flash,但該問題在 Gemini Live 上仍然普遍存在。
儘管在大多數情況下,它的回應都是基於事實訊息,但它時不時會憑空產生答案。
毫無疑問,為人工智慧提供聲音如何激發用戶之間的更多信任是有道理的。有了類似人類的聲音,你就更容易信任它,並被給予的答案所帶來的信心所左右。但如果你不保持警惕,或對可疑的回覆進行事實查,你可能會發現自己被愚弄了,就像我一樣。
這項技術的發展速度比任何人預期的都要快,但聊天機器人一如既往地容易產生幻覺。因此,即使在知道人工智慧提供不良資訊的傾向之後,如果你繼續盲目依賴它,也許也不是人造的您需要的情報。
和我一起說:騙我一次,你就丟臉了;騙我兩次,我真丟臉。
Gemini Live 與 ChatGPT 的高階語音模式相比如何?
現在,讓我們考慮一下房間裡的大象。 Gemini Live 與 ChatGPT 的高階語音模式相比如何?說實話,Gemini Live 並不像 ChatGPT 的語音模式那樣冗長、引人入勝或有趣。雖然後者可能有點也迷人的(甚至是調情的),而且奇怪地像人類,儘管它有各種沉思的聲音和舉止,但它至少可以作為一種取樂的工具。另一方面,Gemini Live 過於認真地對待自己,這可能不會對它有利,特別是因為它的反應受到人工智慧模型的阻礙。
但兩者最大的差異或許在於:Gemini Live 將語音解釋為文本,然後給予回應,而 ChatGPT 的語音模式則直接處理語音。
判決
Gemini Live 是一個很好的工具,比舊版的 Google Assistant 有了明顯的進步。有能力很方便,而且 10 個聲音足以滿足他們的需要。但依賴它來做任何專業的事情就太瘋狂了。就我個人而言,我寧願把錢捐給一個我一無所知的慈善機構,而不是單獨為 Gemini Live 支付 20 美元。幸運的是,Gemini Advanced 訂閱還有其他好處。
就目前情況而言,將人工智慧視為正在康復的精神分裂症患者是件好事,無論其形式為何。雖有所好轉,但仍容易復發。唯一的差別是,你的口袋裡沒有精神分裂症患者,你也不會花錢去買一個。
您對雙子座直播有何看法?你認為Google會扼殺這篇熱情洋溢的評論嗎?請在下面的評論中告訴我們。