七月初,久泰由 Xavier Niel 創立的法國研究實驗室揭開了 Moshi 的面紗。在不到六個月的時間裡,該實驗室成功開發了聲音人工智慧。 Moshi 模仿 Siri、Google Assistant 或 Alexa,可以透過語音與對話者互動。 Kyutai 保證他的助手有能力自然的對話及其用戶。這是非營利實驗室做出的重大承諾,有時被稱為「法國製造的 OpenAI」。
為了找到答案,我們透過 Kyutai 提供的演示網站與 Moshi 進行了詳細交談。消息公佈幾小時後,Moshi 的實驗版本確實已經可以使用了。該網站不需要任何註冊,並允許您透過簡單的介面與人工智慧對話。所有交流僅限五分鐘。只需輸入電子郵件地址即可加入隊列並與 Moshi 交談。
延遲問題
在紙面上,語音助理可以與一位名叫愛麗絲的藝術家的聲音進行交流,承諾即時回覆,接近兩個人之間的正常討論。據Kyutai介紹,延遲不超過160毫秒。這創下了產業紀錄。我們不應該在螢幕前等待人工智慧對我們做出回應。在實踐中,Moshi 總是花費異常長的時間來回覆我們,即使是非常基本的問題或日常詢問,例如“你好”或“你好嗎?” 」。幾乎每次我們都會盯著螢幕等待智慧型手機或電腦上傳來 Moshi 的聲音。
事實上,當我們使用語音版本交談時,我們得到了更快、更完整和相關的答案聊天GPT。 OpenAI的AI一直能夠在較短的時間內為我們提供答案。當我們提出相當複雜的問題時也是如此,這需要一些研究或思考。
如果遇到性能不佳的情況,九泰建議網友測試美國實驗版。這就是我們所做的,有時會有一些改進。有那麼幾秒鐘,我們能夠和助理進行比較順利的對話。
延遲很可能來自人工智慧的實驗方面。事實上,我們正在處理的不是語音助理的最終版本。實驗室使用的伺服器可能只是超載。我們可以打賭,久泰將在不久的將來設法糾正這種情況。我們也希望本地版本能夠解決這個問題。事實上,人工智慧可以使用壓縮方法本地安裝在未連接到互聯網的電腦或智慧型手機上。同時,人工智慧的承諾之一仍未兌現,至少目前是如此。
切斷我們聯繫的人工智慧
在某些交流中,AI甚至有不幸的傾向切斷我們的聯繫。就像久泰的演示一樣,在我們說完話之前,機器人就做出了反應。事實上,我們請求的結尾經常被忽視。在討論過程中,莫希也因為錯過了我們對他說的話而失去了討論的線索。事實上,機器人對另一個考慮因素做出了回應,該考慮因素是從我們句子開頭的一個元素推斷出來的,並且未能按照我們的請求做出反應。在這些情況下,當人工智慧開始獨白時要阻止它是非常複雜的。如果你想糾正這種情況,可以打斷莫西,向他提供進一步的訊息,你必須等到他的回答完成。總之,有點沮喪。
有時候,就好像我們還在說話的時候人工智慧就已經在想要說什麼了。正如 Kyutai 的創始人之一科學家 Alexandre Défossez 所言,人工智慧“一邊想一邊說話”。這最終使 Moshi 最接近人類對話者。
你會說法語嗎 ?
正如 Kyutai 所說,Moshi 目前還不會說英語以外的任何語言。儘管其起源如此,人工智慧卻無法用法語進行溝通。然而,當被問及時,人工智慧自信地回答說它確實能夠說法語。
因此,我們多次要求莫希用法語回答我們。徒然。語音助理堅持向我們保證他會說法語,但他卻用英語告訴我們。我們還沒有設法用莫里哀的語言得出單一的答案。法國開發的語音助理不能用法語交談,這真是太遺憾了。在此,我們再次希望久泰能夠在不久的將來糾正這種情況。
可感知的情緒
理論上,莫希在表達和辨識情感的方式上也很突出。根據 Kyutai 的說法,人工智慧能夠模仿最多70種人類情感。在我們的討論中,我們注意到 Moshi 的語調經常是非常接近人聲與 Alexa、Siri 或 ChatGPT 等其他語音助理相比,它們當前的語音迭代非常機器人。機器人說話的語調因對話而異。如果你向它詢問食譜或餐廳地址,人工智慧會用歡快的聲音說出答案。如果你問她是否喜歡壽司,人工智慧會透過改變速度並強調某些聲音來熱切地做出回應。
另一方面,我們無法發現 Moshi 在這一點上提供的全部可能性。對話總是有結果很短因為延遲。在這種情況下,很難驗證Moshi是否能夠理解我們所表達的情感。然而,當我們告訴它我們累了時,人工智慧以相當富有同情心的語氣回應。從這方面來說,我們對自己說,實驗室的目標最終是可以實現的。
請注意,人工智慧通常已經開始告訴任何事。在某些情況下,語音機器人對基本問題發明了荒謬的答案,甚至可能被誤解。在其他場景中,人工智慧會用意想不到的語句打斷討論,例如「我想要一個甜甜圈」。
產生幻覺是生成式人工智慧的特點,也就是說在某些情況下自信地說出任何事情,但莫希仍然讓我們感到驚訝。有時,機器人會以完全出乎意料的方式引導對話,無緣無故地與我們談論美國軍隊,或向我們索取火腿三明治……在這些令人驚訝的陳述中,我們覺得久泰想要做出最人性化的人工智慧。
第一個不確定的結果
最後與Moshi的溝通讓我們很滿意。在其實驗版本中,開源語音助理遠遠沒有兌現 Kyutai 的雄心勃勃的承諾。理論上,Moshi 提供了比 Siri 或 Google Assistant 等流行智慧助理更好的對話體驗。它也應該優於 ChatGPT 的語音版本。
在實踐中,人工智慧還遠遠無法與市場上現有的解決方案競爭。我們必須等待該專案發展並從實驗室低效的伺服器中解放出來,然後 Moshi 才能證明自己有能力起飛...