OpenAI終於推出ChatGPT高階語音模式。這種新模式應該可以讓使用者與人工智慧進行更自然、更流暢的對話。為了彌補延遲,OpenAI對此功能進行了一些改進,包括五個新的語音、記憶體和自訂指令。
去年 5 月,OpenAI 揭開了聊天GPT 4o,其產生人工智慧的新版本。在此過程中,這家新創公司宣布了增強語音模式與人工智慧進行交流。這種模式應該允許使用者以更自然、流暢和動態的方式與生成式人工智慧進行互動。像我們一樣OpenAI 在巴黎展示了它,這種模式使 ChatGPT 成為真正的智慧語音助手,與 Siri、Alexa 或 Google Assistant 相差數光年。
“高級語音使用 GPT-4o 的本機音頻功能,提供更自然、實時的對話,能夠捕捉非語言線索,例如說話的速度,並能做出情感反應。””,OpenAI 解釋道。
這家美國公司希望在宣布後不久(即 2024 年 6 月左右)提供語音模式。OpenAI 有點落後於計劃。夏初,薩姆·奧爾特曼的公司表示還需要一個月的時間來完善“模型檢測和拒絕某些內容的能力”, 提升“使用者體驗”並確保 ChatGPT 立即回應所有對話者。 OpenAI 最終花了三個月的時間來準備部署改進後的語音模式。
另請閱讀:OpenAI 威脅要禁止對 o1 太感興趣的使用者使用 ChatGPT
ChatGPT 進階語音模式即將推出
人工智慧第一人終於宣布了ChatGPT「高級語音」的到來。如預期的那樣,該模式是為 ChatGPT Plus 和 Team 優惠的訂閱者保留的。要與人工智慧對話,你必須選擇付費訂閱。根據記錄,ChatGPT Plus 的費用為每月 24.50 美元。企業和教育客戶將於下週開始使用語音模式。
進階語音將在本週內向 ChatGPT 應用程式中的所有 Plus 和 Team 用戶推出。
在您耐心等待的同時,我們添加了自訂指令、記憶、五種新聲音和改進的口音。
它還可以用 50 多種語言說「對不起,我遲到了」。pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI)2024 年 9 月 24 日
紙牌和歐洲…
如果您是付費訂戶,“您將在應用程式中看到一條通知”當增強語音模式可用時。該模式「尚未在歐盟、英國、瑞士、冰島、挪威和列支敦士登推出」。歐洲用戶必須要有耐心。但是,在 iOS 應用程式上,會出現警告訊息,指示進階語音模式“正在路上”並且部署已經開始順利。
為了盡快利用它,我們邀請您更新您的 Android 或 iOS 應用程式。 OpenAI 在其網站上解釋說該功能是“可在 1.2024.261 或更高版本的 iOS/Android 行動應用程式中使用。”
語音模式有什麼新變化
OpenAI 幽默地對夏季累積的延誤表示歉意。正如 X 上的帖子所解釋的,ChatGPT 可以用 50 多種語言說「對不起,我遲到了」。該公司還透露,它已經開發出五個新聲音豐富ChatGPT的語音模式。這些植物被命名為喬木(Arbor)、楓樹(Maple)、索爾(Sol)、雲杉(Spruce)和山谷(Vale)。
它們是基本語音模式中已有語音(即 Breeze、Juniper、Cove 和 Ember)的補充。所有這些聲音都以不同的音色和演講方式來區分。我們顯然會注意到天空的缺席,她的聲音自由地受到女演員史嘉蕾喬韓森的啟發。被指控盜用明星聲音,出於對「天空之聲」的尊重,OpenAI 寧願暫停它。
另請注意,缺少允許 ChatGPT 在對話期間查看和收聽其環境的模式。在巴黎,OpenAI 表明,可以在語音模式下對對話中提供的圖像質疑人工智慧。沒有明顯的原因,也沒有解釋,OpenAI 沒有包含此功能,該功能依賴於多式聯運能力GPT 4o。我們認為這將是以後更新的主題。
此外,自去年五月巴黎發表會以來,這家新創公司也修改了語音模式介面。正如我們在 OpenAI 在 X 上發布的影片中看到的,介面使用藍色球體來表明 ChatGPT 正在聽或說。此前,語音聊天是透過移動的小黑點來表示的。
OpenAI 也指出,它已確保個人化說明是 ChatGPT 的旗艦功能之一,適用於語音模式。這些說明允許用戶自訂聊天機器人如何回答他們的問題。它是一個非常有效的工具,可以節省時間並校準人工智慧產生的回應。 OpenAI也加入了ChatGPT語音模式有記憶,這使他能夠記住先前在對話中給出的資訊。最後,該公司擁有“還提高了一些外語的對話速度、流暢度和口音。”