OpenAI 今晚渴望透過揭開其新 GPT-4o 語言模型的面紗來標誌著自己的領地,該模型為 ChatGPT 提供了令人驚嘆的多模式功能 - Siri 和其他助手最好小心。
OpenAI 在 Google I/O 大會宣布的前一天揭開了其新語言模型的面紗,這可能並非純粹的巧合——該搜尋引擎無疑將在那裡展示其新的人工智慧功能。
等待,GPT-4o(o 代表“omni”)表示更接近“更自然的人機交互»。
像人一樣與助理交談
該模型是 ChatGPT 的核心,它接受並產生文字、音訊和圖像的組合。該機器人的語音對對話者的反應時間平均為 320 毫秒,與人類在對話中的反應時間相似。 GPT-4o 在英語以外的語言文字上也表現更好,在物件辨識和理解音訊方面也表現得更好。聲音的改進尤其引人注目,重音和轉調堪比人聲。令人不安…
這些多模態能力是結合文字、視覺和音訊的新模型形成的結果;到目前為止,使用了三種不同的模型,從而增加了反應時間。
GPT-4o 的文字和圖像功能從今天開始在 ChatGPT 中向付費訂閱者和免費訪客推出。那些支付 ChatGPT Plus 費用的人將受益於訊息限制的增加(可以延長 5 倍)。在未來幾週內,GPT-4o 語音支援將在 alpha 版中為付費訂閱者提供。
新的 macOS 介面和軟體
這還不是全部。 OpenAI 也推出了 ChatGPT 網頁版的新介面,其目標是“更友善、更健談»。
Mac 用戶將會進入天堂,因為macOS 應用程式正在開發中!目前,付費用戶通常可以使用它,但由於 GPT-4o(GPT-4 語音模式已經集成,但速度較慢),它將允許以文字方式進行對話,但將來也可以以音訊和視訊方式進行對話。該軟體還將向所有用戶提供,包括免費的。
使用鍵盤快速鍵 Option + Space,可以顯示機器人視窗。您無需打開專用應用程式即可向他提問,甚至可以添加附件來豐富對話。適用於 Windows 的 ChatGPT 軟體版本也正在開發中。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇