OpenAI终于推出ChatGPT高级语音模式。这种新模式应该可以让用户与人工智能进行更自然、更流畅的对话。为了弥补延迟,OpenAI对该功能进行了一些改进,包括五个新的语音、内存和自定义指令。
去年 5 月,OpenAI 揭开了聊天GPT 4o,其生成人工智能的新版本。在此过程中,这家初创公司宣布了增强语音模式与人工智能进行交流。这种模式应该允许用户以更自然、流畅和动态的方式与生成式人工智能进行交互。像我们一样OpenAI 在巴黎展示了它,这种模式使 ChatGPT 成为真正的智能语音助手,与 Siri、Alexa 或 Google Assistant 相差数光年。
“高级语音使用 GPT-4o 的本机音频功能,提供更自然、实时的对话,可以捕捉非语言线索,例如说话的速度,并可以做出情感反应。””,OpenAI 解释道。
这家美国公司希望在宣布后不久(即 2024 年 6 月左右)提供语音模式。不幸的是,OpenAI 有点落后于计划。夏初,萨姆·奥尔特曼的公司表示还需要一个月的时间来完善“模型检测和拒绝某些内容的能力”, 提升“用户体验”并确保 ChatGPT 立即响应所有对话者。 OpenAI 最终花了三个月的时间来准备部署改进后的语音模式。
另请阅读:OpenAI 威胁要禁止对 o1 太感兴趣的用户使用 ChatGPT
ChatGPT 高级语音模式即将推出
人工智能第一人终于宣布了ChatGPT“高级语音”的到来。正如预期的那样,该模式是为 ChatGPT Plus 和 Team 优惠的订阅者保留的。要与人工智能对话,你必须选择付费订阅。根据记录,ChatGPT Plus 的费用为每月 24.50 美元。企业和教育客户将于下周开始使用语音模式。
高级语音将在本周内向 ChatGPT 应用程序中的所有 Plus 和 Team 用户推出。
在您耐心等待的同时,我们添加了自定义指令、记忆、五种新声音和改进的口音。
它还可以用 50 多种语言说“对不起,我迟到了”。pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI)2024 年 9 月 24 日
纸牌和欧洲……
如果您是付费订户,“您将在应用程序中看到一条通知”增强语音模式何时可用。该模式“尚未在欧盟、英国、瑞士、冰岛、挪威和列支敦士登推出”。欧洲用户必须要有耐心。但是,在 iOS 应用程序上,会出现一条警告消息,指示高级语音模式“正在路上”并且部署已经开始顺利。
为了尽快利用它,我们邀请您更新您的 Android 或 iOS 应用程序。 OpenAI 在其网站上解释说该功能是“可在 1.2024.261 或更高版本的 iOS/Android 移动应用程序中使用。”
语音模式有什么新变化
OpenAI 幽默地对夏季累积的延误表示歉意。正如 X 上的帖子所解释的,ChatGPT 可以用 50 多种语言说“对不起,我迟到了”。该公司还透露,它已经开发出五个新声音丰富ChatGPT的语音模式。这些植物被命名为乔木(Arbor)、枫树(Maple)、索尔(Sol)、云杉(Spruce)和谷(Vale)。
它们是对基本语音模式中已有的语音(即 Breeze、Juniper、Cove 和 Ember)的补充。所有这些声音都以不同的音色和演讲方式来区分。我们显然会注意到天空的缺席,她的声音自由地受到女演员斯嘉丽·约翰逊的启发。被指控盗用明星声音,出于对“天空之声”的尊重,OpenAI 宁愿暂停它。
另请注意,缺少允许 ChatGPT 在对话期间查看和收听其环境的模式。在巴黎,OpenAI 表明,可以在语音模式下对对话中提供的图像质疑人工智能。没有明显的原因,也没有解释,OpenAI 没有包含此功能,该功能依赖于多式联运能力GPT 4o。我们认为这将是以后更新的主题。
此外,自去年五月巴黎发布会以来,这家初创公司还修改了语音模式界面。正如我们在 OpenAI 在 X 上发布的视频中看到的,界面使用蓝色球体来表明 ChatGPT 正在听或说。此前,语音聊天是通过移动的小黑点来表示的。
OpenAI 还指出,它已确保个性化说明是 ChatGPT 的旗舰功能之一,适用于语音模式。这些说明允许用户自定义聊天机器人如何回答他们的问题。它是一个非常有效的工具,可以节省时间并校准人工智能生成的响应。 OpenAI还添加了ChatGPT语音模式有记忆,这使他能够记住之前在对话中给出的信息。最后,该公司拥有“还提高了一些外语的对话速度、流畅度和口音。”