ChatGPT 的高级语音功能在中断几周后即将到来,以加强相关性,并避免与知名语音再次引发争议。到今年秋天,ChatGPT Plus 订阅者都将能够从中受益,但部署已经开始。
在 iOS 和 Android 上,该应用程序聊天GPT已经配备了相当高效的收听和语音合成系统,并且是法语。但GPT-4o,最新最强大的语言模型开放人工智能,进一步改进了该语音功能。对话更加自然、实时;他们可以随时被打断。合成声音还可以检测情绪……并对其做出反应。
将提供 4 种合成声音
春季 GPT-4o 演示期间所做的演示并没有被置若罔闻。电影《Her》中为(假)语音助手配音的女演员斯嘉丽·约翰逊 (Scarlett Johansson) 事实上曾向 OpenAI 发出投诉,威胁称:事实证明,ChatGPT 的声音之一“Sky”与她的声音很像很多。该案以《天空》停播而告终,没有采取任何法律行动。
这个案例或许可以解释为什么 OpenAI 在部署机器人的高级语音功能之前更愿意花些时间。昨天,该服务的付费计划 ChatGPT Plus 的少数用户启动了 alpha 版本的部署。该功能将在未来几周内逐步推出,并将于明年秋季全面向所有订阅者开放。
当前用户仍然可以关注 ChatGPT 应用程序中的通知,或来自 OpenAI 的宣布好消息的电子邮件。
在过去的十个月里,OpenAI 与 29 个不同地区的 100 多名外部测试人员使用 45 种语言测试了 ChatGPT 的语音功能。这些实验使得将由配音演员创建的声音选择减少到四种成为可能。该公司确保机器人无法“模仿其他人的声音,无论是个人还是公众人物”。显然我们已经吸取了教训。
安全性也得到了加强,可以检测和拒绝某些内容;过滤器“识别并阻止所有生成受版权保护的音乐和音频内容的请求”。当然要经过测试。
该公司还解释说,它增强了该模型的能力,以支持“数百万个同时实时语音对话,同时保持低延迟和高质量。» 这也是事实所有这些技术都很昂贵!
去年五月推出的视频功能和屏幕共享功能将在晚些时候推出。进度报告将于八月发布。