世界圖譜

登入

訂閱

世界圖譜

ChatGPT的新声音开始被听到

2024-07-31
Misha

ChatGPT 的高级语音功能在中断几周后即将到来，以加强相关性，并避免与知名语音再次引发争议。到今年秋天，ChatGPT Plus 订阅者都将能够从中受益，但部署已经开始。

在 iOS 和 Android 上，该应用程序聊天GPT已经配备了相当高效的收听和语音合成系统，并且是法语。但GPT-4o，最新最强大的语言模型开放人工智能，进一步改进了该语音功能。对话更加自然、实时；他们可以随时被打断。合成声音还可以检测情绪……并对其做出反应。

将提供 4 种合成声音

春季 GPT-4o 演示期间所做的演示并没有被置若罔闻。电影《Her》中为（假）语音助手配音的女演员斯嘉丽·约翰逊 (Scarlett Johansson) 事实上曾向 OpenAI 发出投诉，威胁称：事实证明，ChatGPT 的声音之一“Sky”与她的声音很像很多。该案以《天空》停播而告终，没有采取任何法律行动。

里拉OpenAI 因与斯嘉丽·约翰逊发生冲突而暂停了 ChatGPT 的一名发言权

这个案例或许可以解释为什么 OpenAI 在部署机器人的高级语音功能之前更愿意花些时间。昨天，该服务的付费计划 ChatGPT Plus 的少数用户启动了 alpha 版本的部署。该功能将在未来几周内逐步推出，并将于明年秋季全面向所有订阅者开放。

当前用户仍然可以关注 ChatGPT 应用程序中的通知，或来自 OpenAI 的宣布好消息的电子邮件。

在过去的十个月里，OpenAI 与 29 个不同地区的 100 多名外部测试人员使用 45 种语言测试了 ChatGPT 的语音功能。这些实验使得将由配音演员创建的声音选择减少到四种成为可能。该公司确保机器人无法“模仿其他人的声音，无论是个人还是公众人物”。显然我们已经吸取了教训。

安全性也得到了加强，可以检测和拒绝某些内容；过滤器“识别并阻止所有生成受版权保护的音乐和音频内容的请求”。当然要经过测试。

该公司还解释说，它增强了该模型的能力，以支持“数百万个同时实时语音对话，同时保持低延迟和高质量。» 这也是事实所有这些技术都很昂贵！

去年五月推出的视频功能和屏幕共享功能将在晚些时候推出。进度报告将于八月发布。

🔴为了不错过任何01net新闻，请关注我们谷歌新闻等WhatsApp。