到目前为止,与 ChatGPT 的聊天仅限于文本。 OpenAI 打开其机器人的门窗,使人们可以与人进行面对面的交谈;更好的是,ChatGPT 还知道如何分析图像。
ChatGPT 想要成为的不仅仅是一个对话机器人:一个真正的虚拟助手!OpenAI 已开始对其聊天机器人进行重大更新,首先是为其提供耳朵和声音。其中有几个是相同的,因为该公司与专业配音演员合作了 5 个声音:两个女性,两个男性,一个比较幼稚。
ChatGPT 提供语音
这些合成声音目前全部为英语,由新模型提供支持文本转语音。 Whisper是OpenAI开发的开源文本识别工具,用于将用户的单词转录为文本。
该公司认识到这项技术由 Spotify 运营其新的播客翻译服务— 存在风险,例如篡夺公众人物身份的可能性。这就是 OpenAI 限制该技术用于语音讨论的原因。
另一个重要的新功能是 ChatGPT 分析图像的能力。用户可以向机器人询问有关照片的信息,例如冰箱内部的信息,以便机器人建议食谱。它还可以分析图表、表格或屏幕截图。例如,ChatGPT 可以识别工具箱中的内六角扳手:
该图像识别同时依赖于GPT-3.5和GPT-4,已被发达在 Be My Eyes 的帮助下,这是一款为盲人提供的应用程序,可以让他们从照片中获取信息。这里也已采取安全措施。就图像而言,OpenAI 限制了机器人分析个体的能力。这将为 ChatGPT 在图像方面添加一个新的字符串,因为该机器人也将欢迎 Dall-E 3。
这些功能使 ChatGPT 越来越接近“传统”互联助手,后者也将集成高级语言模型进行改进。这是例如新 Alexa 的案例。
这些新功能将在未来两周内向 ChatGPT+ 和 Enterprise 订阅者提供;语音功能将在iOS和Android上使用,而图像识别则可以在所有平台上使用。
Opera One - AI 驱动的网络浏览器
作者:歌剧
来源 : 开放人工智能