Chatgpt睁开眼睛，耳朵和嘴巴

2023-09-26

Chatgpt希望成为一个对话式机器人：真正的虚拟助手！Openai开始为她的聊天机器人部署大型更新，首先是通过给他耳朵和声音。几个同样，由于该公司以5票与专业配音演员合作：两名女性，两个男性，更幼稚。

Chatgpt发出声音

这些合成的声音，目前所有英语的声音都被新模型推动文本到语音。 Whisper是OpenAI开发的开源文本识别工具，用于用户单词的文本转录。

该公司认识到，这项技术是由Spotify运营的他的新播客翻译服务- 目前的风险，例如篡夺公众人物身份的可能性。这就是为什么Openai限制了将该技术用于人声讨论的原因。

另一个最大的新颖性是Chatgpt可以分析图像的可能性。用户可以在照片上询问机器人信息，例如冰箱内部的信息，以便机器人建议食谱。它还可以分析图，表或屏幕快照。例如，Chatgpt可以在工具箱中识别Allen密钥：

基于GPT-3.5和GPT-4的图像的识别已经是发达借助我的眼睛，是针对失明的人的应用程序，使他们可以从照片中获取信息。同样，已经实施了安全措施。就图像而言，OpenAI限制了解雇能力来分析个人。这将在图像方面为Chatgpt Arc添加一条新绳索，因为该机器人还可以容纳Dall-E 3。

lirechatgpt将集成dall-e 3，未来更强大，更精确的图像生成器

这些功能使Chatgpt更加接近和“传统”互联助手，他们还将整合高级语言模型以改进。例如，这是新的Alexa的情况。

这些新功能将在接下来的两周内出现在Chatgpt+和Enterprise订阅者中；语音函数将在iOS和Android上可用，而图像识别可以在所有平台上使用。

🔴不要错过任何01net新闻，请关注我们Google新闻等WhatsApp。

Opera One-促进AI的Web浏览器

作者：歌剧

来源： Openai