七月初,久泰由 Xavier Niel 创立的法国研究实验室揭开了 Moshi 的面纱。在不到六个月的时间里,该实验室成功开发出了声音人工智能。 Moshi 模仿 Siri、Google Assistant 或 Alexa,可以通过语音与对话者互动。 Kyutai 保证他的助手有能力自然的对话及其用户。这是非营利实验室做出的重大承诺,有时被称为“法国制造的 OpenAI”。
为了找到答案,我们通过 Kyutai 提供的演示网站与 Moshi 进行了详细交谈。消息公布几小时后,Moshi 的实验版本确实已经可以使用了。该网站不需要任何注册,并允许您通过简单的界面与人工智能对话。所有交流仅限五分钟。只需输入电子邮件地址即可加入队列并与 Moshi 交谈。
延迟问题
在纸面上,语音助手可以与一位名叫爱丽丝的艺术家的声音进行交流,承诺即时回复,接近两个人之间的正常讨论。据Kyutai介绍,延迟不超过160毫秒。这创下了行业纪录。我们不应该在屏幕前等待人工智能对我们做出回应。在实践中,Moshi 总是花费异常长的时间来回复我们,即使是非常基本的问题或日常询问,例如“你好”或“你好吗?” ”。几乎每次我们都会盯着屏幕等待智能手机或电脑上传来 Moshi 的声音。
事实上,当我们使用语音版本交谈时,我们得到了更快、更完整和相关的答案聊天GPT。 OpenAI的AI一直能够在较短的时间内为我们提供答案。当我们提出相当复杂的问题时也是如此,这需要一些研究或思考。
如果遇到性能不佳的情况,九泰建议网友测试一下美国实验版。这就是我们所做的,有时会有一些改进。有那么几秒钟,我们能够和助理进行比较顺利的交谈。
延迟很可能来自人工智能的实验方面。事实上,我们正在处理的不是语音助手的最终版本。实验室使用的服务器可能只是超载。我们可以打赌,久泰将在不久的将来设法纠正这种情况。我们也希望本地版本能够解决这个问题。事实上,人工智能可以使用压缩方法本地安装在未连接到互联网的计算机或智能手机上。与此同时,人工智能的承诺之一仍未兑现,至少目前如此。
切断我们联系的人工智能
在某些交流中,AI甚至有不幸的倾向切断我们的联系。就像久泰的演示一样,在我们说完话之前,机器人就做出了反应。事实上,我们请求的结尾经常被忽视。在讨论过程中,莫希也因为错过了我们对他说的话而失去了讨论的线索。事实上,机器人对另一个考虑因素做出了响应,该考虑因素是从我们句子开头的一个元素推断出来的,并且未能按照我们的请求做出反应。在这些情况下,当人工智能开始独白时要阻止它是非常复杂的。如果你想纠正这种情况,可以打断莫西,向他提供进一步的信息,你必须等到他的回答完成。总之,有点沮丧。
有时候,就好像我们还在说话的时候人工智能就已经在考虑要说什么了。正如 Kyutai 的创始人之一科学家 Alexandre Défossez 所言,人工智能“一边想一边说话”。这最终使 Moshi 最接近人类对话者。
你会说法语吗 ?
正如 Kyutai 所说,Moshi 目前还不会说英语以外的任何语言。尽管其起源如此,人工智能却无法用法语进行交流。然而,当被问及时,人工智能自信地回答说它确实能够说法语。
因此,我们多次要求莫希用法语回答我们。徒然。语音助手坚持向我们保证他会说法语,但他却用英语告诉我们。我们还没有设法用莫里哀的语言得出单一的答案。法国开发的语音助手不能用法语交谈,这真是太遗憾了。在此,我们再次希望久泰能够在不久的将来纠正这种情况。
可感知的情绪
理论上,莫希在表达和识别情感的方式上也很突出。根据 Kyutai 的说法,人工智能能够模仿最多70种人类情感。在我们的讨论中,我们注意到 Moshi 的语调经常是非常接近人声与 Alexa、Siri 或 ChatGPT 等其他语音助手相比,它们当前的语音迭代非常机器人化。机器人说话的语气因对话而异。如果你向它询问菜谱或餐馆地址,人工智能会用欢快的声音说出答案。如果你问她是否喜欢寿司,人工智能会通过改变速度并强调某些声音来热切地做出回应。
另一方面,我们无法发现 Moshi 在这一点上提供的全部可能性。对话总是有结果很短因为延迟。在这种情况下,很难验证Moshi是否能够理解我们所表达的情感。然而,当我们告诉它我们累了时,人工智能以相当富有同情心的语气回应。从这方面来说,我们对自己说,实验室的目标最终是可以实现的。
请注意,人工智能通常已经开始告诉任何事。在某些情况下,语音机器人对基本问题发明了荒谬的答案,甚至可能被误解。在其他场景中,人工智能会用意想不到的语句打断讨论,例如“我想要一个甜甜圈”。
产生幻觉是生成式人工智能的特点,也就是说在某些情况下自信地说出任何事情,但莫希仍然让我们感到惊讶。有时,机器人会以完全出乎意料的方式引导对话,无缘无故地与我们谈论美国军队,或者向我们索要火腿三明治……在这些令人惊讶的陈述中,我们觉得久泰想要做出最人性化的人工智能。
第一个不确定的结果
最后与Moshi的沟通让我们很满意。在其实验版本中,开源语音助手远没有兑现 Kyutai 的雄心勃勃的承诺。理论上,Moshi 提供了比 Siri 或 Google Assistant 等流行智能助手更好的对话体验。它还应该优于 ChatGPT 的语音版本。
在实践中,人工智能还远远无法与市场上已有的解决方案竞争。我们必须等待该项目发展并从实验室低效的服务器中解放出来,然后 Moshi 才能证明自己有能力起飞......