如果您在国外度假,而您完全不懂该语言,那么您应该会对这些信息感兴趣。元Instagram、Facebook 和 WhatsApp 的母公司于 8 月 22 日星期二推出了一款由人工智能 (AI) 驱动的翻译器,可让您口头或书面翻译约一百种语言,而无需将单词转换为文本。根据其博客文章,Meta 承诺提供语音到语音、语音到文本和文本到语音的翻译。该系统甚至可以在翻译过程中更改语言,从而为每天使用多种语言的个人提供翻译。
什么 ”使不同语言的人们能够更有效地沟通»,Meta 在他的博客文章中写道。根据门洛帕克公司的说法,这一切都是为了“第一个一体化多模式和多语言人工智能翻译模型”,能够识别语音并将语音翻译为近 100 种不同语言的文本。该模型还可以解释语音和文本口译近 35 种语言。在 Meta 博客上发布的一段视频中,Meta Research 的科学总监 Paco Guzmán 用西班牙语说出了这句话:“我们的目标是创造一个更加互联的世界”。然后这句话被电脑语音翻译成越南语。后者解释说,与依赖不同模型、在不同级别负责管理语音识别、文本翻译和从语音生成文本的其他系统不同,“SeamlessM4T 一次性完成»。 «它不依赖中间模型来产生结果“,他解释道。
通用语音翻译器、大规模多语言语音和 NLLB-200 的逻辑延续
在本页,你可以直接测试这个新模型。该系统称为 Seamless M4T,根据知识共享许可发布。该公司还提供对 SeamlessAlign 元数据的访问,其中包含超过 270,000 小时的音频和文本。这个系统似乎汇集了 Meta 在该领域的所有最新进展,马克·扎克伯格团队的团队在博客文章中写道,后者毫不犹豫地将这一步骤描述为“重大进展”。这将是三个元素的逻辑延续:通用语音翻译器、支持闽南语(一种中国方言)的 Meta 直接语音到语音翻译系统。接下来是 Massively Multilingual Speech,这是 Meta 的工具,可以检测和识别 1,100 多种语言。最后是 NLLB-200(No Language Left Behind):这个由人工智能支持的最新机器翻译模型解决了到不太常见的语言。它于去年七月推出。
对于 Seamless M4T,Meta 研究人员研究了近 400 万小时的声音,训练这个模型:该数据将来自“爬取网络数据的公共存储库”。被我们的同事提问TechCrunch,Meta拒绝提供有关这一点的进一步信息。新系统能否避免人工智能辅助翻译经常受到批评的性别歧视和偏见?例如,翻译人员经常假设医生是男性,护士是女性。这就是整个问题。尽管如此,Meta 建议不要使用 SeamlessM4T 进行长翻译或认证翻译。在医疗或法律目的方面也是如此:在出现错误或近似值时可以保护团体免受法律诉讼的建议。