如果您在國外度假,而您完全不懂該語言,那麼您應該會對這些資訊感興趣。元Instagram、Facebook 和 WhatsApp 的母公司於 8 月 22 日星期二推出了一款由人工智慧 (AI) 驅動的翻譯器,可讓您口頭或書面翻譯約一百種語言,而無需將單字轉換為文字。根據其部落格文章,Meta 承諾提供語音到語音、語音到文字和文字轉語音的翻譯。該系統甚至可以在翻譯過程中更改語言,從而為每天使用多種語言的個人提供翻譯。
什麼 ”使不同語言的人們更有效地溝通»,Meta 在他的部落格文章中寫道。根據門洛帕克公司的說法,這一切都是為了“第一個一體化多模式和多語言人工智慧翻譯模型”,能夠識別語音並將語音翻譯為近 100 種不同語言的文字。該模型還可以解釋語音和文本口譯近 35 種語言。在 Meta 部落格上發布的一段影片中,Meta Research 的科學總監 Paco Guzmán 用西班牙語說出了這句話:「我們的目標是創造一個更互聯的世界」。然後這句話被電腦語音翻譯成越南文。後者解釋說,與依賴不同模型、在不同級別負責管理語音識別、文本翻譯和從語音生成文本的其他系統不同,“SeamlessM4T 一次完成»。 «它不依賴中間模型來產生結果“,他解釋道。
通用語音翻譯器、大規模多語言語音和 NLLB-200 的邏輯延續
在本頁,你可以直接測試這個新模型。該系統稱為 Seamless M4T,根據知識共享授權發布。該公司還提供對 SeamlessAlign 元數據的訪問,其中包含超過 270,000 小時的音訊和文字。這個系統似乎匯集了 Meta 在該領域的所有最新進展,馬克·扎克伯格團隊的團隊在博客文章中寫道,後者毫不猶豫地將這一步驟描述為“重大進展」。這將是三個元素的邏輯延續:通用語音翻譯器、支援閩南語(一種中國方言)的 Meta 直接語音到語音翻譯系統。接下來是 Massively Multilingual Speech,這是 Meta 的工具,可以偵測和識別 1,100 多種語言。最後是 NLLB-200(No Language Left Behind):這個由人工智慧支援的最新機器翻譯模型解決了到不太常見的語言。它於去年七月推出。
對於 Seamless M4T,Meta 研究人員研究了近 400 萬小時的聲音,訓練這個模型:該數據將來自“爬取網路資料的公共儲存庫」。被我們的同事提問TechCrunch,Meta拒絕提供有關這一點的進一步資訊。新系統能否避免人工智慧輔助翻譯經常受到批評的性別歧視和偏見?例如,翻譯人員經常假設醫生是男性,護士是女性。這就是整個問題。但是,Meta 不建議使用 SeamlessM4T 進行長翻譯或認證翻譯。在醫療或法律目的方面也是如此:在出現錯誤或近似值時可以保護團體免受法律訴訟的建議。