元宣布他們最新創作的開源是一種單一的人工智能(AI)動力工具,可以翻譯200多種語言。這使Meta更深入地進入了其在現代中使用世界上一些突破性技術來互連世界的使命。
META宣布了一種新的AI模型,可以翻譯200種語言
今年年初,元宣布通用語音翻譯的AI研究項目。幾種機器翻譯工具已經支持了幾種英語,西班牙語,普通話,意大利語和德語等語言。但是,元既雄心勃勃又致力於為較不常用的語言,甚至沒有標準寫作系統的人提供更公平的體驗。迄今為止,AI模型可與200種不同的語言一起使用,並有可能進一步增長,因為Meta正在開源。
在他們的博客文章,Meta確定了機器翻譯研究的三個主要挑戰:數據稀缺,建模挑戰以及結果的評估和改進。該公司認為,通過他們的兩個項目,沒有任何語言和通用語音翻譯。這些項目使互聯網為全世界的母語人士提供了更具包容性的空間。總的來說,這樣的舉措有望幫助用數百種語言進行實時和可靠的翻譯,從阿斯圖里亞人到盧甘達再到烏爾都語。
據META的研究科學家安吉拉·範(Angela Fan)表示,該項目的目的是追求包容性的翻譯技術。目前,他們正在測試AI,以幫助Wikipedia的編輯將其文章轉化為其他語言。很快,該模型將被部署在元的生態系統上。
測試仍在進行中,但是可以預期在元中進行部署
MT專家聲稱,預計AI模型的翻譯不是完美的。使其超過其他翻譯工具的削減的原因是它對其他工具通常不關心的語言的興趣。這就是他們如何應對數據稀缺性挑戰的方式。涉及大約100種新語言,包括低資源或少於100萬個可用翻譯的語言。
為了改善和評估翻譯結果,對AI模型中包含的每種語言的句子對測試了Meta。句子是由專業翻譯的母語人士從英語翻譯成各自的語言。比較了機器翻譯和人造句子,並分配了數值分數以測量重疊。目標是使模型學習並最終產生人類質量的翻譯。
為了確保負責任和對文化敏感的翻譯,Meta聲稱與20多種語言的演講者進行案例研究。該公司不僅在研究語言到語言翻譯的技術性,而且還在研究翻譯母語的重要性。在簡單的音譯中不容易考慮文化上的細微差別,偏見和潛在的有害語言,如果沒有這些考慮,就不可能成功傳遞信息。梅塔(Meta)非常了解這一點,他說他們在通用翻譯中的長期目標不僅需要關於AI的簡單專業知識,而且還需要來自世界各地的眾多專家,研究人員和個人的合作。
當然,很多好處都可以追溯到公司本身。成功的通用多語言翻譯工具為Meta的未來創新提供服務,從更具包容性的VR體驗到廣泛的AR功能,再到越來越多地了解其在Facebook,Instagram和WhatsApp的用戶越來越多。