你以為英語統治了世界嗎?沒有把握。“互聯網上超過一半的內容是英語,但世界上只有 20% 的人口說這種語言””,Google翻譯產品經理 Barak Turovsky 強調。
因此,谷歌繼續有興趣豐富其自動翻譯應用程式。它的功能之一是讓您可以使用智慧型手機的鏡頭即時直觀地翻譯文字。到目前為止,此功能僅支援七種語言。
現在增加了27 種新語言:保加利亞語、加泰隆尼亞語、克羅埃西亞語、捷克語、丹麥語、荷蘭語、菲律賓語、芬蘭語、匈牙利語、印尼語、立陶宛語、挪威語、波蘭語、羅馬尼亞語、斯洛伐克語、瑞典語、土耳其語和烏克蘭語。為此,Google 員工製作了一段關於 bamba 曲調的精彩視頻
支援 32 種語言的語音翻譯模式也已更新,可在 Android 和 iOS 上運行得更快。谷歌如何取得這一結果在該公司搜尋部落格上的另一篇文章中有詳細介紹。這就是它的運作方式。
第一步是找到提交給軟體的圖像中的字母。這需要消除所有無用的視覺元素。機器聚焦於相同顏色的像素區塊,並偵測是否有連續的線條,這表示存在要讀取的文字。
其次,谷歌翻譯必須識別每個字母。這就是深度學習的用武之地,就像谷歌幾年前用它來區分貓和狗或不同物種的動物一樣。因此,它是自主學習過程的結果。問題在於,在街上或餐廳菜單上找到的字母不一定與在電腦上鍵入的文字中的字母一樣清晰。因此,有必要在提交給機器的字母上模擬一點污垢,如下所示。
第三步,Google翻譯使用字典翻譯字母。最後,第四步,翻譯以與覆蓋圖像的原始字體相同的字體樣式顯示。
再說一下離線模式,它本身就是一種表現。為了創建一個無需連接即可工作的相關且快速的識別模型,Google團隊首先開發了一個小型(不是很強大的)神經網路。一個更慢、更有限的「網路」也負責辨識資訊量少得多的字元。當時的目標是找到可能的最有效的數據集,既輕量又導致錯誤數量非常少。
經過一系列的測試和調整,Google工程師設法確保這些工具能夠正常工作,演算法盡可能高效地能夠與智慧型手機處理器一起運作...
結果就在那裡。我們已經證實,翻譯速度相當驚人!然而,翻譯的準確性有時仍不盡人意。
另請閱讀:
由深度學習驅動的晶片可以讓我們的智慧型手機變得更智能– 18/05/2015
來源:
谷歌的博客
Google 視覺搜尋博客
🔴為了不錯過01net的任何新聞,請關注我們谷歌新聞等WhatsApp。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇