在Google I/O 2019 的開幕主題演講中,這家美國巨頭比往年更頻繁地發表演講,表示其人工智慧研究是為用戶服務的,同時由於所開展的運營,越來越多地尊重用戶的隱私在智慧型手機上。
除了演示之外,Google在演示中還給出了人工智慧「為善」的各種用途(測量水位、在醫學圖像上儘早檢測癌症等),還有另外三個例子日常的有形功能引起了人們的關注。
即時字幕,像書寫一樣理解每個單字
第一個版本足夠先進,可以整合到下一版本的 Android Q 中,將於明年夏末發布。它既適用於世界上 4.66 億聽力障礙者,也適用於有時需要字幕以確保他們理解所說內容的人…
只需輕按智慧型手機螢幕即可啟動即時字幕。從那時起,它將為設備上播放聲音的所有媒體添加字幕。這可以是視訊、音訊訊息、播客,甚至是您自己製作的錄音。由於該功能內建於 Android 中,因此可在所有應用程式中使用。
最重要的是,該功能在本地運行,不需要訪問互聯網即可工作。因此,不會有資料傳輸到 Google 伺服器。您的私生活先驗是安全無害的。
https://www.youtube.com/watch?v=YL-8Xfx6S5o
Live Relay,為靜音者和聽力障礙者提供電話溝通便利
去年,Google的 Duplex 技術給人留下了深刻的印象,這項技術將機器學習和真實的語音合成相結合,可以自動預約或在餐廳預訂餐桌。
今年,工程師們推出了Live Relay,這是一種能夠在接到電話時接聽的電話助理,告訴對話者他是一名助理,他會在閱讀呼叫者所說的內容時以書面形式抄錄所有內容。
為了使呼叫者不必等待太久,輸入完成功能使他們能夠透過相關且經過調整的建議鍵入文字來更快地做出回應。在這種情況下,Google正在利用其已經推出的技術,這些技術似乎運行得越來越好,證明其演算法正在改進。
從技術上講,文字轉語音和語音到文字轉錄的反應能力和準確性似乎令人難以置信。但最令人著迷的是,這個功能將為大多數溝通困難的人提供一個工具,使他們的日常生活更加輕鬆,並減少他們可能的孤立。
Project Euphonia,讓 Google Assistant 能夠理解我們所有人
Google Assistant 是迄今為止西方市場上最先進的基於語音的智慧助理。他通常非常清楚對他說的話。當您使用的語言有很重的口音時,事情有時會變得有點複雜。當使用者患有嚴重的言語問題時,例如中風後或患有退化性疾病時,這些問題就會變得更加複雜。
為了吸引這些人並為他們提供功能助理,Google推出了 Euphonia 專案。基本上,它包括要求有口語問題的人發音標準句子,例如你今天怎麼樣?或者打電話給媽媽。然後,這些樣本將用於訓練Google的演算法,以便其助手能夠理解這些以不同方式發音的公式。
但《Euphonia》並不僅僅停留在歌詞上。谷歌研究人員一直致力於確保他們的人工智慧能夠識別某些聲音或動作,以便產生相應的動作。該功能可讓嚴重殘疾或無法說話的人更輕鬆地進行交流,無論是使用特殊設備、透過 Google Home 還是只是發送簡訊。
Opera One - AI 驅動的網頁瀏覽器
作者:歌劇