Google響應AI助理審稿人的音頻數據洩漏

2019-07-12

與Google合同下的語言審閱者分析了其Google Assistant軟件收集的語音數據樣本，已洩露了1000多個用戶的聲音錄音，將其生物識別和人工智能培訓實踐重新放在了焦點中，並將公司放在後腳上。

比利時新聞網站VRT本週早些時候發布了一份報告，該報告涉及Google聘請全球範圍內的合同工作者聆聽和註釋Google Home Speaker等設備的錄音。一個這樣的承包商刺激了這個故事，從荷蘭客戶提供洩漏的語音數據，其中包括私人信息，例如家庭住址和有關醫療狀況的討論。

Google回應了博客文章，解釋說，只有大約0.2％的所有音頻片段被其承包商聆聽和轉錄。該公司表示，它採取了許多保護用戶身份的措施，其人類審稿人可以幫助數字助手“了解特定語言的細微差別和口音”。

該公司承認洩漏，並解釋了收集音頻數據及其安全響應的過程，以向公眾保證。

Google搜索產品經理David Monsees在回應中寫道：“我們的安全和隱私響應團隊已在此問題上激活，我們將採取行動。” “我們正在對這個空間中的保障措施進行全面審查，以防止這樣的不當行為再次發生。”

亞馬遜陷入了類似的爭議今年早些時候，該公司僱用工人來聆聽和註釋錄音以進行培訓。公眾和提供數字助理的公司似乎都被可預測的發展措手不及，例如最近BIPA針對亞馬遜的訴訟用於生物識別處理伊利諾伊州的語音樣本。

邊緣指出亞馬遜和Google都允許用戶刪除音頻數據，而Google允許用戶完全關閉音頻存儲，儘管亞馬遜收集的一些數據仍然可供公司使用。

文章主題