與Google合同下的語言審閱者分析了其Google Assistant軟件收集的語音數據樣本,已洩露了1000多個用戶的聲音錄音,將其生物識別和人工智能培訓實踐重新放在了焦點中,並將公司放在後腳上。
比利時新聞網站VRT本週早些時候發布了一份報告,該報告涉及Google聘請全球範圍內的合同工作者聆聽和註釋Google Home Speaker等設備的錄音。一個這樣的承包商刺激了這個故事,從荷蘭客戶提供洩漏的語音數據,其中包括私人信息,例如家庭住址和有關醫療狀況的討論。
Google回應了博客文章,解釋說,只有大約0.2%的所有音頻片段被其承包商聆聽和轉錄。該公司表示,它採取了許多保護用戶身份的措施,其人類審稿人可以幫助數字助手“了解特定語言的細微差別和口音”。
該公司承認洩漏,並解釋了收集音頻數據及其安全響應的過程,以向公眾保證。
Google搜索產品經理David Monsees在回應中寫道:“我們的安全和隱私響應團隊已在此問題上激活,我們將採取行動。” “我們正在對這個空間中的保障措施進行全面審查,以防止這樣的不當行為再次發生。”
亞馬遜陷入了類似的爭議今年早些時候,該公司僱用工人來聆聽和註釋錄音以進行培訓。公眾和提供數字助理的公司似乎都被可預測的發展措手不及,例如最近BIPA針對亞馬遜的訴訟用於生物識別處理伊利諾伊州的語音樣本。
邊緣指出亞馬遜和Google都允許用戶刪除音頻數據,而Google允許用戶完全關閉音頻存儲,儘管亞馬遜收集的一些數據仍然可供公司使用。