為了優化 Alexa 的耳朵,數千名員工可以存取她與使用者的聲音互動。據該網站稱蒲隆地,傑夫貝佐斯的公司儲存向以下人員發出的語音請求迴聲揚聲器放在一個巨大的資料庫中,然後由人類進行分析。目標是透過讓亞馬遜語音助理適應「自然語言」來提高其性能。
在這項調查中,參與該計畫的七名亞馬遜員工作證。聽力是外包的。保護工作由哥斯達黎加、美國、印度和羅馬尼亞等不同國家的服務提供者進行監測。每個影子聽眾每天聽一千個聲音片段,平均聽九小時。他們轉錄、註釋、隔離複雜的術語,並透過內部訊息系統與同事交換結果。據報道,有些是嘲笑的對象蒲隆地。
非匿名收聽
這些員工的使命是彌補機器的缺陷。例如,調查中的兩名目擊者講述了他們如何讓 Alexa 更好地理解美國藝術家 Taylor Swift 的名字,泰勒絲是眾多詢問的對象。
但是,他們也可能面臨更微妙,甚至非常尷尬的情況。其中兩人提到了類似性侵場景的可疑錄音。模糊。然後他們試圖警告上級,上級認為這不是公司的責任。
更具啟發性的是:調查顯示,亞馬遜允許其員工聽眾存取用戶的敏感訊息,例如他們的身份、帳號或購買的揚聲器的序號。嚴重違反個人資料保護。而其競爭對手 Google Assistant 或 Siri,即使語音助理也是由人類智慧推動的,資料的匿名化似乎也是有保證的。
“樣本非常小”
當被要求回應這些指控時,這家美國零售巨頭試圖為自己辯護:
«我們認真對待客戶個人資訊的安全和隱私» 亞馬遜發言人保證。 “我們僅對 Alexa 錄音的一小部分樣本進行註釋,以改善您的客戶體驗。這些資訊有助於我們訓練我們的語音辨識和語言理解系統,使 Alexa 能夠更好地理解您的請求。» 公司解釋。
問題是,在 Alexa 的規模上,即使是很小的樣本也代表天文數字般的記錄時間,因此可能有相當多的用戶收聽。特別是自 2014 年創建以來,Alexa 一直主導著語音助理市場。