为了优化 Alexa 的耳朵,数千名员工可以访问她与用户的声音交互。据该网站称布隆伯格,杰夫·贝佐斯的公司存储向以下人员发出的语音请求回声扬声器放在一个巨大的数据库中,然后由人类进行分析。目标是通过让亚马逊语音助手适应“自然语言”来提高其性能。
在这项调查中,参与该计划的七名亚马逊员工作证。听力是外包的。保护工作由哥斯达黎加、美国、印度和罗马尼亚等不同国家的服务提供商进行监测。每个影子听众每天听一千个声音片段,平均听九小时。他们转录、注释、隔离复杂的术语,并通过内部消息系统与同事交换结果。据报道,有些是嘲笑的对象布隆伯格。
非匿名收听
这些员工的使命是弥补机器的缺陷。例如,调查中的两名目击者讲述了他们如何让 Alexa 更好地理解美国艺术家泰勒·斯威夫特 (Taylor Swift) 的名字,泰勒·斯威夫特是众多询问的对象。
但是,他们也可能面临更微妙,甚至非常尴尬的情况。其中两人提到了一段类似于性侵犯场景的可疑录音。模糊。然后他们试图警告上级,上级认为这不是公司的责任。
更具有启发性的是:调查显示,亚马逊允许其员工听众访问用户的敏感信息,例如他们的身份、帐号或购买的扬声器的序列号。严重违反个人数据保护。而其竞争对手 Google Assistant 或 Siri,即使语音助手也是由人类智能推动的,数据的匿名化似乎也是有保证的。
“样本非常小”
当被要求回应这些指控时,这家美国零售巨头试图为自己辩护:
«我们认真对待客户个人信息的安全和隐私» 亚马逊发言人保证。 “我们仅对 Alexa 录音的一小部分样本进行注释,以改善您的客户体验。这些信息有助于我们训练我们的语音识别和语言理解系统,从而使 Alexa 能够更好地理解您的请求。» 公司解释。
问题是,在 Alexa 的规模上,即使是很小的样本也代表着天文数字般的记录时间,因此可能有相当多的用户收听。特别是自 2014 年创建以来,Alexa 一直主导着语音助手市场。