与Google合同下的语言审阅者分析了其Google Assistant软件收集的语音数据样本,已泄露了1000多个用户的声音录音,将其生物识别和人工智能培训实践重新放在了焦点中,并将公司放在后脚上。
比利时新闻网站VRT本周早些时候发布了一份报告,该报告涉及Google聘请全球范围内的合同工作者聆听和注释Google Home Speaker等设备的录音。一个这样的承包商刺激了这个故事,从荷兰客户提供泄漏的语音数据,其中包括私人信息,例如家庭住址和有关医疗状况的讨论。
Google回应了博客文章,解释说,只有大约0.2%的所有音频片段被其承包商聆听和转录。该公司表示,它采取了许多保护用户身份的措施,其人类审稿人可以帮助数字助手“了解特定语言的细微差别和口音”。
该公司承认泄漏,并解释了收集音频数据及其安全响应的过程,以向公众保证。
Google搜索产品经理David Monsees在回应中写道:“我们的安全和隐私响应团队已在此问题上激活,我们将采取行动。” “我们正在对这个空间中的保障措施进行全面审查,以防止这样的不当行为再次发生。”
亚马逊陷入了类似的争议今年早些时候,该公司雇用工人来聆听和注释录音以进行培训。公众和提供数字助理的公司似乎都被可预测的发展措手不及,例如最近BIPA针对亚马逊的诉讼用于生物识别处理伊利诺伊州的语音样本。
边缘指出亚马逊和Google都允许用户删除音频数据,而Google允许用户完全关闭音频存储,尽管亚马逊收集的一些数据仍然可供公司使用。