Google响应AI助理审稿人的音频数据泄漏

2019-07-12

与Google合同下的语言审阅者分析了其Google Assistant软件收集的语音数据样本，已泄露了1000多个用户的声音录音，将其生物识别和人工智能培训实践重新放在了焦点中，并将公司放在后脚上。

比利时新闻网站VRT本周早些时候发布了一份报告，该报告涉及Google聘请全球范围内的合同工作者聆听和注释Google Home Speaker等设备的录音。一个这样的承包商刺激了这个故事，从荷兰客户提供泄漏的语音数据，其中包括私人信息，例如家庭住址和有关医疗状况的讨论。

Google回应了博客文章，解释说，只有大约0.2％的所有音频片段被其承包商聆听和转录。该公司表示，它采取了许多保护用户身份的措施，其人类审稿人可以帮助数字助手“了解特定语言的细微差别和口音”。

该公司承认泄漏，并解释了收集音频数据及其安全响应的过程，以向公众保证。

Google搜索产品经理David Monsees在回应中写道：“我们的安全和隐私响应团队已在此问题上激活，我们将采取行动。” “我们正在对这个空间中的保障措施进行全面审查，以防止这样的不当行为再次发生。”

亚马逊陷入了类似的争议今年早些时候，该公司雇用工人来聆听和注释录音以进行培训。公众和提供数字助理的公司似乎都被可预测的发展措手不及，例如最近BIPA针对亚马逊的诉讼用于生物识别处理伊利诺伊州的语音样本。

边缘指出亚马逊和Google都允许用户删除音频数据，而Google允许用户完全关闭音频存储，尽管亚马逊收集的一些数据仍然可供公司使用。

文章主题