对于许多人来说,谷歌只是个人数据的吸尘器。但是,这里的时代也在发生变化。这家山景城公司越来越将自己定位为隐私捍卫者。去年8月,她提出« 隐私沙箱 »,这一技术概念在广告定位和个人数据保护之间产生了巨大的差异。
Google 现已开源了差分隐私 (CD) 算法的 C++ 库。可用于GitHub,它应该为任何处理大量数据并希望保留基础数据匿名性的人提供一个随时可用的工具包。“这不是第一家此类书店,但可能是最完整、最成熟的””,Google 隐私团队产品经理 Miguel Guevara 解释道。
原理简单,但实现起来很复杂
事实上,谷歌在其一些产品中使用了这个库,例如在谷歌地图中创建企业富裕程度或餐馆菜肴受欢迎程度的指标。 2014年,谷歌还使用CD技术在Chrome中收集遥测数据。
原则上,CD 很容易理解。要使数据匿名化,仅仅删除人名是不够的,因为交叉检查数据仍然可以找到身份。 CD 的想法是向数据中注入随机信号,充分模糊界限以防止信息交叉检查,同时又不会扭曲治疗的统计有效性。
“CD的方法非常扎实。它们甚至可以得到正式证明,并且其效果是可以衡量的。但它们仍然很难实现,尤其是在数据库很复杂的情况下。该库促进了这一实施工作,我们希望它能被广泛使用 »” 苏黎世联邦理工学院隐私团队研究员、博士生达米安·德方丹 (Damien Desfontaines) 解释道。今年还为开发者发布了其他数据保护工具,例如“Tensorflow Privacy”、“Tensorflow Federated”和“Private Join and Compute”。
来源:谷歌