對許多人來說,谷歌只是個人資料的吸塵器。但是,這裡的時代也在改變。這家山景城公司越來越將自己定位為隱私捍衛者。去年8月,她提出« 隱私沙箱 »,這項技術概念在廣告定位和個人資料保護之間產生了巨大的差異。
Google 現已開源了差分隱私 (CD) 演算法的 C++ 函式庫。可用於GitHub,它應該為任何處理大量資料並希望保留基礎資料匿名性的人提供一個隨時可用的工具包。“這不是第一家此類書店,但可能是最完整、最成熟的””,Google 隱私團隊產品經理 Miguel Guevara 解釋道。
原理簡單,但實作起來很複雜
事實上,Google在其一些產品中使用了這個函式庫,例如在Google地圖中創建企業富裕程度或餐廳菜餚受歡迎程度的指標。 2014年,Google也使用CD技術在Chrome中收集遙測資料。
原則上,CD 很容易理解。要讓資料匿名化,僅僅刪除人名是不夠的,因為交叉檢查資料仍然可以找到身分。 CD 的想法是向數據中註入隨機訊號,充分模糊界線以防止資訊交叉檢查,同時又不會扭曲治療的統計有效性。
“CD的方法非常紮實。它們甚至可以得到正式證明,並且其效果是可以衡量的。但它們仍然很難實現,尤其是在資料庫很複雜的情況下。該庫促進了這項實施工作,我們希望它能被廣泛使用 »」 蘇黎世聯邦理工學院隱私團隊研究員、博士生達米安‧德方丹 (Damien Desfontaines) 解釋道。今年也為開發者發布了其他資料保護工具,例如「Tensorflow Privacy」、「Tensorflow Federated」和「Private Join and Compute」。
來源:Google