值此之際2016 年全球開發者大會iPhone 的創造者展示了一大堆智慧新功能,例如 QuickType 中的預測輸入或 表情符號建議在訊息即時訊息中。為了能夠提供這些軟體改進,蘋果被迫大量收集用戶數據,以便能夠識別統計趨勢。事實上,它的系統必須能夠考慮單字的使用上下文來「理解」其含義,並提出正確的句子完成或正確的表情符號。
然而,蘋果不希望被視為個人資料的無法無天的吸塵器。它的信條是尊重隱私,為了維護這一形象,該公司開始實施一項相當新的技術:「差異隱私」。
刪除名字還不夠
這一數學學科於 2006 年出現,當時研究人員注意到當時匿名技術缺乏有效性。這個問題尤其出現在與某些疾病相關的醫學資料庫中。醫學界希望能夠分析這些數據以提取統計信息,而無法識別構成該資料庫的人員。僅僅刪除名字是不夠的,因為我們可以透過與第三方記名資料庫交叉核對統計結果來找到個人的痕跡。一些研究人員過去已經證明了這一點,例如透過對健康保險的基礎進行去匿名化。
正是為了防止這種類型的攻擊,發明了差分隱私。這個想法是透過添加數學噪聲(即隨機訊號)來修改資料處理。這使得個人識別變得非常困難。然而,由於它是中立訊息,因此可以以不扭曲統計結果的方式對其進行整合。
那麼一切都好就結局好嗎?並不真地。密碼學家 Matthew Green 在一篇部落格文章中解釋說,這種做法有其限制:我們想要恢復的統計結果越多,我們就必須添加更多的噪音來保護個人資料;但我們添加的噪音越多,這些統計結果就越不可靠;相反,我們添加的噪音越少,個人資料外洩的風險就越大。因此,差別親密度並不是一個神奇的解決方案,而且很難校準。
矛盾的是,蘋果完全可以複製谷歌
蘋果將如何實現這一點?目前,這是一個很大的謎團,蘋果尚未提供有關此問題的詳細資訊。儘管如此,馬修·格林subodore——基於庫比蒂諾巨頭軟體工程高級副總裁 Craig Federighi 的聲明——製造商受到所謂的「隨機回應」技術的啟發:有時發送的回應是真實的,有時是隨機的。 Google 使用這種技術創建了一個名為 RAPPOR 的 Chrome 使用資料收集系統。這混合了隨機函數和雜湊技術,以盡可能匿名化網路使用者接收的資料。
這種差異隱私的實作可以確保 iOS 用戶的個人資料受到保護。以這種方式收集的資訊不能用於與個人相關的查詢,無論是在廣告定位還是國家安全局調查中。嗯,至少在理論上是這樣。這一切在實踐中將如何表現還有待觀察。