什麼是匿名化?
De-Nonymination是一種用於數據挖掘的技術,該技術試圖重新識別加密或模糊的信息。匿名化,也稱為數據重新識別,與其他可用數據的交叉引用匿名信息,以識別一個人,團體或交易。
關鍵要點
- 匿名化是重新確定存儲在加密或其他模糊數據中的私人信息的做法。
- 匿名數據在在線和金融交易以及社交媒體以及其他形式的電子消息傳遞和溝通中使用。
- 重新識別匿名數據可能會出於非法目的損害個人身份和財務安全,並破壞消費者信任。
了解匿名化
精通技術的時代正在迅速破壞在經濟各個部門做事的傳統方式。近年來,金融行業看到許多數字產品由金融科技公司。這些創新的產品促進了金融包容性,從而,更多的消費者可以以比傳統金融機構允許的價格低的成本獲得金融產品和服務。技術實施的增加導致數據收集,存儲和數據的使用增加。
社交媒體平台,數字支付平台和智能手機技術等技術工具已經揭示了各種公司使用的大量數據,以增強其與消費者的互動。這些數據稱為大數據,這是個人和監管機構之間關注的原因,要求制定更多保護用戶身份和隱私的法律。
De-Anonymin如何工作
在大數據時代,有關用戶在線活動的敏感信息通過雲計算即時共享的敏感信息,數據匿名化工具已被用來保護用戶的身份。匿名化掩蓋了在衛生服務,社交媒體平台,電子商務交易等各個領域進行交易的用戶的個人身份信息(PII)。 PII包括出生日期,社會安全號碼(SSN),郵政編碼和IP地址等信息。掩蓋在線活動留下的數字步道的需求導致實施了匿名策略,例如加密,刪除,概括和擾動。儘管數據科學家使用這些策略從共享數據中限制敏感信息,但它們仍然保留原始信息,從而為重新識別的可能性打開了大門。
De-Anonymization通過將共享但有限的數據集與易於在線訪問的數據集進行匹配,從而逆轉了匿名的過程。數據礦工然後可以從每個可用數據集中檢索一些信息,以將一個人的身份或交易匯總在一起。例如,數據礦工可以檢索電信公司共享的數據集,社交媒體網站,電子商務平台以及公開可用的人口普查結果,以確定用戶的名稱和頻繁活動。
如何使用匿名化
當發布新信息或實施匿名策略時,重新識別可以成功。數據分析師和礦工每天提供大量數據和有限的時間,正在實施稱為啟發式法做出決定。儘管啟發式方法可以節省寶貴的時間和資源,以通過數據集進行梳理,但如果實施了錯誤的啟發式工具,它也可以創建差距。這些差距可以由尋求用於法律或非法目的的數據集的數據礦工來識別。
可以在地下市場上出售的匿名技術非法獲得個人身份信息,這也是一種匿名平台的一種形式。落入錯誤的手中的信息可以用於脅迫,勒索和恐嚇,從而導致陷入受害者的企業的隱私問題和巨大成本。
去匿名化也可以合法使用。例如,絲綢之路網站是一個非法藥物的地下市場,由一個名為的匿名網絡主持Tor,它使用洋蔥策略來混淆用戶的IP地址。 TOR網絡還託管了其他幾個非法市場,這些市場交易槍支,信用卡被盜和敏感的公司信息。通過使用複雜的匿名工具,聯邦調查局成功地破裂並關閉了絲綢之路,並參與了兒童色情製品。
重新識別過程的成功證明了不能保證匿名性。即使今天實施了開創性的匿名工具來掩蓋數據,隨著新技術和新數據集的可用,可以在幾年內重新識別數據。