普林斯顿大学的研究人员刚刚公布了第一个结果对广告跟踪器的大量研究存在于网络上。借助相当复杂的检测平台,他们扫描了 100 万个网站,以查找和分析这些小代码片段,这些代码旨在使用 cookie 和 Javascript 来识别互联网用户,以期更好地进行广告定位。有些结果令人惊讶,有些结果则稍显不足。
首先,必须指出的是,广告跟踪吸引了很多人。研究人员统计了互联网上大约有 81,000 个不同的跟踪器。但该行业实际上由少数参与者主导。这一领域的王者显然是 Google,由于其 Google Analytics 和 Doubleclick cookie,它出现在超过 60% 的网站上。其次是 Facebook 和 Twitter,分别出现在至少 20% 和 10% 的网站上。市场的其余部分完全分散。包含最多 cookie 的网站是新闻网站。分布最少的是“官方”网站(政府、公共服务)。这很正常,他们不靠广告谋生。
更有趣的是用于唯一识别互联网用户的技术的多样性。事实上,Cookie 非常有效,但也很容易被阻止。现在大多数浏览器都提供阻止第三方网站 cookie 的选项,甚至包括 Google Chrome。除了 cookie 之外,还必须使用所谓的“指纹”技术。这个想法是使用 JavaScript 函数从互联网用户的计算机收集足够具体的技术数据,以便能够区分它们。
据研究人员称,最常用的方法之一是“Canvas Fingerprinting”,他们发现了 14,371 个不同的脚本。其原理是谨慎地显示一个小图形,其中叠加了字母、颜色和绘制的线条。但每台计算机都会在该图中产生微小的差异,具体取决于其硬件细节(渲染、抗锯齿等方面的变化)。这足以让您的计算机变得独一无二。该技术的一个变体是“Canvas Font Fingerprinting”,它只专注于字体的显示。
本地地址采集
用于视频电话的 WebRTC 协议也非常适合身份识别。为了优化通信,客户端软件收集大量内部(Wifi、以太网、NAT)和外部地址,以获得最有效的路由。然而,未经用户同意,任何站点都可以检索这些地址。研究人员在 715 个站点上检测到了这种方法。
研究人员还发现了以前从未见过的指纹识别技术。他们通过利用计算机的音频电路(找到 57 个代码)或电池的技术规格(例如充电水平或容量)(找到 2 个代码),获得了能够生成指纹的脚本。一切都很好,能够尽可能最好地追踪您!