一個由微軟科學家主導的團隊發表了研究,表明任何人都在互聯網上抓取培訓面部識別算法的面孔可能正在浪費時間和金錢。
這項由劍橋大學科學家領導的研究尚未受到同行評審。在紙該團隊說,合成面孔的大規模數據集的準確性為96.17%。這仍然不足其他人使用數十億個從社交媒體和網絡其他領域刮擦的面部圖像的精度。
根據論文,將500,000至122萬個合成數字胸圍的數據集與從200到2,000不等的真實圖像(每個身份的20張圖像)配對,將其結果提高,以大致與持有無數圖像的數據集相提並論。
作者指出,從道德上請求2,000人的圖像比與當前未經公司同意的所有圖像進行相同的圖像相比要容易得多,Clearview AI。
該小組說,隨機收集的圖像和前所未有的散裝圖像帶有諸如偏見和源質量缺陷等不太隱藏的成本以及標籤噪聲。
當然,這個過程被稱為聯合國道德充其量是隱私倡導者,因為所有主要的西方社交媒體都禁止對其訂閱者的帳戶進行刮擦。這違反了他們的服務條款。
在電子郵件交流中,Clearview首席執行官Hoan噸說他對使用生成的面孔的學術研究“印象深刻”。
但是“當前的研究表明,與當前的最新算法相比,由生成面部產生的算法的準確性較低。”
噸 - 將他的帽子與真實圖像結合在一起,以提高性能和準確性。
Digiface-1M數據集為可下載來自Github。