onfido和trueface在國際面部表現會議(IFPC)週四,重點是減少面部識別申請中的偏見。
在會議上,Onfido的機器學習研究科學家Martins Bruveris談到了減少面部識別的地理性能差異。
另一方面,來自Trueface的Mosalam Ebrahimi致力於討論緩解偏見的策略,以與過度自信的虛假匹配有關。
降低面部生物識別技術中的地理性能差異
Bruveris的演示文稿通過描述與在自拍照和文檔照片之間達到1:1面部識別率有關的一般問題。
科學家提到了一個事實,即文檔中的照片沒有高分辨率,通常會部分被安全功能和全息圖所掩蓋,並且對比度較低。
此外,由於它們是在紙上打印的,因此隨著時間的推移,它們會遭受固有的圖像質量降解。
Bruveris繼續說:“沒有任何研究在真空中進行”,並提到了眾多來源,Onfido進行了測試以便減少地理性能差異面對生物識別技術。
為了進行這些測試,該公司還分析了一個內部數據集,其中有680萬張圖像對,還有另外100,000個外部數據集,包括具有有關性別和其他信息的可用元數據的文件已發行的ID。
Bruveris指出了分析的數據是如何“失衡”的,而不是統一分發,因為該公司在開展業務的國家 /地區擁有更多數據集,主要是歐洲和美國
換句話說,一些國家在數據集中非常有代表性,而另一些國家則沒有。這導致亞洲和非洲的錯誤接受率顯著高。
為了解決這個問題,Onfido部署了一系列緩解策略,圍繞著平等的抽樣,調整後的抽樣和動態抽樣的思想進行了旋轉。
相等的採樣包括從每個大陸選擇相等數量的數據樣本,而加權採樣屬性的數據集具有更高的條目。
動態抽樣是指根據基於階級的錯誤接受率(FAR)在訓練過程中動態調整的權重的加權採樣。
Bruveris指出,Onfido沒有更改數據集的大小,而是選擇了每個大陸的樣本的頻率。
實驗後,該公司得出結論認為,可以在沒有平衡數據的情況下降低性能差異,但是減少差異可以導致虛假排斥率(FRR)差異增加。
面部識別偏見緩解策略,用於過度自信的虛假比賽
Mosalam Ebrahimi撿起了Bruveris離開的地方,加強了Onfido的科學家所說的話算法偏差在面部識別應用中。
他提到了與角度,穀物和模糊有關的圖像識別問題。此外,數據集中人數不足的種族返回更高的誤報。
Ebrahimi簡要概述了Trueface的工作,並提到了該公司最近的一些項目。具體而言,研究人員描述了公司的解決方案,該解決方案生成了包含的QR碼加密的生物識別數據從照片中提取。
Ebrahimi還提供了與該公司算法速度有關的數據,稱該數據現在比他們自己的方法在FRVT 1:1中,關於同一硬件的報告。
這還允許公司的軟件選擇性地壓縮具有更高比特率的圖像的部分,該部分使用自己的編碼器和解碼器,減少文件大小並保持足夠高的質量以減少誤報。
然後,TrueFace的研究人員分析了相似性評分(距離)為何是不完善的置信度度量。
他認為這個問題在於以下事實:嵌入是非等法的,並具有很大的失真,並且將分佈點映射到目的地指標中的隨機點。
埃布拉希米(Ebrahimi)結束了他的演講,說可以通過考慮相似性得分的概率密度估計而不是點估計來防止過於自信的虛假匹配。