onfido和trueface在国际面部表现会议(IFPC)周四,重点是减少面部识别申请中的偏见。
在会议上,Onfido的机器学习研究科学家Martins Bruveris谈到了减少面部识别的地理性能差异。
另一方面,来自Trueface的Mosalam Ebrahimi致力于讨论缓解偏见的策略,以与过度自信的虚假匹配有关。
降低面部生物识别技术中的地理性能差异
Bruveris的演示文稿通过描述与在自拍照和文档照片之间达到1:1面部识别率有关的一般问题。
科学家提到了一个事实,即文档中的照片没有高分辨率,通常会部分被安全功能和全息图所掩盖,并且对比度较低。
此外,由于它们是在纸上打印的,因此随着时间的推移,它们会遭受固有的图像质量降解。
Bruveris继续说:“没有任何研究在真空中进行”,并提到了众多来源,Onfido进行了测试以便减少地理性能差异面对生物识别技术。
为了进行这些测试,该公司还分析了一个内部数据集,其中有680万张图像对,以及另外100,000个外部数据集,包括具有有关性别和其他信息的可用元数据的文件已发行的ID。
Bruveris指出了分析的数据是如何“失衡”的,而不是统一分发,因为该公司在开展业务的国家 /地区拥有更多数据集,主要是欧洲和美国
换句话说,一些国家在数据集中非常有代表性,而另一些国家则没有。这导致亚洲和非洲的错误接受率显着高。
为了解决这个问题,Onfido部署了一系列缓解策略,围绕着平等的抽样,调整后的抽样和动态抽样的思想进行了旋转。
相等的采样包括从每个大陆选择相等数量的数据样本,而加权采样属性的数据集具有更高的条目。
动态抽样是指根据基于阶级的错误接受率(FAR)在训练过程中动态调整的权重的加权采样。
Bruveris指出,Onfido没有更改数据集的大小,而是选择了每个大陆的样本的频率。
实验后,该公司得出结论认为,可以在没有平衡数据的情况下降低性能差异,但是减少差异可以导致虚假排斥率(FRR)差异增加。
面部识别偏见缓解策略,用于过度自信的虚假比赛
Mosalam Ebrahimi捡起了Bruveris离开的地方,加强了Onfido的科学家所说的话算法偏差在面部识别应用中。
他提到了与角度,谷物和模糊有关的图像识别问题。此外,数据集中人数不足的种族返回更高的误报。
Ebrahimi简要概述了Trueface的工作,并提到了该公司最近的一些项目。具体而言,研究人员描述了公司的解决方案,该解决方案生成了包含的QR码加密的生物识别数据从照片中提取。
Ebrahimi还提供了与该公司算法速度有关的数据,称该数据现在比他们自己的方法在FRVT 1:1中,关于同一硬件的报告。
这还允许公司的软件选择性地压缩具有更高比特率的图像的部分,该部分使用自己的编码器和解码器,减少文件大小并保持足够高的质量以减少误报。
然后,TrueFace的研究人员分析了相似性评分(距离)为何是不完善的置信度度量。
他认为这个问题在于以下事实:嵌入是非等法的,并具有很大的失真,并且将分布点映射到目的地指标中的随机点。
埃布拉希米(Ebrahimi)结束了他的演讲,说可以通过考虑相似性得分的概率密度估计而不是点估计来防止过于自信的虚假匹配。