由Biometrics安全和隐私组的团队撰写的一篇新论文IDIAP研究所根据一个LinkedIn帖子来自IDIAP的高级研究员SébastienMarcel教授。
该论文认为,在大规模数据集上训练的面部识别模型(FR)模型随附隐私和道德问题,更不用说时间限制了。它说:“尽管在实验室中进行的数据收集活动可以代表一般人口统计信息并通过受试者的同意进行,但由于他们需要的大量努力,它们通常非常有限。” “最近,使用合成数据已经提出了补充或替换培训FR模型的真实数据。尽管已经获得了有希望的结果,但仍不清楚生成模型是否可以为此类任务产生足够多的数据。”
该团队的研究测试了一种新方法,旨在通过“开发以物理启发的算法来解决某些问题,允许对合成身份及其变化的采样进行精确控制。”用技术术语来说,该方法“受到软粒子的物理运动的启发随机的布朗尼力量,允许我们在各种限制下在潜在空间中进行标识分布。”之后核心方程,它被命名为Langevin算法 - 允许“球形身份密集地包装,同时保持潜在的空间散布最小”。
用更简单的术语,该算法认为将生物识别为悬浮在培养基中的颗粒,并施加力以确保这些识别单元的最佳分布。
研究人员说:“我们手头就可以生成几个面部数据集并通过培训FR模型对其进行基准测试,这表明使用我们的方法生成的数据超过了先前的性能基于GAN的数据集并通过基于最新扩散的合成数据集实现竞争性能。”
对Langevin项目的额外支持来自身份识别技术研究中心(CITER)及其分支机构,欧洲侵入-ETN,Hasler Foundation the Hasler Foundation通过负责任的面部识别(SAFER)项目和The The The瑞士生物识别研究与测试中心。
完整的纸有可用的这里。
第一个合成儿童面部数据库的面部识别
一张单独的纸来自DA/SEC生物识别技术和安全研究小组在德国的Hochschule Darmstadt,Darmstadt大规模调查了儿童面部识别。作者还想解决偏见和隐私他们说,尽管儿童面部识别系统有许多潜在的应用,但在儿童的具体情况下,这一点没有得到足够的关注。给定的示例是一个自动化过程承认受害者在越来越多的问题中,被捕获的儿童性虐待材料(CSAM),2019年获得了超过7000万个CSAM视频和图像。
“由于大量数据,有必要拥有可以识别此类材料的孩子的自动化系统,需要有效面部识别系统该论文说。作者提出了“创建一个合成面部数据库的新型管道,该数据库在成年时代和不同的儿童时代都包含相同的受试者。”该论文说,通过将gan与面部年龄进度(FAP)模型相结合,该团队能够创建其声称的是“第一个大规模合成儿童面部图像数据库:hda-synchildfaces。”
提议的处理管道使其所谓的“受控无偏生成孩子面对图像。”简而言之,它显示了一系列图像,随着时间的流逝,将对综合产生的HDA-SynchildFaces数据库进行渐进式变化。
可以通过信号处理的前沿。