面部识别系统对训练数据有着无尽的需求。但未经本人同意而使用真人面孔会引发道德和隐私问题。帮助,但即使这些也往往基于真人的生物识别。使用图形管道生成的面孔,没有真实数据——例如微软开源中包含的面孔DigiFace-1M数据集——看起来不够真实。
如何喂人脸识别机,不小心让隐私权成为饭菜的一部分?这是研究人员提出的问题伊迪亚普研究所开始用他们的答案来回答项目,“Digi2Real:通过基础模型弥合合成数据人脸识别中的现实主义差距。”
这项工作引入了一种使用大规模人脸基础模型的“新颖的真实感迁移框架,旨在增强合成生成的人脸图像的真实感”。它从 DigiFace-1M 数据集开始,该数据集包含超过一百万个用于面部识别的不同合成面部图像。
摘要称:“通过将图形管道的可控方面与我们的真实感增强技术相结合,我们生成了大量真实的变化——结合了两种方法的优点。” “我们的实证评估表明,使用我们增强的数据集训练的模型显着提高了超过基线。
生成的 Digi2Real 合成人脸数据集包含 20,000 张独特的图像,将真实感传输技术应用于从图形管道中程序生成的身份,“以生成逼真的图像,这比原始 DigiFace 数据集更有效地训练人脸识别模型。”
该过程涉及“在嵌入空间内的多个身份图像之间进行插值”,然后使用预先训练的弧面模型“从这些插值嵌入中合成身份一致的图像”。然后,它通过减少中间 CLIP 编码器空间中的域间隙来进一步增强它们。
“通过将图形管道的可控特性与我们的真实感增强技术相结合,我们提出了一种创建属性可控 f 的新方法。,”研究人员说。他们有数字来支持这一点:他们的测试表明,“Digi2Real 数据集的人脸识别性能比 DigiFace 显着提高,并且比许多其他合成数据集实现了更好的性能。”
这Digi2Real 数据集,包含 20,000 个独特个体的 399,355 张图像,是公开可用的。
文章主题
||||||||