正在快速前进。我们的法律和社会实践没有跟上。从监管机构到艺术家,不同的利益相关者提出了广泛的担忧。公众意识还比较低,需要加强教育。所使用的术语效率低下且过时。我们在识别虚假媒体和运用批判性思维方面的集体弱点可能会给受害者带来改变生活的后果。与此同时,对选举结果的潜在威胁似乎被夸大了——但由于虚假内容能够通过社交网络快速传播,它可能会侵蚀整体社会信任结构,并使真相陷入不确定的混乱之中。
我们能做什么?在最近的一次深伪工作坊由欧洲生物识别协会 (EAB) 主办,一组专家就如何将立法、监管、教育和技术结合起来,以有效防范新兴的深度造假威胁进行了探讨。最重要的问题是极其严重的:归根结底,现实对我们来说有什么价值?
周期性“老鼠赛跑”中的 Deepfake 生成和检测:Peter Eisert
对于洪堡大学视觉与成像技术负责人兼视觉计算系主任 Peter Eisert 来说,深度伪造品的生成和检测陷入了一种重复循环。易于访问的 Deepfake 工具的激增导致了不断的改进。艾塞特使用仓鼠轮子的图像来象征开发人工智能的持续努力,该人工智能能够有效地检测越来越多的这些。
“我们已经看到深度伪造的质量有了巨大的提高,”艾塞特说。在欺诈人工智能和防御性人工智能之间的激烈竞争中,检测策略必须与攻击模式同步发展。
艾塞特概述了当前各种类型的深度赝品。把某人的脸贴在别人的身上。面部重现可以操纵面部表情或姿势。可以使用 GAN 或扩散模型创建完全合成的深度赝品。方法不断发展:艾塞特指出“高斯泼溅”——一种可以产生高分辨率面部深度伪造品的新技术。每个新的迭代都会展示出现在不同地点和不同环境中的不同类型的文物。
如果深度换脸检测要与时俱进,它就必须及时发展。目前许多深度伪造检测器都是基于逐帧的。但艾塞特表示,他们应该将时间效应和“随着时间的推移的不一致”——内容中的语义和时间信息,例如心率或面部血液的时间流动——作为潜在的指标。
一个也很重要。如果数据集包含太多易于发现的伪影,那么人工智能模型将很容易跳过这些伪影,并且无法很好地概括。 “我们需要高质量的深度伪造数据来训练强大的探测器,”艾塞特说,“让新的攻击者更难找到你的潜在空间中未被探测器覆盖的漏洞。”
AltFreezing 或 Real Forensics 等训练策略为解决如何训练检测器关注时间特征的问题提供了不同的方法。还有更多可能性:面部表情参数和头像指纹识别(NVIDIA 开发的一种用户 ID 技术),该技术使用面部动态来识别。
Eisert 的主要结论是,时间一致性尚未充分用于检测,并且需要具有各种数据的高质量数据集进行训练。
“人眼检测深度赝品并不容易”:安-凯瑟琳·弗莱伯格 (Ann-Kathrin Freiberg)
BioID 的 Ann-Kathrin Freiberg 最近在 EAB 午餐会上发表了有关 Deepfakes 的演讲,她为研讨会带来了行业视角。她强调了之前演讲中的许多相同点:深度伪造品被用于犯罪活动,例如网络钓鱼、首席执行官视频通话诈骗、浪漫诈骗,以及大多数情况下,超过 90% 的 Deepfake 内容都与之相关。
Deepfake 技术也是对民主的威胁。导致选举干扰的 Deepfake 虚假信息活动可能会迅速传播,内容会在数小时内传播并获得数千次浏览。弗莱伯格说,即使视频被篡改,“很多人也已经看过了。”
不幸的是,人们天生没有能力去检测;人眼的表现仍然相当差,而且随着制造深度赝品的技术的进步,它只会变得更加困难。此外,有些人似乎并不介意某些公众人物是否真实。 Freiberg 提到了 Instagram 上的红人艾塔娜·洛佩兹 (Aitana Lopez),她是一位深度伪造模特(或“虚拟灵魂”),拥有 329,000 名粉丝,每月为创造她的西班牙经纪公司带来数千欧元的收入。 “人们并不真正关心她是人工智能生成的,”弗莱伯格说。
为了遏制身份盗窃和声誉损害等个人威胁,以及干预选举等社会威胁,深度造假检测方法必须保持最新。这是深度造假竞技场中人工智能与人工智能的较量,但这场比赛不仅仅是角斗式的——而且不能仅仅通过算法来获胜。弗莱伯格认为,有效的关键是是一种整体方法,将媒体素养(对我们共享内容和方式的认识)与欧盟人工智能法案等法规以及水印和相机源分析等技术支持解决方案相结合。
“圆圈正在这里闭合”:Mateusz Labuz
检测深度赝品意味着首先要对其进行定义。开姆尼茨理工大学的 Mateusz Łabuz 如此说道。 Labuz 对 Deepfake 的技术、类型、效果和主观方面进行了区分。所有这些都纳入了对抗它们所需的整体方法。
Labuz 的演讲不再是“技术固着”,而是涵盖了整个行业。他说,技术需要正确的框架。这意味着不仅要了解问题的规模,还要了解问题的本质。
例如,以下问题这是一个女性安全问题,因为 99% 的 Deepfake 色情内容都是女性的。深度假货受害者的女性会遭受长期的身心后果。
将这一点与 98% 的 Deepfake 视频与色情相关的事实联系起来,并且 Deepfake 是专门针对女性的主要威胁。
另一方面,深度造假仍然有多种用途和适当的应对措施。即使深度造假攻击的干扰极小,其影响也可能会在整个安全生态系统中产生反响,从助长破坏对媒体和信息的信任。
拉布兹表示,法规往往缺乏足够的措施来保护用户。他还讨论了水印、生物特征哈希和其他可用于验证媒体身份的技术等保护措施。对策必须超越法律层面,投资、人力工具和资本都是必要的。技术必须与意识相匹配,、弹性和抑制放大的方法。有效的执行必须是可证明的。
拉布兹说“这个圈子正在这里闭合”。社会必须加快行动以确保始终明确披露,调整法律体系以反映新的威胁和需求(例如帮助深假色情的受害者),并普遍增强社会复原力和公众意识。 “深度造假的受害者真的知道在这种情况下他们能做什么吗?我发现在关键时刻如何反应方面存在巨大的弱点。”
最后,拉布兹将他的整体方法建立在三个支柱上,这验证了艾塞特和弗赖伯格的许多陈述。监管和法律措施、技术和检测系统以及增强的社会复原力是摆脱深度造假困境的出路。寻找解决方案需要对话、灵活性和广度。
“这并不是为了阻碍创新,”他说。 “这是为了恢复我们社会对技术的基本信任。”
“设计、检测然后解释”:Gian Luca Marcialis
吉安·卢卡·马西亚利斯 (Gian Luca Marcialis)SAIfer Lab 的生物识别单元。该实验室正在研究被动 Deepfake 检测方法以及 Deepfake 检测分类法,该分类法对多种检测方法进行了分类:通用网络/无向检测、基于视觉伪影、基于时间一致性、生物信号和相机/GAN 指纹。 (换句话说,额外的手指、眨眼困难、心率和数字噪音。)深度学习和卷积神经网络是放大检测的另一种选择。
Marcialis 的 sAIfer 实验室正在致力于绘制支持 Deepfake 检测方法的技术流程。它反映了更大的社区不仅努力检测深度赝品,而且还努力定义和区分它们是什么。
“你无法看到或触摸音频的虚假性”:詹妮弗·威廉姆斯
“过去,语音和音频处理需要电气工程博士学位。现在,任何人都可以创造这些深度赝品。”南安普顿大学助理教授詹妮弗·威廉姆斯(Jennifer Williams)从听觉角度分析了深度造假事件的崩溃,她如是说道。利用人类听觉的偏见,让声音“欺骗我们”。语音是代表唯一身份的生物识别数据。如果它受到损害,后果可能包括财务欺诈到完全丧失相信所听到的内容的能力。
“对于某些人来说,”威廉姆斯说,“这确实是现实本身的问题。”
语音合成技术进步很快。 2016 年,名为 Merlin 的尖端神经 SPSS 听起来仍然像一个刻板的机器人。现在我们有以及代表国家政府发表声明的虚拟公共事务官员。积极的用例推动了语音技术的巨大变革,而语音技术不可避免地被用于犯罪目的。
威利姆斯表示,音频深度伪造攻击有多种形式:
录音和重放攻击是指“说话的人实际上是正确的人,但语音已被捕获并重放,因此这些单词可能会断章取义。”它可以通过简单的人声源录音来实现。录音可以拼接成真实或真实的其他片段改变上下文。 (想一想,如果欺诈者只拥有你说“是”的录音,可能会导致什么结果。)
语音转换“需要源说话者准确地说出正确的单词。”然后,它可以将源说话者的声音转换为任意数量的目标说话者的声音。演讲的内容保持不变,但声音发生了变化。
通过说话人嵌入“将他们以前从未说过的话放入某人的嘴里”。这需要复杂的机器学习和大量的训练数据,并允许控制音高、韵律和情感音色等。
部分深度伪造是指进行小而简单的编辑来混合真实和虚假媒体。这结合了多种类型的编辑和机器学习功能。
文物用于在较高频率下最容易被检测到,通常超出人类听觉范围。它们可能以听不见的爆裂声、零星相位不匹配产生的嗡嗡声以及报报或呼吸节奏的问题出现。它们的时间分布不一致。
从法律上讲,司法系统存在社会技术挑战,并且对用于讨论音频深度伪造的许多术语存在分歧——例如“合成”和“真实”等术语。不断变化的技术格局并没有注意到监管机构的缓慢调整。
威廉姆斯和她在南安普顿大学的团队建立了一个名为“深度造假”检测的系统安全可靠(南安普顿音频取证评估器),只需一秒的音频即可提供高度准确且可解释的模型决策。它结合了人类感知模型、声道模型、情感语音模型、噪声鲁棒性、声学环境和高频异常检测器。在设计方面,它的目标是快速、易于使用、可扩展以容纳大量数据,并且适用于各种用例。
“现在是关键时刻; Chat GPT 才诞生两年”:Benoit Fauve
语音生物识别公司的 Benoit Fauve还研究了有关音频深度伪造的一些更大的考虑因素。他追溯了音频 Deepfakes 从早期欺骗方法到 Deepfake 时代的开始的演变,在2010年代中期。 “deepfake”这个词是 2017 年在 Reddit 上创造的。从那时起,深度伪造品的开发和投资以及如何打击它们一直呈稳定上升趋势。
Fauve 表示,目前,生成式人工智能推动了音频深度伪造热潮,这一点至关重要。但是,和威廉姆斯一样,他强调必须理清某些语言才能实现最强有力的防御姿势,而对深度造假的了解是其中的关键部分。
“我们来这里是为了建立一个道德、安全的系统”:卢克·阿里戈尼
Luke Arrigoni,数字肖像保护技术初创公司创始人,其业务重点是在线许可和公众人物保护。他表示,Loti Watchtower 将面部识别防御(取缔未经授权的深度伪造等)和进攻结合起来——例如,在广告中出现人才的人工智能代表的合同就是为了人才的优势而设计的。
但如果说研讨会传达了一个最重要的信息的话,那就是深度假货很快就会影响到所有人(如果还没有的话)。技术在不断进步,检测方法也在努力跟上。仓鼠轮子不停地滚动;深度造假的激烈竞争仍在继续。
文章主题
||||||||||