哥伦比亚大学工程与应用科学学院的研究人员推出了Divid,这是一种新工具,旨在识别AI生成的视频,其精度为93.7%。

Divid:检测AI生成视频的新工具
由计算机科学教授Junfeng Yang领导的研究团队开发了Divid,这是扩散生成的视频探测器的缩写,以回应AI生成的内容的越来越复杂。
AI生成的视频已经变得非常现实,挑战了人类观察者和现有检测系统,以辨别真实镜头和人为创建的内容。
根据研究团队,与较早的AI模型(例如生成对抗网络(GAN)(GAN))不同,这些模型可通过像素不规则性和非自然运动(例如扩散模型)产生这种保真度的视频,并且将它们与真实的录像区分开来,它们与真实的镜头相比,它们变得异常困难。
Divid建立在团队以前与Raidar的工作基础上,该工具旨在通过分析语言模式来检测AI生成的文本,而不是深入研究GPT-4或Gemini等AI机制。
Raidar的方法衡量了转换文本所需的更改数量,更少的编辑表明,由于AI倾向于产生相干文本,因此机器生成的可能性更高。
可怕的技术
采用类似的原理,Divid采用了可怕的(扩散重建误差)技术来仔细检查扩散生成的视频。该方法使用预训练的扩散模型评估了输入视频及其重建之间的差异,从而标记了可能由AI生成的视频。
Divid的目的是通过关注AI生成的视频和真实视频之间的固有差异来增强对抗欺骗性视觉内容的扩散所需的检测能力。
软件系统实验室的联合导演杨强调了Raidar Insight的通用适用性,并指出了其从文本到视觉媒介的适应性。随着AI生成的视频变得越来越现实,该团队旨在利用Raidar的见解来开发能够准确检测AI生成的视频的工具。
AI技术的演变,特别是在视频综合中通过OpenAI和Runway Gen-2等扩散模型(如Sora)的发展,强调了诸如Divid之类的强大检测机制的紧迫性。
这些模型从随机噪声中逐步完善每个视频框架,从而实现了前所未有的现实主义和挑战的常规检测方法,依赖于表面级别的异常。
通过Divid,哥伦比亚的研究人员最终旨在减轻各种情况下AI生成的视频带来的风险,包括预防欺诈和维持数字内容的完整性。
“ Raidar中的见解 - AI的输出通常被另一个AI视为高质量,因此它将更少编辑 - 它的功能非常强大,并且不仅仅是文本,” Yang S援助声明。
他补充说:“鉴于AI生成的视频变得越来越现实,我们希望采用Raidar Insight并创建一个可以准确检测AI生成的视频的工具。”
研究小组的发现是出版在Arxiv中。
