- 名称
- Seeing What Matters: Generalizable AI-generated Video Detection with Forensic-Oriented Augmentation
- 描述
合成视频生成进展非常迅速。最新模型可以生成非常逼真的高分辨率视频,与真实视频几乎没有区别。尽管最近提出了几种视频取证探测器,但它们通常表现出较差的泛化性,这限制了它们在现实场景中的适用性。我们克服这个问题的关键见解是引导探测器“看到真正重要的东西”。事实上,设计良好的取证分类器应该专注于识别生成架构引入的内在低级工件,而不是依赖于表征特定模型的高级语义缺陷。在这项工作中,首先,我们研究不同的生成架构,搜索和识别无偏见、抗损伤且跨模型共享的判别性特征。然后,我们引入了一种基于小波分解的新颖的面向取证的数据增强策略,并替换特定的频率相关频带以驱动模型利用更多相关的取证线索。我们新颖的训练范例提高了人工智能生成的视频检测器的通用性,无需复杂的算法和包含多个合成生成器的大型数据集。为了评估我们的方法,我们使用来自单个生成模型的数据来训练检测器,并针对各种其他模型生成的视频对其进行测试。尽管很简单,但我们的方法比最先进的检测器实现了显着的精度提高,即使在最新的生成模型(例如 NOVA 和 FLUX)上也能获得出色的结果 ...