在本文中,我们研究了可推广的合成图像检测问题,旨在从不同的生成方法(例如 GAN 和扩散模型)中检测伪造图像 ...
生成模型的兴起引发了人们对在线图像真实性的担忧,凸显了对有效且通用的检测器的迫切需求。最近利用冷冻预训练 CLIP-ViT 模型的方法在深度伪造检测方面取得了巨大进展。然而,这些模型通常依赖于冻结网络直接提取的视觉通用特征,其中包含过多与任务无关的信息,导致检测性能有限 ...
GPT4-V 和 LLaVA 等大型视觉语言模型 (LVLM) 最近取得了巨大进展。 LLaVA 的模块化架构尤其融合了简单性和效率。最近的工作主要集中在引入更多的预训练和指令调整数据以提高模型的性能 ...