在本文中,我们研究了可推广的合成图像检测问题,旨在从不同的生成方法(例如 GAN 和扩散模型)中检测伪造图像 ...

0 0 0 0 2024/10/19 arXiv:2312.16649v1 arthur

生成模型的兴起引发了人们对在线图像真实性的担忧,凸显了对有效且通用的检测器的迫切需求。最近利用冷冻预训练 CLIP-ViT 模型的方法在深度伪造检测方面取得了巨大进展。然而,这些模型通常依赖于冻结网络直接提取的视觉通用特征,其中包含过多与任务无关的信息,导致检测性能有限 ...

0 0 0 0 2024/10/17 arXiv:2408.13697v1 arthur

GPT4-V 和 LLaVA 等大型视觉语言模型 (LVLM) 最近取得了巨大进展。 LLaVA 的模块化架构尤其融合了简单性和效率。最近的工作主要集中在引入更多的预训练和指令调整数据以提高模型的性能 ...

0 0 1 23 2024/10/16 arXiv:2405.11850v1 arthur

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)