面部操纵技术已取得了重大进步,对安全和社会信任提出了严重的挑战。最近的著作表明,利用多模式模型可以增强面部伪造检测的概括和解释性。但是,现有的注释方法,无论是通过人类标签还是直接多模式大语模型(MLLM)产生,通常会遭受幻觉问题的困扰,导致文本描述不准确,尤其是对于高质量的伪造 ...
0 0 0 2025/04/10 arXiv:2502.20698v1 13080420360
多模式大语言模型(MLLM)的惊人突破已经需要新的基准测试来定量评估其能力,揭示其局限性并指出未来的研究方向。但是,在遥感(RS)的背景下,这是具有挑战性的,因为图像具有超高分辨率,结合了极其复杂的语义关系。现有的基准通常比现实世界中的RS场景采用的图像大小要小,注释质量有限,并且认为评估尺寸不足 ...
0 0 0 2025/04/10 arXiv:2503.23771v1 dm616703
在自然和社会科学中,图形结构的数据无处不在,最近已证明图形神经网络(GNN)可有效解决图形数据的预测和推理问题。在本文中,我们提出并证明可以将GNN应用于解决组合优化(CO)问题。 CO涉及在通常很大的离散解决方案空间上优化功能 ...
0 0 0 2025/04/10 arXiv:2401.05610v1 我爱吃鸡腿
人类注释是一项耗时的任务,需要大量的努力。为了解决这个问题,交互式数据注释利用注释模型为人类批准或纠正提供建议。但是,经过有限标记数据训练的注释模型容易产生错误的建议,从而导致额外的人为校正 ...
0 0 0 2025/04/10 arXiv:2405.11912v2 zl1994
大规模知识图提供了人类知识的结构化表示。但是,由于不可能收集所有知识,因此知识图通常是不完整的。基于现有事实的推理铺平了一种发现缺失事实的方法 ...
0 0 0 2025/04/10 arXiv:2112.06189v2 duanqi
人造神经网络在依次接受多个任务训练时遭受灾难性遗忘。为了克服这个问题,我们提出了一种基于任务条件的超级核武器的新颖方法,即 ...
0 0 0 2025/04/10 arXiv:1906.00695v4 wide-sky
任何模型(SAM)和剪辑的细分市场都是显着的视觉基础模型(VFM)。 SAM是一个迅速驱动的分段模型,在各种域中的细分任务中出色,而剪辑以其零射击识别能力而闻名。但是,在医学图像细分中尚未探索它们的统一潜力 ...
0 0 0 2025/04/10 arXiv:2404.06362v2 zhouzhengjun
概念建议旨在提出下一个概念,以供学习者根据知识状态和人类知识系统进行研究。尽管可以使用知识追踪模型来预测知识状态,但以前的方法并未有效地将人类知识系统整合到设计这些教育模型的过程中。在快速发展的大语言模型(LLM)的时代,许多领域已经开始使用LLM生成和编码文本,从而引入外部知识 ...
0 0 0 2025/04/10 arXiv:2405.12442v1 qweasdzxc

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)