尽管在异常检测方面取得了重大进展(AD),但现有检测方法针对对抗性攻击的鲁棒性仍然是一个挑战,损害了它们在自动驾驶等关键现实世界中的可靠性。此问题主要来自AD设置,该设置假设训练数据仅限于一组未标记的普通样本,从而使探测器在测试过程中容易受到对抗性异常样本的影响。此外,实施对抗性培训作为保障遇到困难,例如在不访问标签的情况下制定有效的目标功能 ...
0 0 0 2025/03/09 arXiv:2501.15434v1 wu33learn
随着深度学习的快速发展,基于CNN的U形网络已在医学图像细分中成功,并广泛用于各种任务。但是,它们在捕获全球功能方面的局限性阻碍了它们在复杂的细分任务中的性能。视力 Transformer (VIT)的兴起有效地弥补了CNN的缺乏,并促进了基于VIT的U-Networks在医疗图像分割中的应用 ...
0 0 0 2025/03/09 arXiv:2410.15036v1 长空
检索提示的生成(RAG)表明,在指定的语料库内执行提问(QA)任务方面表现出了很高的熟练程度。尽管如此,仍然存在质量检查中抹布的许多故障实例。这些失败不仅归因于大语言模型(LLMS)的局限性;取而代之的是,由于两个局限性,它们主要源于LLM的不准确信息的检索:(1)当前的抹布方法在不考虑语义的情况下分段语料库,因此由于问题与段之间的相关性受损而难以找到相关的上下文 ...
0 0 0 2025/03/09 arXiv:2503.01713v1 my
文本引导的生成扩散模型解锁强大的图像创建和编辑工具。虽然这些已扩展到视频生成,但是当前的方法编辑了现有素材的内容,而保留结构需要为每个输入进行昂贵的重新训练或依赖于跨帧的图像编辑的易行传播。在这项工作中,我们提出了一个结构和内容引导的视频扩散模型,该模型根据所需输出的视觉或文本描述编辑视​​频 ...
0 0 0 2025/03/09 arXiv:2302.03011v1 wonglliam
本文以单个艺术目标为重点介绍面部风格化。这项任务的现有作品通常无法在实现几何变化的同时保留源内容。在这里,我们提出了一种新颖的Styo模型,即 ...
0 0 0 2025/03/09 arXiv:2303.03231v3 mm1111111111111111111
脑电图(EEG)表示学习的自我监督方法面临脑电图固有的三个特定挑战:(1)低信噪比的比例低,挑战了所学的代表质量的挑战,(2)(2)幅度从非常小的幅度到相对较大的因素,例如,较大的因素,例如,较高的差异,较高的模型,较高的模型,即构成较高的模型,构成距离,并构成了较高的态度,并且是在较高的范围内,构成了距离,并且是在较高的范围内,构成了势力,并且是在较大的范围连续值序列中的分割,这可能导致信息不足 ...
0 0 0 2025/03/09 arXiv:2402.17772v2 KevinZonda
本文为区域风格转移领域做出了新的贡献。现有的方法通常会遭受整个图像均匀应用样式的缺点,从而导致风格上的不一致或前景对象扭曲了与前景元素(例如人物)的图像。为了解决这一限制,我们提出了一种新方法,该方法利用分割网络来精确隔离输入图像中的前景对象 ...
0 0 0 2025/03/09 arXiv:2404.13880v4 mm1111111111111111111
在实际识别/分类任务(受各种客观因素的限制)中,通常很难收集培训样本来填补识别器或分类器时的所有课程。一个更现实的场景是开放式识别(OSR),在训练时间内存在不完整的世界知识,并且可以在测试过程中将未知类别提交给算法,要求分类器不仅可以准确地分类所见类,而且还可以有效地与未见的类分类。本文对现有的开放式识别技术进行了全面的调查,涵盖了相关定义,模型,数据集,评估标准和算法比较的各个方面 ...
0 0 0 2025/03/09 arXiv:1811.08581v4 ninelie02

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)