我们研究数据集的拓扑$ m = m_a \ cup m_b \ subseteq \ mathbb {r}^d $,代表二进制分类问题中的两个类$ a $ a $ a $ a $ a $ a $ a $ a $ a和$ b $的变化,它通过训练集和近乎区域的通用误差($ y of-Zero nofe of training of training of训练的神经网络)的层面变化($ c) ...
0 0 0 2025/05/27 arXiv:2004.06093v1 boywithoutname
学习领域不变的表示是域概括(DG)的主要方法,在该方法中,我们需要构建一个针对域转移的分类器。但是,以前的基于域 - 不变的方法忽略了类对域的基本依赖性,这是分类准确性和域不变性之间的权衡。因为DG的主要目的是对看不见的域而不是不变性本身进行分类,因此不变性的改善可能会对此权衡下的DG绩效产生负面影响 ...
0 0 0 2025/05/27 arXiv:1904.12543v3 15966829631
视觉语言模型(VLM)在许多直接的多模式任务中都表现出色,但努力将这种能力转化为诸如游戏之类的互动式,视觉丰富的环境中的有效决策。这个``知道的''差距显着限制了它们作为自主代理的潜力,因为领先的VLM经常在简单的游戏中表现出色。为了解决这个问题,我们介绍了VLM-GYM,这是一个精心策划的增强学习(RL)环境,具有带有统一接口和可调节的构图难度的各种视觉游戏,专门设计用于可扩展的多游戏并行训练  ...
0 0 0 2025/05/27 arXiv:2505.13426v1 dm616703
最近的多模式大型语言模型(MLLM)独立地在视觉和音频基准上实现了有希望的性能。但是,这些模型同步处理跨模式信息的能力在很大程度上尚未探索。在本文中,我们介绍:1)Daily-Omni,这是一个视听的询问和回答基准,其中包括来自不同来源的日常生活场景的684个视频,富含音频和视觉信息,并包含1197个多项质量选择QA对,包括6个主要任务; 2)包括自动注释,QA生成和QA优化的Daily-OMNI ...
0 0 0 2025/05/27 arXiv:2505.17862v1 dqyzhwk
将组合优化层集成到神经网络中最近引起了重大的研究兴趣。但是,许多现有的方法缺乏理论保证或在依靠不精确求解器时无法充分执行。这是一个关键的局限性,因为许多操作研究问题都是NP-HARD,通常需要使用基于邻里的本地搜索启发式方法 ...
0 0 0 2025/05/27 arXiv:2505.14240v1 odenkkk
深度学习方法可能难以处理训练数据中看不到的领域变化,这可能会导致它们无法很好地推广到看不见的领域。这导致了对领域概括(DG)的研究关注,该关注旨在旨在模型的分布能力。对抗领域的概括是一种流行的DG方法,但是常规方法(1)难以充分地位,以使当地社区混合在各个领域中; (2)可能会遭受特征空间过度崩溃,这可能威胁到概括性能 ...
0 0 0 2025/05/27 arXiv:2205.04114v1 15966829631
视觉语言动作(VLA)模型通过直接从多模式输入启用端到端决策来具有高级机器人控制。但是,它们紧密耦合的体系结构暴露了新的安全漏洞。与传统的对抗性扰动不同,后门攻击代表了在新兴培训范式下,在新兴的培训范式下,在VLA模型的背景下,在新兴培训范式下尤其是局限性的威胁 ...
0 0 0 2025/05/27 arXiv:2505.16640v1 蔡明方

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)