现有的对象检测模型主要在大规模标记的数据集上训练。但是,新型航空对象类的注释数据很昂贵,因为它耗时,可能需要专家知识。因此,希望在空中图像上研究标签有效的对象检测方法 ...
0 0 0 2025/09/15 arXiv:2402.18233v2 per
视觉模型(VLM)的数据食欲已从今天的数百万到数十亿美元不断扩大,这面临着无法数据质量的站不住脚的权衡,并且不可避免地引入了嘈杂的通信(NC)样本。毫无疑问,这种语义无关的数据显着损害了VLM的性能。先前的努力主要是通过估算精确的一致性来解决这一挑战 ...
0 0 0 2025/09/15 arXiv:2507.03434v1 FOUR_A
对大型语言模型(LLM)的越狱攻击已经证明了各种成功的方法,从而使攻击者操纵模型以产生旨在避免的有害响应。其中,贪婪的协调梯度(GCG)已成为一种普遍有效的方法,可在后缀中优化 Token 以产生可越狱的提示。尽管已经提出了几种改进的GCG变体,但它们都依赖于固定长度后缀 ...
0 0 0 2025/09/15 arXiv:2509.06350v1 hhhhh
推荐系统通常必须最大化主要目标,同时确保辅助系统满足最低阈值或“护栏”。这对于维持一致的用户体验和平台生态系统至关重要,但是尽管正交系统的变化是具有挑战性的,但仍需要手动的超参数调整,但仍需要执行这些护栏。我们介绍了自动约束定位(ACT)框架,该框架自动发现满足这些护栏所需的最少的超参数更改 ...
0 0 0 2025/09/15 arXiv:2509.03661v1 sunhao
蒙版视频建模(例如Videomae)是视频自学学习(SSL)的有效范式。但是,它们主要基于对具有大量时间冗余性的自然视频的重建像素级的细节,从而限制了其语义表示的能力和运动动力学的足够编码。为了解决这些问题,本文通过注入空间和运动语义来介绍一种新颖的SSL方法,用于视频表示学习,称为微笑 ...
0 0 0 2025/09/15 arXiv:2504.00527v1 1939058274
深度学习(DL)研究的最新进展显着影响了财务部门。我们根据限制订单簿(LOB)数据研究了15个最先进的DL模型(SPTP)的鲁棒性和概括性。为了进行这项研究,我们开发了Lobcast,这是一个开源框架,结合了数据预处理,DL模型培训,评估和利润分析 ...
0 0 0 2025/09/15 arXiv:2308.01915v2 wang123123
在大型场景中体现的AI代理通常需要导航才能找到对象。在这项工作中,我们研究了对象导航任务,分层关系对象导航(HRON)的自然出现的变体,其中的目标是找到由层次结构中组织的逻辑谓词指定的对象 - 与家具相关的对象,然后是与房间相关的对象 - 例如在厨房的桌子上找到一个苹果。解决此类任务需要有效的表示,以推理对象关系并将环境中的关系和任务目标中的关系相关联 ...
0 0 0 2025/09/15 arXiv:2306.13760v1 plum
LLM-AS-Gudge已成为人类评估的可扩展替代品,使大型语言模型(LLMS)能够在培训中提供奖励信号。尽管最近的工作探索了多代理辩论等多代理扩展,以提高评估质量,但在这些环境中固有偏见如何表现出来的问题仍未得到充分激励。在这项研究中,我们对四种不同的偏见类型进行了系统分析:位置偏见,详细偏见,经过三重偏见和潮流偏见 ...
0 0 0 2025/09/15 arXiv:2505.19477v2 树叶无声

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)