大型语言模型(LLM)代理人越来越多地利用检索功能的生成(RAG)来改善其反应的事实。但是,实际上,这些系统通常需要处理模棱两可的用户查询以及来自多个来源的潜在相互矛盾的信息,同时也抑制了来自嘈杂或无关紧要的文档的不准确信息。先前的工作通常研究并解决了这些挑战,一次仅考虑一个方面,例如处理歧义或稳健性的噪声和错误信息 ...
0 0 0 2025/04/18 arXiv:2504.13079v1 三点一线
确定代数是准内生性是一个困难的问题。本文中引入了一种有效的方法,即绿色精神套件,以解决此问题。众所周知,当且仅当它承认简单模块的准遗传订单时,代数是准雌性的 ...
0 0 18 2025/04/18 arXiv:2405.02860v1 surenny233
跨域假新闻检测旨在通过跨域转移知识来减轻域的转移并提高检测性能。现有方法根据新闻内容和用户参与从源域转移到目标域。但是,这些方法面临两个主要局限性,阻碍了有效的知识转移和最佳的假新闻检测性能 ...
0 0 0 2025/04/18 arXiv:2502.14403v2 wuyi
多式联运的假新闻检测因其对社会保障的深刻影响而引起了人们的重大关注。尽管现有的方法有助于理解跨模式的一致性,但它们通常无法利用模态特定的表示和明确的差异功能。为了解决这些限制,我们提出了一个多模式反向注意网络(Mian),这是一个新颖的框架,该框架探索了基于新闻内容的固有判别特征,以推动假新闻检测 ...
0 0 0 2025/04/18 arXiv:2502.01699v1 wuyi
本文提出了一种新的方法来产生与目标对象相互作用的人类交互的3D运动,重点是解决综合远程和不同动作的挑战,而现有的自动回归模型或基于路径计划的方法无法实现。我们提出了一个分层生成框架来解决这一挑战。具体而言,我们的框架首先生成一组里程碑,然后综合沿它们的运动 ...
0 0 0 2025/04/17 arXiv:2310.02242v1 陆三七
在本文中,我们为零击对象导航提出了一个新框架。现有的零击对象导航方法促使LLM带有空间封闭的对象的文本,该方法缺乏足够的场景上下文来进行深入推理。为了更好地保留环境信息并充分利用LLM的推理能力,我们建议用3D场景图表示观察到的场景 ...
0 0 0 2025/04/17 arXiv:2410.08189v1 19396386025
跨语言跨模式检索(CCR)旨在根据非英语查询来检索视觉相关的内容,而无需在训练过程中依靠人类标记的跨模式数据对。一种流行的方法涉及利用机器翻译(MT)创建伪并行数据对,并在视觉和非英语文本数据之间建立对应关系。但是,由于视觉和文本之间存在显着的语义差距,以及由预训练的编码器和数据噪声引起的非英语表示的质量较低,因此对它们的表示形式构成了挑战 ...
0 0 0 2025/04/17 arXiv:2409.19961v1 arthur
在本报告中,我们提出了RT-DETRV2,这是改进的实时检测 Transformer (RT-DETR)。 RT-DETRV2建立在先前的最先进的实时检测器RT-Det上,并打开了一组释放宽比的弹性和实用性,并优化了培训策略以实现增强的性能。为了提高灵活性,我们建议在可变形注意的不同尺度上设置不同数量的采样点,以实现解码器的选择性多尺度特征提取 ...
0 0 0 2025/04/17 arXiv:2407.17140v1 per

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)