有效的本地化在许多现代化的地面车辆(UGV)和无人驾驶汽车(UAVS)的现代应用中起着至关重要的作用,这将有助于改善控制,安全性,电力经济性等。无处不在的5G NR(新无线电)蜂窝网络将为增强UAV和UGV的本地化提供新的机会。在本文中,我们回顾了基于射频(RF)的定位方法 ...
0 0 0 2025/04/22 arXiv:2212.05126v3 ypeng
具有较长上下文功能的大型语言模型(LLM)是自然语言处理和计算生物学中复杂任务的组成部分,例如文本生成和蛋白质序列分析。但是,直接在非常长的情况下培训LLM需要大量的GPU资源和增加的记忆力,从而导致更高的成本和更高的复杂性。通过下游填充或适应引入长上下文功能的替代方法会施加重大的设计限制 ...
0 0 0 2025/04/22 arXiv:2408.16978v1 白日衣衫尽
我们介绍了一个新颖的框架,用于建模运动毛单程视频输入的高保真,动画3D人体化身。运动模糊在现实世界动态视频捕获中普遍存在,尤其是由于3D人体化身建模中的人类运动。现有方法要么(1)假设尖锐的图像输入,无法解决运动模糊引入的细节损失,要么(2)主要考虑通过摄像机运动来模糊,忽略了人类运动模糊,这在动画化的化身中更常见 ...
0 0 0 2025/04/22 arXiv:2501.13335v2 lzyuan625
随着对效率的需求,信息检索开发了一个稀疏检索的分支,进一步朝着无推理的检索前进,其中文档在索引时间内编码,并且没有查询模型推导。现有的稀疏检索模型依赖于拖律的正则化来进行稀疏,而该机制最初是为暹罗编码器设计的,但在不对称的无推理场景中被认为是次优的。以前的尝试适应无推理方案的尝试已限于基于规则的方法,从而使稀疏方法的潜力在很大程度上没有探索 ...
0 0 0 2025/04/22 arXiv:2504.14839v1 fc
工具调用通过集成外部工具改变了大型语言模型(LLM)应用程序,显着增强了它们在不同任务中的功能。然而,这种集成也引入了新的安全漏洞,特别是LLM的工具调度机制,尚未得到广泛研究。为了填补这一空白,我们提出了 ToolCommander,这是一种新颖的框架,旨在通过对抗性工具注入来利用 LLM 工具调用系统中的漏洞 ...
0 0 0 2025/04/22 arXiv:2412.10198v2 hhhhh
图像理解的最新进步受益于广泛使用Web图像文本对。但是,尽管有大量的Web视频文本数据,视频理解仍然是一个挑战。这个困难主要是由于视频的固有复杂性和最近在Web收集的视频TEXT数据集中的效率低下的语言监督引起的 ...
0 0 0 2025/04/22 arXiv:2405.13911v2 麦兜
音频视频分割(AVS)任务旨在使用音频提示在视觉空间中进行启发对象。但是,在这项工作中,人们认识到,以前的AVS方法非常依赖于与听觉对象相关的有害细分偏好,而不是精确的音频指导。我们认为,主要原因是,与视觉相比,音频缺乏强大的语义,尤其是在多源的声音场景中,导致视觉空间的音频指导较弱 ...
0 0 0 2025/04/22 arXiv:2407.10947v1 iris
一类视频异常检测的最新努力是利用扩散模型并将任务视为一代问题,在该问题中,训练扩散模型以专门恢复正常模式,从而将异常模式报告为异常值。然而,现有尝试忽略了异常的各种形态,并且无论监视视频中的异常对象通常相对较小,都可以在功能水平上预测正常样本。为了解决这个问题,提出了一种基于补丁的新型扩散模型,专门设计用于捕获细粒的本地信息 ...
0 0 0 2025/04/22 arXiv:2412.09026v1 qzfm

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)