在本文中,我们开发了一个强大,有效的视觉大满贯系统,该系统利用了低阈值,基线线和闭环钥匙帧功能的空间抑制。使用ORB-SLAM2,我们的方法包括立体声匹配,框架跟踪,本地捆绑包调整以及线和点全局束调整。特别是,我们根据基线贡献了重新注射 ...

0 0 0 0 2025/07/04 arXiv:2207.05244v1 康康23

鉴于输入图及其标签/属性,图形学习的几个关键问题,例如查找可解释的子图,图形降解和图形压缩,可以归因于识别原始图的子图的基本问题。该子图应尽可能提供信息,但包含冗余和嘈杂的结构。此问题设置与众所周知的信息瓶颈(IB)原理密切相关,但是,对于不规则的图形数据和图形神经网络(GNNS),研究较少研究 ...

0 0 0 0 2025/07/04 arXiv:2010.05563v1 QingXiang

大型语言模型(LLMS)提供了强大的手段,以利用先验知识在数据有限时进行预测建模。在这项工作中,我们演示了LLM如何使用其压缩世界知识来生成本质上可解释的机器学习模型,即 ...

0 0 0 0 2025/07/04 arXiv:2409.18594v2 waterfall666

强化学习(RL)在提高大语言模型(LLM)的推理能力方面发挥了重要作用。一些研究将RL直接应用于\ textIt {较小}基本模型(称为零RL),并且还取得了显着的进步。但是,在本文中,我们表明,仅使用920个示例,基于基本模型的简单蒸馏方法可以清楚地超过零RL,通常需要更多的数据和计算成本 ...

0 0 0 0 2025/07/04 arXiv:2505.21067v1 sue

图形用户界面(GUI)代理在理解和执行不同平台的用户指令方面取得了长足的进步。然而,将这些说明扎根于精确的界面元素仍然具有挑战性,尤其是在复杂,高分辨率,专业环境中。传统的监督芬特(SFT)方法通常需要大量不同的数据,并且表现出较弱的概括 ...

0 0 0 0 2025/07/04 arXiv:2505.12370v2 qwqw7878asas

检测器对大语模型(LLM)产生的文本的功效很大程度上取决于大规模培训数据的可用性。但是,不需要此类数据的白盒零射击检测器受到LLM生成文本源模型的可访问性的限制。在本文中,我们提出了一种基于这样的观察结果,即从LLM的角度来看,人写的文本通常包含比LLM生成的文本更多的语法错误 ...

0 0 0 0 2025/07/04 arXiv:2405.04286v2 15611250722

我们在连续的3D环境中开发了一个语言引导的导航任务,代理必须执行低级操作以遵循自然语言导航方向。通过位于连续的环境中,此设置可以提取以前工作中隐含的许多假设,这些假设将环境表示为稀疏的全景图,边缘具有与导航性相对应的边缘。具体而言,我们的设置丢弃了已知的环境拓扑,短距离甲骨文导航和完美代理定位的推定 ...

0 0 0 0 2025/07/04 arXiv:2004.02857v2 Alice_ly

时间知识图(TKG)存储从涉及时间的数据中得出的事件。由于事件的时间敏感性,预测事件极具挑战性。此外,先前的TKG完成(TKGC)方法不能同时代表事件的及时性和因果关系 ...

0 0 0 0 2025/07/04 arXiv:2211.16865v2 aaatuzi

多标签分类涉及将多个标签分配给单个输入,由于其广泛的应用,研究和行业的关键领域已成为关键领域。设计有效的损失功能对于为该任务优化深层神经网络至关重要,因为它们会显着影响模型性能和效率。传统的损失功能通常在标签独立性的假设下最大化可能性,可能难以捕获复杂的标签关系 ...

0 0 0 0 2025/07/04 arXiv:2412.00101v2 snowpigppp

机器学习的最新进展,尤其是基础模型的出现,为开发基于技术的解决方案解决社会问题的新机会。但是,当今复杂的AI模型的推理和内部运作对用户不透明,并且对其预测没有任何安全保证。因此,要履行AI的承诺,我们必须应对以下科学挑战:如何开发基于AI的系统不仅准确,表现良好,而且还可以安全且值得信赖?对于控制和机器人技术的自主系统,安全操作的关键性尤为明显,并且是NSF的安全学习系统(SLES)程序的催化剂 ...

0 0 0 0 2025/07/04 arXiv:2506.22492v1 18601752667

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)