使用激光扫描仪(所谓的LiDAR SLAM)对环境的稳健定位和映射对于许多机器人应用至关重要。早期的3D激光雷达大满贯方法通常利用IMU或GNSS传感器的其他信息,以提高定位精度和减轻漂移。后来,高级系统以更高的运行时和复杂性的成本进一步改善了估计 ...
0 0 0 2025/05/22 arXiv:2503.12660v1 cargo
大型语言模型(LLM)通常在需要精确,可验证的计算的数学推理任务上挣扎。尽管从基于结果的奖励获得的加强学习(RL)增强了基于文本的推理,但了解代理如何自主学习利用诸如代码执行(例如代码执行)仍然至关重要。我们研究了基于结果的奖励的RL,以用于工具集成推理,Zerotir,培训基础LLMS,以自发生成和执行Python代码,以解决数学问题,而无需监督的工具使用示例 ...
0 0 0 2025/05/22 arXiv:2505.07773v2 chrisxiong
(vau),旨在自动理解视频中的异常现象,从而实现交通监控和工业制造等各种应用。虽然现有的vau基准主要集中在异常检测和定位上,但我们的重点是更多的实用性,这促使我们提出以下关键问题:“ 发生了什么异常?”,“ 为什么会发生?”以及“这种异常有多严重”这种异常有多严重“ 事件?”。为了寻求这些答案,我们提出了视频异常因果关系理解,(cuva)的综合基准... ...
0 1 0 2025/05/22 arXiv:2405.00181v2 yiyi1
在计算机视觉中,很少有射击学习(FSL)是一个重要且主题的问题,它激发了对从复杂的元学习方法到简单转移学习基线的多种方法进行广泛研究。我们试图推动简单但有效的管道的限制,以进行更现实和实用的图像分类。为此,我们从神经网络体系结构的角度探索了很少的学习学习,以及在不同的数据供应下的三阶段网络更新管道,其中考虑了无监督的外部数据用于预培训,基本类别用于模拟元训练的少量任务,以及用于征用小说任务的元数据 ...
0 0 0 2025/05/22 arXiv:2204.07305v1 2359175938
近年来,随着机器人技术的提高,人类机器人的合作越来越重要。但是,当前的机器人仅凭语音命令才能完全准确地解释人类意图。传统的抓手和吸力系统通常无法与人类自然互动,缺乏先进的操纵功能,并且不适合各种任务,尤其是在非结构化的环境中 ...
0 0 0 2025/05/22 arXiv:2412.10694v1 18801130956
在本文中,我们将重点放在特征学习的问题上,存在于6-DOF GRASP检测的规模不平衡的情况下,并提出了一种新颖的方法,特别是解决了处理小规模样本的困难。提出了多尺度的圆柱体组(MSCG)模块,以通过组合多尺度缸体和全局环境来增强本地几何表示。此外,设计了量表平衡学习(SBL)损失和对象平衡采样(OBS)策略,其中SBL扩大了样品的梯度,其样品的尺度在APRIORI权重较低的情况下,而OBS借助辅 ...
0 0 0 2025/05/22 arXiv:2212.05275v1 18801130956
创建大型、多样化、高质量的机器人操作数据集是迈向更强大、更强大的机器人操作政策的重要基石。然而,创建此类数据集具有挑战性:在不同环境中收集机器人操作数据会带来后勤和安全挑战,并且需要在硬件和人力方面进行大量投资。因此,即使是当今最通用的机器人操纵策略,也大多是根据场景和任务多样性有限的少数环境中收集的数据进行训练的 ...
0 0 0 2025/05/22 arXiv:2403.12945v2 18801130956
物体构成估计,在计算机视觉和机器人技术应用中至关重要,面临着看不见类别的多样性的挑战。我们提出了一种零击方法,以实现类别级别的6-DOF对象姿势估计,该方法利用了输入RGB-D图像的2D和3D通用特征以建立基于语义相似性的对应关系,并且可以将其扩展到不看到的类别,而无需其他模型。我们的方法首先结合有效的2D通用特征,以找到类别内对象之间的稀疏对应关系,并获得初始的粗姿势 ...
0 0 0 2025/05/22 arXiv:2501.02831v1 18801130956

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)