对现代通才政策的全面,公正和可比较的评估是一个独特的挑战:机器人基准测试的现有方法通常依赖于重型标准化,要么通过指定固定的评估任务和环境,要么通过主机进行集中的“机器人挑战”,并且不需要在整个任务和环境中评估通用策略。在这项工作中,我们提出了Roboarena,这是一种可扩展评估通才机器人政策的新方法。我们建议在分布式评估者网络上进行群源评估,而不是围绕固定任务,环境或位置进行标准化评估 ...

0 1 0 0 2025/06/30 arXiv:2506.18123v1 晚餐杀手

从人类示威中学到的机器人控制政策在许多现实世界中都取得了令人印象深刻的结果。但是,在最初表现不满意的情况下,就像新型的开放世界环境一样,这种行为克隆(BC)策略通常需要收集其他人类示范以进一步改善其行为 - 这是一个昂贵且耗时的过程。相比之下,增强学习(RL)具有实现自动在线政策改进的希望,但由于通常需要的样本数量大量,通常无法实现这一目标 ...

0 1 0 0 2025/06/30 arXiv:2506.15799v2 晚餐杀手

我们使用配备有手臂的腿部机器人(即腿部的机车操作)研究了移动操作的问题。机器人腿通常用于活动性,但通过进行全身控制提供了一个机会来扩大操纵功能。也就是说,机器人可以同时控制腿部和手臂以扩展其工作区 ...

0 0 0 0 2025/06/29 arXiv:2403.16967v5 晚餐杀手

我们如何使用周围的环境环境教人类机器人攀登楼梯并坐在椅子上?可以说,最简单的方法是仅向他们展示人类运动视频并将其喂给人形生物。我们介绍了VideoMimic,这是一种真正到现实的管道,挖掘了日常视频,共同重建了人类和环境,并为人类机器人制定了执行相应技能的人形机器人的全身控制策略。我们展示了我们对真实类人机器人的管道的结果,显示出稳健,可重复的上下文控制,例如楼梯上升和下降,坐姿和站立,坐在椅子和长凳上,以及其他动态的全身技能,全部来自单一的政策,以环境和全球根命令为条件 ...

0 0 0 0 2025/06/29 arXiv:2505.03729v3 晚餐杀手

人形机车操作具有日常服务和工业任务的变革潜力,但通过3D最终效应力相互作用实现了精确的,可靠的全身控制,仍然是一个重大挑战。先前的方法通常仅限于轻巧的任务或四倍/轮式平台。为了克服这些局限性,我们提出了Falcon,这是一种基于双重加强学习的框架,用于强大的力适应性人型人体机器人的操作 ...

0 0 0 0 2025/06/29 arXiv:2505.06776v1 晚餐杀手

许多现实世界的操纵任务包括一系列彼此不同的子任务。如此长的马,复杂的任务突出了具有适应性和多功能性的灵巧手的潜力,能够在不同的功能模式之间无缝过渡,而无需重新抓取或外部工具。然而,由于灵巧的手和长马式任务的复杂组成动力学的高维作用空间而引起的挑战 ...

0 0 0 0 2025/06/27 arXiv:2309.00987v2 晚餐杀手

从人类示威中学到的机器人控制政策在许多现实世界中都取得了令人印象深刻的结果。但是,在最初表现不满意的情况下,就像新型的开放世界环境一样,这种行为克隆(BC)策略通常需要收集其他人类示范以进一步改善其行为 - 这是一个昂贵且耗时的过程。相比之下,增强学习(RL)具有实现自动在线政策改进的希望,但由于通常需要的样本数量大量,通常无法实现这一目标 ...

0 0 0 0 2025/06/26 arXiv:2506.15799v1 晚餐杀手

大型视觉动作(VLA)模型显示出体现AI的显着潜力。但是,由于对分配变化的复合错误的敏感性,他们通过监督微调(SFT)限制了概括的主要培训。强化学习(RL)通过试用和错误为任务目标进行优化,为克服这些局限性提供了一条途径,但是与SFT相比,缺乏对VLA的特定概括益处的系统理解 ...

0 0 0 0 2025/06/26 arXiv:2505.19789v2 晚餐杀手

受LLM最近成功的启发,人类运动理解领域已越来越多地转向发展大型运动模型。尽管有一些进展,但目前的努力远没有达到真正的通才模型,这主要是由于缺乏大量高质量数据。为了解决这一差距,我们提出了MotionLib,这是第一个用于运动生成的百万级数据集,该数据集至少比现有的同行大约15美元$ \ times $ $,并且具有层次结构的文本描述 ...

0 0 0 0 2025/06/23 arXiv:2410.03311v3 晚餐杀手

深度强化学习(DEEP RL)具有自动化复杂控制器的自动化的希望,该控制器可以将感觉输入直接映射到低级动作。在机器人运动的领域中,深RL可以通过最小的工程来实现学习运动技能,而没有明确的机器人动力学模型。不幸的是,将深度RL应用于现实世界的机器人任务非常困难,这主要是由于样本复杂性和对超参数的敏感性差 ...

0 0 0 0 2025/06/23 arXiv:1812.11103v3 晚餐杀手