晚餐杀手的文档

Scaling Large Motion Models with Million-Level Human Motions

受LLM最近成功的启发，人类运动理解领域已越来越多地转向发展大型运动模型。尽管有一些进展，但目前的努力远没有达到真正的通才模型，这主要是由于缺乏大量高质量数据。为了解决这一差距，我们提出了MotionLib，这是第一个用于运动生成的百万级数据集，该数据集至少比现有的同行大约15美元$ \ times $ $，并且具有层次结构的文本描述 ...

0 0 0 0 2025/06/23 arXiv:2410.03311v3 晚餐杀手

Learning to Walk via Deep Reinforcement Learning

深度强化学习（DEEP RL）具有自动化复杂控制器的自动化的希望，该控制器可以将感觉输入直接映射到低级动作。在机器人运动的领域中，深RL可以通过最小的工程来实现学习运动技能，而没有明确的机器人动力学模型。不幸的是，将深度RL应用于现实世界的机器人任务非常困难，这主要是由于样本复杂性和对超参数的敏感性差 ...

0 0 0 0 2025/06/23 arXiv:1812.11103v3 晚餐杀手

GMT: General Motion Tracking for Humanoid Whole-Body Control

追踪现实世界中一般全身运动的能力是构建通用人形机器人机器人的有用方法。但是，由于动议的时间和运动学多样性，政策能力以及上部和下部协调的难度，实现这一目标可能具有挑战性。为了解决这些问题，我们提出了GMT，GMT是一个通用且可扩展的运动跟踪框架，该框架训练单个统一的政策，以使人形机器人能够跟踪现实世界中的各种动议 ...

0 0 0 0 2025/06/18 arXiv:2506.14770v1 晚餐杀手

From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots

由于各种运动需求和数据冲突，实现对类人形机器人的一般敏捷全身控制仍然是一个重大挑战。尽管现有的框架在培训单运动特定政策方面表现出色，但由于控制要求冲突和数据分布不匹配，他们努力跨越高度不同的行为。在这项工作中，我们提出了Bumblebee（BB），这是一个专家学习框架，结合了运动聚类和SIM卡对现实的改编以克服这些挑战 ...

0 0 0 0 2025/06/18 arXiv:2506.12779v1 晚餐杀手

KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills

人形机器人有望通过模仿人类行为来获得各种技能。但是，即使有微妙的奖励和课程设计，现有算法只能跟踪平滑，低速的人类动作。本文提出了一个基于物理的人形控制框架，旨在掌握高度动态的人类行为，例如功夫和通过多步运动处理和自适应运动跟踪而跳舞 ...

0 0 1 1 2025/06/18 arXiv:2506.12851v1 晚餐杀手

Emergent Active Perception and Dexterity of Simulated Humanoids from Visual Reinforcement Learning

人类的行为从根本上是通过视觉感知来塑造的 - 我们与世界互动的能力取决于积极收集相关信息并相应地适应我们的运动。诸如搜索物体，到达和手眼协调的行为自然而然地从我们的感觉系统的结构中出现。受这些原则的启发，我们引入了感知性灵巧控制（PDC），这是一种通过模拟的人形生物进行视觉驱动的灵态全身控制的框架 ...

0 0 0 0 2025/06/18 arXiv:2505.12278v1 晚餐杀手

Horizon Reduction Makes RL Scalable

在这项工作中，我们研究了离线增强学习（RL）算法的可伸缩性。原则上，真正可扩展的离线RL算法应该能够解决任何给定的问题，无论其复杂性如何，给定足够的数据，计算和模型容量。我们使用比典型的离线RL数据集大的数据集对当前的离线RL算法与当前的离线RL算法是否符合这一诺言 ...

0 0 0 0 2025/06/07 arXiv:2506.04168v1 晚餐杀手

MENTOR: Mixture-of-Experts Network with Task-Oriented Perturbation for Visual Reinforcement Learning

视觉深度强化学习（RL）使机器人可以从视觉输入中获取技能以进行非结构化任务。但是，当前算法的样本效率低，限制了其实际适用性。在这项工作中，我们介绍了导师，该方法可以改善RL代理的体系结构和优化 ...

0 0 0 0 2025/06/05 arXiv:2410.14972v2 晚餐杀手

Achieving Human Level Competitive Robot Table Tennis

在现实世界的任务中实现人类水平的速度和性能是机器人研究界的北极星。这项工作朝着这一目标迈出了一步，并提出了第一个在竞技乒乓球比赛中达到业余人类水平表现的学习型机器人代理。乒乓球是一项对体力要求很高的运动，需要人类运动员经过多年的训练才能达到高水平的熟练程度 ...

0 0 0 0 2025/05/27 arXiv:2408.03906v3 晚餐杀手

Full-Order Sampling-Based MPC for Torque-Level Locomotion Control via Diffusion-Style Annealing

由于高维和非凸度，使用全阶动力学模型进行腿部机器人的实时最佳控制具有挑战性。因此，非线性模型预测控制（NMPC）方法通常仅限于减少阶模型。基于抽样的MPC在非凸的甚至不连续的问题中都显示出潜力，但通常会产生具有较高方差的次优溶液，这限制了其在高维运动中的应用 ...

0 0 0 0 2025/05/26 arXiv:2409.15610v1 晚餐杀手