基于学习的全身控制器已成为人形机器人的关键驱动力,但大多数现有方法都需要针对机器人的训练。在本文中,我们研究了跨实施例人形控制问题,并表明单一策略可以通过一次性训练在各种人形机器人设计中稳健地泛化。我们介绍了 XHugWBC,一种新颖的跨实体训练框架,它通过以下方式实现通用人形控制:(1)物理一致的形态随机化,(2)跨不同人形机器人的语义对齐观察和动作空间,以及(3)建模形态和动态属性的有效策略架构。 XHugWBC 不与任何特定机器人绑定。相反,它在训练过程中内化了形态和动力学特征的广泛分布。通过从不同的随机实施例中学习运动先验,该策略获得了强大的结构偏差,支持零样本转移到以前未见过的机器人。对十二个模拟人形机器人和七个现实世界机器人的实验证明了所得到的通用控制器的强大泛化性和鲁棒性 ...

0 0 0 0 2026/02/10 arXiv:2602.05791v1 Z1HY11

我们推出 Being-H0.5,这是一种基础视觉-语言-动作 (VLA) 模型,专为跨不同机器人平台的稳健跨实体泛化而设计。虽然现有的 VLA 经常面临形态异质性和数据稀缺的问题,但我们提出了一种以人为中心的学习范式,将人类交互痕迹视为物理交互的通用“母语”。为了支持这一点,我们推出了 UniHand-2.0,这是迄今为止最大的具体预训练方案,包含 30 个不同机器人实施例的超过 35,000 小时的多模式数据。我们的方法引入了统一动作空间,将异构机器人控制映射到语义对齐的插槽中,使低资源机器人能够从人类数据和高资源平台中引导技能。建立在以人为本的基础上,我们设计了统一的顺序建模和多任务预训练范例,以连接人类演示和机器人执行。在架构上,Being-H0.5 采用混合 Transformer 设计,采用新颖的混合流 (MoF) 框架,将共享电机原语与特定实施例的专家解耦。最后,为了使跨实施例策略在现实世界中稳定,我们引入了流形保留门控(Manifold-Preserving Gating),以实现感知转移下的鲁棒性,并引入通用异步分块(Universal Async Chunking),以在具有不同延迟和控制配置文件的实施例之间实现分块控制的通用化。我们凭经验证明,Being-H0.5 在模拟基准上取得了最先进的结果,例如 LIBERO (98.9%) 和 RoboCasa (53.9%),同时还在五个机器人平台上展示了​​强大的跨实体能力 ...

0 0 0 0 2026/01/26 arXiv:2601.12993v1 Z1HY11