追踪现实世界中一般全身运动的能力是构建通用人形机器人机器人的有用方法。但是,由于动议的时间和运动学多样性,政策能力以及上部和下部协调的难度,实现这一目标可能具有挑战性。为了解决这些问题,我们提出了GMT,GMT是一个通用且可扩展的运动跟踪框架,该框架训练单个统一的政策,以使人形机器人能够跟踪现实世界中的各种动议 ...
由于各种运动需求和数据冲突,实现对类人形机器人的一般敏捷全身控制仍然是一个重大挑战。尽管现有的框架在培训单运动特定政策方面表现出色,但由于控制要求冲突和数据分布不匹配,他们努力跨越高度不同的行为。在这项工作中,我们提出了Bumblebee(BB),这是一个专家学习框架,结合了运动聚类和SIM卡对现实的改编以克服这些挑战 ...
人形机器人有望通过模仿人类行为来获得各种技能。但是,即使有微妙的奖励和课程设计,现有算法只能跟踪平滑,低速的人类动作。本文提出了一个基于物理的人形控制框架,旨在掌握高度动态的人类行为,例如功夫和通过多步运动处理和自适应运动跟踪而跳舞 ...
人类的行为从根本上是通过视觉感知来塑造的 - 我们与世界互动的能力取决于积极收集相关信息并相应地适应我们的运动。诸如搜索物体,到达和手眼协调的行为自然而然地从我们的感觉系统的结构中出现。受这些原则的启发,我们引入了感知性灵巧控制(PDC),这是一种通过模拟的人形生物进行视觉驱动的灵态全身控制的框架 ...
在这项工作中,我们研究了离线增强学习(RL)算法的可伸缩性。原则上,真正可扩展的离线RL算法应该能够解决任何给定的问题,无论其复杂性如何,给定足够的数据,计算和模型容量。我们使用比典型的离线RL数据集大的数据集对当前的离线RL算法与当前的离线RL算法是否符合这一诺言 ...
视觉深度强化学习(RL)使机器人可以从视觉输入中获取技能以进行非结构化任务。但是,当前算法的样本效率低,限制了其实际适用性。在这项工作中,我们介绍了导师,该方法可以改善RL代理的体系结构和优化 ...
在现实世界的任务中实现人类水平的速度和性能是机器人研究界的北极星。这项工作朝着这一目标迈出了一步,并提出了第一个在竞技乒乓球比赛中达到业余人类水平表现的学习型机器人代理。乒乓球是一项对体力要求很高的运动,需要人类运动员经过多年的训练才能达到高水平的熟练程度 ...
由于高维和非凸度,使用全阶动力学模型进行腿部机器人的实时最佳控制具有挑战性。因此,非线性模型预测控制(NMPC)方法通常仅限于减少阶模型。基于抽样的MPC在非凸的甚至不连续的问题中都显示出潜力,但通常会产生具有较高方差的次优溶液,这限制了其在高维运动中的应用 ...
人形机器人旨在执行各种机车操作任务。但是,由于其高维和不稳定的动态以及任务的复杂接触性质,他们面临挑战。基于模型的最佳控制方法提供了精确和系统的控制,但受到高计算复杂性和准确的接触感应的限制 ...
以全身方式对类人生物机器人进行远程操作,这标志着发展通用机器人智能的基本步骤,人类运动为控制所有自由程度提供了理想的界面。然而,大多数当前的类人动物远距离系统无法实现协调的全身行为,通常将自己限制在孤立的运动或操纵任务上。我们介绍了通过全身运动模仿的人形动物近视系统的远程工作全身模仿系统(Twist) ...