我们提出了一种通用运动表示,其中包含基于物理的人形控制的全面运动技能。由于类人机器人的高维性和强化学习固有的困难,先前的方法主要集中于学习小范围运动风格的技能嵌入(例如,运动风格)... ...
深度强化学习(DRL)的发展受益于各种类型游戏环境的出现,这些游戏环境提出了新的挑战性问题,并且可以安全快速地测试新算法,例如棋盘游戏、RTS、FPS和MOBA游戏。然而,许多现有环境缺乏复杂性和灵活性,并假设操作在多代理设置中同步执行,这变得不那么有价值。我们介绍了“狂热篮球”游戏,这是一种新颖的强化学习环境,其中智能体被训练来打篮球游戏 ...
我们展示了 SMPLOlympics,这是一系列物理模拟环境,允许类人机器人参加各种奥林匹克运动项目。由于体育活动的多样性和体力要求,运动模拟为评估和提高学习算法的能力提供了丰富且标准化的测试平台。由于人类多年来一直在这些运动中竞争,因此对于实现更好表现的首选策略也有大量的现有知识 ...
分层强化学习 (RL) 可以通过将策略暂时抽象为多个级别来加速长期决策。在稀疏奖励环境中,技能可以带来有希望的结果,即 ...
街景和广场等公共城市空间为居民服务,并容纳各种充满活力的社会生活。机器人技术和嵌入式人工智能的最新进展使公共城市空间不再是人类的专属。送餐机器人和电动轮椅已开始与行人共用人行道,而各种机器狗和人形机器人最近也出现在街道上 ...
视频游戏中对高质量非玩家角色 (NPC) 的需求很高。手工制作他们的行为是一个劳动密集型且容易出错的工程过程,游戏设计师所受的控制有限。我们建议通过在目标环境中使用模仿学习与人类在环中训练代理来交互地创建此类 NPC 行为 ...
我们能否在不学习任何 3D 人景交互数据的情况下合成 3D 人与场景交互?我们提出了 GenZI,这是第一个生成 3D 人类场景交互的零样本方法。 GenZI 的关键是我们从大型视觉语言模型 (VLM) 中提取交互先验,这些模型已经学习了 2D 人类场景组合的丰富语义空间。给定自然语言描述和 3D 场景中所需交互的粗略点位置,我们首先利用 VLM 来想象将可信的 2D 人类交互修复到场景的多个渲染视图中 ...
我们提出了一种用虚拟人填充 3D 室内场景的新颖方法,虚拟人可以在环境中导航并以逼真的方式与对象交互。现有方法依赖于训练序列,其中包含捕获的人体动作及其与之交互的 3D 场景。然而,此类交互数据成本高昂、难以捕获,并且很难涵盖复杂环境中所有可能的人景交互 ...
识别对手球队实施的关键战术模式并制定有效的应对措施是现代足球的核心。然而,通过算法实现这一点仍然是一个开放的研究挑战。为了解决这一未满足的需求,我们提出了 TacticAI,这是一款与利物浦足球俱乐部领域专家密切合作开发和评估的人工智能足球战术助手 ...
我们提出了一种使用深度强化学习为物理模拟的人形角色重现复杂的多角色交互的方法。我们的方法学习角色的控制策略,不仅模仿单个动作,还模仿角色之间的交互,同时保持平衡并匹配参考数据的复杂性。我们的方法使用基于交互图的新颖奖励公式,该交互图测量交互地标对之间的距离 ...