自动驾驶引起了学术界和工业界的高度关注。为了实现自动驾驶,深度模仿学习(DIL)被认为是最有前途的解决方案之一,因为与手动设计驾驶策略相比,它通过从人类驾驶数据中自动学习复杂的映射来改进自动驾驶系统。然而,现有的 DIL 方法不能很好地跨域泛化,也就是说,在源域数据上训练的网络对目标域数据的泛化能力较差 ...

0 0 0 0 2024/09/25 arXiv:2107.14654v1 chenlei

获得多样化的通用技能仍然是机器人技术面临的一个公开挑战。在这项工作中,我们提出在人类遥控游戏数据之上进行自我监督控制,作为扩大技能学习的一种方式。与传统的任务演示相比,游戏有两个特性使其更具吸引力 ...

0 0 0 0 2024/09/25 arXiv:1903.01973v2 chenlei

将先前任务中获得的知识转移到新环境中的能力是人类学习最重要的机制之一。尽管如此,在部分相似的环境中调整自主行为以重复使用仍然是当前机器人研究中的一个悬而未决的问题。在本文中,我们朝这个方向迈出了一小步,并提出了一个用于学习可转移运动策略的通用框架 ...

0 0 0 0 2024/09/25 arXiv:1608.00627v1 chenlei

尽管人工智能在我们的日常生活中无处不在,但它在迄今为止可能具有最大社会影响的新兴领域——自动驾驶领域才刚刚开始取得进展。在这项工作中,我们讨论了这个重要的主题,并解决了新兴领域的一个关键方面,即预测自动驾驶汽车周围环境的未来状态对于安全和高效运行所必需的问题。我们引入了一种基于深度学习的方法,该方法考虑当前的世界状态并生成每个参与者附近的光栅化表示 ...

0 0 0 0 2024/09/24 arXiv:1808.05819v3 chenlei

城市环境中自动驾驶的决策和规划系统很难设计。目前大多数方法都是手动设计驾驶策略,大规模开发和维护成本可能会很高。相反,通过模仿学习,我们只需要收集数据,计算机就会自动学习和改进驾驶策略 ...

0 0 0 0 2024/09/24 arXiv:1903.00640v2 chenlei

使用记录交互的固定离线数据集的离策略强化学习(RL)是现实世界应用中的一个重要考虑因素。本文使用 DQN 重放数据集研究离线 RL,该数据集包含 DQN 代理在 60 个 Atari 2600 游戏上的整个重放体验。我们证明,即使仅在这个固定数据集上进行训练,最近的离策略深度 RL 算法也优于经过充分训练的 DQN 代理 ...

0 0 1 1 2024/09/24 arXiv:1907.04543v4 chenlei

模仿学习(IL)是一种学习理想自主行为的有吸引力的方法。然而,指导 IL 实现任意目标是很困难的。相比之下,基于规划的算法使用动态模型和奖励函数来实现目标 ...

0 0 0 0 2024/09/24 arXiv:1810.06544v4 chenlei

为了实现自动驾驶的安全高效的规划和控制,我们需要一种能够在长期内实现理想的驾驶质量并保证安全性和可行性的驾驶策略。基于优化的方法,例如模型预测控制(MPC),可以提供此类最优策略,但其计算复杂性通常对于实时实现来说是不可接受的。为了解决这个问题,我们提出了一种快速集成规划和控制框架,该框架将基于学习和优化的方法结合在两层分层结构中 ...

0 0 0 0 2024/09/24 arXiv:1707.02515v1 chenlei

离线强化学习 (RL) 设置(也称为全批量 RL)是从静态数据集中学习策略的,这一点非常引人注目,因为进步使 RL 方法能够利用先前收集的大型数据集,就像人工智能的崛起一样。大型数据集推动了监督学习的成果。然而,现有的在线 RL 基准并不是针对离线环境量身定制的,并且现有的离线 RL 基准仅限于经过部分训练的代理生成的数据,这使得离线 RL 的进展难以衡量。在这项工作中,我们引入了专门为离线设置设计的基准,以与离线 RL 实际应用相关的数据集的关键属性为指导 ...

0 1 0 0 2024/09/24 arXiv:2004.07219v4 chenlei

随着深度学习的广泛采用,强化学习 (RL) 的受欢迎程度急剧增加,可以扩展到以前难以解决的问题,例如通过像素观察玩复杂的游戏、与人类维持对话以及控制机器人代理。然而,由于与环境交互的高成本和危险,仍有大量领域无法被强化学习所访问。离线强化学习是一种专门从先前收集的交互的静态数据集中学习的范例,使得从大型且多样化的训练数据集中提取策略成为可能 ...

0 0 0 0 2024/09/24 arXiv:2203.01387v3 chenlei

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)