顺序决策,通常形式化为马尔可夫决策过程(MDP)优化,是人工智能中的一个重要挑战。解决这个问题的两个关键方法是强化学习(RL)和规划。本文对这两个领域的整合进行了调查,即基于模型的强化学习 ...

0 0 0 0 2024/08/08 arXiv:2006.16712v4 chenlei

Transformer 对自然语言处理、计算机视觉和机器人等领域产生了重大影响,与其他神经网络相比,它们提高了性能。本次调查探讨了如何在强化学习(RL)中使用 Transformer,它们被视为解决无法训练、学分分配、缺乏可解释性和部分可观察性等挑战的有前景的解决方案。我们首先提供 RL 的简要领域概述,然后讨论经典 RL 算法的挑战... ...

0 0 0 0 2024/10/01 arXiv:2307.05979v1 chenlei

设计更好的深度网络和更好的强化学习 (RL) 算法对于深度 RL 都很重要。这项工作研究了前者。具体来说,提出了感知和决策交错 Transformer (PDiT)网络,它以一种非常自然的方式级联两个 Transformer :感知 Transformer 通过在补丁级别处理观察来关注\emph{环境感知},而决策者通过以期望回报的历史、感知者的输出和行动为条件来关注\emph{决策} ...

0 0 0 0 2024/08/08 arXiv:2312.15863v1 chenlei

近年来,自动驾驶汽车领域的学术研究非常受欢迎,涉及传感器技术、V2X通信、安全、决策、控制,甚至法律和标准化规则等多个主题。除了经典的控制设计方法之外,人工智能和机器学习方法几乎存在于所有这些领域。研究的另一部分侧重于运动规划的不同层面,例如战略决策、轨迹规划和控制 ...

0 0 0 0 2024/08/06 arXiv:2001.11231v1 chenlei

支持下一代通信网络的无人机(UAV)的自主部署需要高效的轨迹规划方法。我们提出了一种新的端到端强化学习(RL)方法,用于从城市环境中的物联网(IoT)设备收集无人机数据。自主无人机的任务是在有限的飞行时间和避障条件下从分布式传感器节点收集数据 ...

0 0 0 0 2024/08/06 arXiv:2007.00544v2 chenlei

本文介绍了一种基于深度强化学习的自动生成通用决策函数的方法。深度 Q 网络代理在模拟环境中接受训练,以处理卡车拖车组合的速度和车道变更决策。在高速公路驾驶案例中,结果表明该方法生成的代理的性能与常用参考模型的性能相匹配或超过 ...

0 0 0 0 2024/08/05 arXiv:1803.10056v2 chenlei

实时、高性能的 3D 物体检测对于自动驾驶至关重要。最近性能最好的 3D 物体检测器主要依赖于基于点或基于 3D 体素的卷积,这对于机载部署而言计算效率较低。相比之下,基于柱的方法仅使用 2D 卷积,消耗的计算资源较少,但在检测精度方面远远落后于基于体素的方法 ...

0 0 0 0 2024/08/01 arXiv:2205.07403v5 chenlei

在本文中,我们提出了一种基于深度强化学习的新型自主制动系统。所提出的自主制动系统在遇到碰撞风险时,利用传感器获得的障碍物信息,自动决定是否在每个时间步应用制动。制动控制的设计问题被表述为在马尔可夫决策过程(MDP)模型中寻找最优策略,其中状态由障碍物的相对位置和车辆速度给出,动作空间定义为是否踩刹车或不 ...

0 1 2 130 2024/07/31 arXiv:1702.02302v2 chenlei

驾驶员通常会执行变道操作,以遵循一定的路线规划、超越速度较慢的车辆、适应前方合并车道等。然而,不正确的变道行为可能是交通流中断甚至撞车的主要原因。虽然已经提出了许多基于规则的方法来解决自动驾驶的车道变换问题,但由于驾驶环境的不确定性和复杂性,它们往往表现出有限的性能 ...

0 0 1 113 2024/07/31 arXiv:2002.02667v2 chenlei

在本次调查中,我们系统地总结了当前将强化学习(RL)应用于自动驾驶车辆运动规划和控制的研究文献。许多现有的贡献可以归因于管道方法,该方法由许多手工制作的模块组成,每个模块都选择了便于人类解释的功能。然而,由于缺乏系统级优化,这种方法并不能自动保证最大性能 ...

0 0 1 62 2024/07/30 arXiv:2105.14218v2 chenlei

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)