文本到图像扩散模型是一种流行的范式,它通过提供文本提示和随机的高斯噪声来综合个性化图像。尽管人们观察到某些声音是``金色的噪音'',它比其他人可以实现更好的文本图像一致性和更高的人类偏好,但我们仍然缺乏机器学习框架来获得这些金色的声音。为了学习扩散抽样的黄金声音,我们在本文中主要做出了三项贡献 ...
近年来,由于道路组件的复杂相互作用,城市自动驾驶汽车(SDV)的运动计划已成为一个流行的问题。为了解决这个问题,许多方法都依赖于通过模仿学习(IL)处理的大规模,人类采样的数据。尽管有效,但仅IL就无法充分处理安全性和可靠性问题 ...
拓扑推理对于自主驾驶至关重要,因为它可以全面了解连接性以及车道和交通元素之间的关系。尽管最近的方法显示了使用车辆安装的传感器感知驾驶拓扑的成功,但由于依靠一致的传感器配置捕获的训练数据而阻碍了它们的可扩展性。我们确定可扩展的车道感知和拓扑推理的关键因素是消除该传感器依赖性特征 ...
仿真对于自动驾驶的安全评估至关重要,特别是在捕获复杂的交互行为方面。然而,在长尾情况下生成现实且可控的流量场景仍然是一个重大挑战。现有的生成模型受到用户定义的可控性和现实性约束之间目标冲突的困扰,这种冲突在安全关键的环境中会被放大 ...
基于深度学习的驾驶计划的最新进步主要集中在精心设计的网络工程上,从而获得了有限的进步。本文通过探索三个基本但不足的方面的基本方法来与传统方法不同:培训政策,数据效率和评估鲁棒性。我们在GPU加速模拟器Waymax上介绍了easychauffeur,这是模仿学习(IL)和增强学习(RL)的可再现和有效计划者 ...
扩散模型的最新进展在机器人技术方面具有巨大的潜力,从而使环境原始表示形式直接产生了各种和平滑的轨迹。尽管有希望,将扩散模型应用于运动计划,由于它们在执行关键限制(例如避免碰撞和运动可行性)方面的困难,因此仍然具有挑战性。这些限制在多机器人运动计划(MRMP)中变得更加明显,其中多个机器人必须在共享空间中进行协调 ...
信号交叉点上的多机构轨迹预测对于开发有效的智能运输系统和安全的自主驾驶系统至关重要。由于相交场景的复杂性和单车感知的局限性,以车辆为中心的预测方法的性能达到了平稳状态。此外,大多数工作不足以关键的交叉信息,包括交通信号和道路结构引起的行为模式 ...
从人类示威中学习的模仿使机器人能够执行复杂的操纵任务,并最近见证了巨大的成功。但是,这些技术通常很难使行为适应新的偏好或环境变化。为了解决这些限制,我们提出了人类偏好(FDPP)的微调扩散政策 ...
准确预测未来的交通媒介轨迹对于确保安全自动驾驶至关重要。但是,部分观察到的轨迹可以显着降低甚至最新模型的性能。先前的方法通常依靠知识蒸馏将特征从完全观察到的轨迹传递到部分观察到的轨迹 ...
了解道路拓扑对于自动驾驶至关重要。本文介绍了topobda(拓扑拓扑,并引起了可变形的注意),这是一种新颖的方法,通过利用bezier可变形的注意来增强道路拓扑的理解(BDA)。 BDA利用Bezier控制点来驱动可变形的注意机制,从而显着改善了伸长和薄的多线结构(例如车道中心线)的检测和表示 ...