jesson的文档

jesson

个性签名 ...

Dual Control for Interactive Autonomous Merging with Model Predictive Diffusion

交互式决策在诸如自主驾驶之类的应用中至关重要，在自动驾驶中，代理必须在实时计划时推断附近的人类驾驶员的行为。传统的预测框架通常不足或效率低下，因为对人类行为的准确推断需要连续的相互作用而不是孤立的预测。为了解决这个问题，我们提出了一个积极的学习框架，在该框架中，我们严格地得出了预测的信念分布 ...

0 0 0 0 2025/02/17 arXiv:2502.09918v1 jesson

Golden Noise for Diffusion Models: A Learning Framework

文本到图像扩散模型是一种流行的范式，它通过提供文本提示和随机的高斯噪声来综合个性化图像。尽管人们观察到某些声音是``金色的噪音''，它比其他人可以实现更好的文本图像一致性和更高的人类偏好，但我们仍然缺乏机器学习框架来获得这些金色的声音。为了学习扩散抽样的黄金声音，我们在本文中主要做出了三项贡献 ...

0 0 0 0 2025/02/14 arXiv:2411.09502v4 jesson

SoftCTRL: Soft conservative KL-control of Transformer Reinforcement Learning for Autonomous Driving

近年来，由于道路组件的复杂相互作用，城市自动驾驶汽车（SDV）的运动计划已成为一个流行的问题。为了解决这个问题，许多方法都依赖于通过模仿学习（IL）处理的大规模，人类采样的数据。尽管有效，但仅IL就无法充分处理安全性和可靠性问题 ...

0 0 0 0 2025/02/08 arXiv:2410.22752v1 jesson

SMART: Advancing Scalable Map Priors for Driving Topology Reasoning

拓扑推理对于自主驾驶至关重要，因为它可以全面了解连接性以及车道和交通元素之间的关系。尽管最近的方法显示了使用车辆安装的传感器感知驾驶拓扑的成功，但由于依靠一致的传感器配置捕获的训练数据而阻碍了它们的可扩展性。我们确定可扩展的车道感知和拓扑推理的关键因素是消除该传感器依赖性特征 ...

0 0 0 0 2025/02/08 arXiv:2502.04329v1 jesson

Causal Composition Diffusion Model for Closed-loop Traffic Generation

仿真对于自动驾驶的安全评估至关重要，特别是在捕获复杂的交互行为方面。然而，在长尾情况下生成现实且可控的流量场景仍然是一个重大挑战。现有的生成模型受到用户定义的可控性和现实性约束之间目标冲突的困扰，这种冲突在安全关键的环境中会被放大 ...

0 0 0 0 2025/02/07 arXiv:2412.17920v2 jesson

EasyChauffeur: A Baseline Advancing Simplicity and Efficiency on Waymax

基于深度学习的驾驶计划的最新进步主要集中在精心设计的网络工程上，从而获得了有限的进步。本文通过探索三个基本但不足的方面的基本方法来与传统方法不同：培训政策，数据效率和评估鲁棒性。我们在GPU加速模拟器Waymax上介绍了easychauffeur，这是模仿学习（IL）和增强学习（RL）的可再现和有效计划者 ...

0 0 0 0 2025/02/07 arXiv:2408.16375v1 jesson

Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models

扩散模型的最新进展在机器人技术方面具有巨大的潜力，从而使环境原始表示形式直接产生了各种和平滑的轨迹。尽管有希望，将扩散模型应用于运动计划，由于它们在执行关键限制（例如避免碰撞和运动可行性）方面的困难，因此仍然具有挑战性。这些限制在多机器人运动计划（MRMP）中变得更加明显，其中多个机器人必须在共享空间中进行协调 ...

0 0 0 0 2025/02/07 arXiv:2502.03607v1 jesson

Knowledge-Informed Multi-Agent Trajectory Prediction at Signalized Intersections for Infrastructure-to-Everything

信号交叉点上的多机构轨迹预测对于开发有效的智能运输系统和安全的自主驾驶系统至关重要。由于相交场景的复杂性和单车感知的局限性，以车辆为中心的预测方法的性能达到了平稳状态。此外，大多数工作不足以关键的交叉信息，包括交通信号和道路结构引起的行为模式 ...

0 0 0 0 2025/02/07 arXiv:2501.13461v1 jesson

FDPP: Fine-tune Diffusion Policy with Human Preference

从人类示威中学习的模仿使机器人能够执行复杂的操纵任务，并最近见证了巨大的成功。但是，这些技术通常很难使行为适应新的偏好或环境变化。为了解决这些限制，我们提出了人类偏好（FDPP）的微调扩散政策 ...

0 0 0 0 2025/02/06 arXiv:2501.08259v1 jesson

Target-driven Self-Distillation for Partial Observed Trajectories Forecasting

准确预测未来的交通媒介轨迹对于确保安全自动驾驶至关重要。但是，部分观察到的轨迹可以显着降低甚至最新模型的性能。先前的方法通常依靠知识蒸馏将特征从完全观察到的轨迹传递到部分观察到的轨迹 ...

0 0 0 0 2025/02/06 arXiv:2501.16767v1 jesson