推断缩放率具有前所未有的推理能力,并以强化学习为引发复杂推理的核心技术。但是,隐藏了最先进的推理LLM的关键技术细节(例如在OpenAI O1博客和DeepSeek R1技术报告中),因此社区仍然很难重现其RL培训结果。我们建议$ \ textbf {d} $ ecoupled剪辑和$ \ textbf {d} $ ynamic s $ \ textbf {a} $ mpling $ \ textbf {p textbf {p} $ olicy $ \ olicy $ \ olicy $ \ textbf {o}使用QWEN2在AIME 2024上实现50点的大规模RL系统 ...

0 1 0 0 2025/03/19 arXiv:2503.14476v1 jesson

开放式摄影多个对象跟踪旨在概括跟踪器在培训期间看不见的类别,从而在各种现实世界中实现其应用程序。但是,现有的开放式摄影跟踪器受其框架结构,隔离框架级别的感知以及模态相互作用不足的限制,这阻碍了其在开放式摄氏分类和跟踪中的性能。在本文中,我们提出了OVTR(使用 Transformer 的端到端开放式唱机多个对象跟踪),这是第一个同时对运动,外观和类别进行建模的端到端开放式视频跟踪器 ...

0 0 0 0 2025/03/18 arXiv:2503.10616v1 jesson

在混合自动驾驶环境中,准确地预测周围车辆的未来轨迹对于自动驾驶汽车(AVS)的安全运行至关重要。在驾驶场景中,车辆的轨迹取决于人类驾驶员的决策过程。但是,现有模型主要集中于数据中固有的统计模式,通常忽略了理解人类驱动因素决策过程的关键方面 ...

0 0 0 0 2025/03/03 arXiv:2502.20084v1 jesson

人们普遍认为,噪声调节是必不可少的,即可成功地进行扩散模型。这项工作挑战了这种信念。在没有噪声调节的情况下,我们研究了对盲图像denoising的研究,我们研究了各种基于脱氧的生成模型 ...

0 0 0 0 2025/02/20 arXiv:2502.13129v1 jesson

交互式决策在诸如自主驾驶之类的应用中至关重要,在自动驾驶中,代理必须在实时计划时推断附近的人类驾驶员的行为。传统的预测框架通常不足或效率低下,因为对人类行为的准确推断需要连续的相互作用而不是孤立的预测。为了解决这个问题,我们提出了一个积极的学习框架,在该框架中,我们严格地得出了预测的信念分布 ...

0 0 0 0 2025/02/17 arXiv:2502.09918v1 jesson

文本到图像扩散模型是一种流行的范式,它通过提供文本提示和随机的高斯噪声来综合个性化图像。尽管人们观察到某些声音是``金色的噪音'',它比其他人可以实现更好的文本图像一致性和更高的人类偏好,但我们仍然缺乏机器学习框架来获得这些金色的声音。为了学习扩散抽样的黄金声音,我们在本文中主要做出了三项贡献 ...

0 0 0 0 2025/02/14 arXiv:2411.09502v4 jesson

近年来,由于道路组件的复杂相互作用,城市自动驾驶汽车(SDV)的运动计划已成为一个流行的问题。为了解决这个问题,许多方法都依赖于通过模仿学习(IL)处理的大规模,人类采样的数据。尽管有效,但仅IL就无法充分处理安全性和可靠性问题 ...

0 0 0 0 2025/02/08 arXiv:2410.22752v1 jesson

拓扑推理对于自主驾驶至关重要,因为它可以全面了解连接性以及车道和交通元素之间的关系。尽管最近的方法显示了使用车辆安装的传感器感知驾驶拓扑的成功,但由于依靠一致的传感器配置捕获的训练数据而阻碍了它们的可扩展性。我们确定可扩展的车道感知和拓扑推理的关键因素是消除该传感器依赖性特征 ...

0 0 0 0 2025/02/08 arXiv:2502.04329v1 jesson

仿真对于自动驾驶的安全评估至关重要,特别是在捕获复杂的交互行为方面。然而,在长尾情况下生成现实且可控的流量场景仍然是一个重大挑战。现有的生成模型受到用户定义的可控性和现实性约束之间目标冲突的困扰,这种冲突在安全关键的环境中会被放大 ...

0 0 0 0 2025/02/07 arXiv:2412.17920v2 jesson

基于深度学习的驾驶计划的最新进步主要集中在精心设计的网络工程上,从而获得了有限的进步。本文通过探索三个基本但不足的方面的基本方法来与传统方法不同:培训政策,数据效率和评估鲁棒性。我们在GPU加速模拟器Waymax上介绍了easychauffeur,这是模仿学习(IL)和增强学习(RL)的可再现和有效计划者 ...

0 0 0 0 2025/02/07 arXiv:2408.16375v1 jesson

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)