数据驱动的学习具有先进的自动驾驶,但特定于任务的模型由于其狭窄的优化目标以及依赖昂贵的注释数据而困难的情况。我们提出了Drivex,这是一种自我监督的世界模型,从大规模驾驶视频中学习了可通用的场景动态和整体表示(几何,语义和运动)。 Drivex引入了OMNI场景建模(OSM),该模块统一了多模式监督-3D点云预测,2D语义表示和图像生成,以捕获综合场景演变 ...
0 0 0 2025/08/27 arXiv:2505.19239v1 xubiao
准确的短期电力价格预测对于在日益市场上的战略性安排需求和发电竞标至关重要。尽管近年来,数据驱动的技术在实现高预测准确性方面表现出了相当大的能力,但它们在很大程度上依赖于输入协变量的质量。在本文中,我们调查了由于某些竞标区的不同门关闭时间(GCT)而导致的异步出版的价格是否可以提高其他GCT的预测准确性 ...
0 0 0 2025/08/27 arXiv:2507.13250v1 hok888
在机器人技术,游戏和自动驾驶等决策场景中广泛采用的扩散政策能够从演示数据中学习多样化的技能,因为它们的高度代表能力很高。但是,示范数据的次优和有限的覆盖范围可能导致产生亚最佳轨迹甚至灾难性故障的扩散策略。尽管基于加强学习(RL)的微调已经成为解决这些局限性的有前途解决方案,但现有的方法很难有效地将近端政策优化(PPO)适应扩散模型 ...
0 0 0 2025/08/27 arXiv:2505.10482v3 xubiao
存储库级代码完成的检索增强生成(RAG)通常依赖于表面文本相似性,从而导致语义误导,冗余和同质性困扰的结果,同时也无法解决外部符号歧义。为了应对这些挑战,我们介绍了Saracoder,这是一个分层特征优化的检索框架。它的核心分层特征优化模块通过提炼深厚的语义关系,修剪精确的重复物,通过新颖的基于图的指标来评估结构相似性,从而系统地完善候选者,从而根据其拓扑重要性来称重编辑,并将其重新升级的结果进行 ...
0 0 0 2025/08/27 arXiv:2508.10068v1 heyi
端到端的自主驾驶已成为一种有希望的方法,可以在一个框架内统一感知,预测和计划,从而减少信息丢失并提高适应性。但是,现有方法通常依赖于固定和稀疏的轨迹监督,从而限制了它们捕获人类驾驶员自然使用的层次推理过程的能力。为了弥合这一差距,我们提出了一个实时的宗教学习框架,该框架是根据三层人类认知模型在自主驾驶中构建决策的,驾驶策略,驾驶决策和驾驶操作,在这些层面上纳入了视觉语言模型(VLMS),以增强情境 ...
0 0 0 2025/08/27 arXiv:2507.12499v1 xubiao
视觉语言动作(VLA)模型在自主驾驶中表现出了潜力。但是,两个关键的挑战阻碍了它们的发展:(1)现有的VLA架构通常基于开放环设置中的模仿学习,倾向于捕获数据集中的记录行为,从而导致次级和约束性能,(2)近距离训练在高核心传感器上很大程度上与高纤维传感器相关,在较高的式式式屏障上,在某些地方具有重要的态度,在某些地方构成了构成差异和计算范围。在本文中,我们介绍了IRL-VLA,这是一种通过\ te ...
0 0 0 2025/08/27 arXiv:2508.06571v3 xubiao
Chameleon和EMU3等基于 Token 的开创性作品为多模式统一建立了基础,但由于缺乏高级语义,面临高训练计算开销和有限的理解性能的挑战。在本文中,我们介绍了Toklip,这是一种视觉 Token ,它通过对矢量定量(VQ) Token 进行命令来增强理解力,并结合夹子级的语义,同时促进端到端的多模式自动性训练和标准VQ Token 。 Toklip将低级离散的VQ Token 与基于VI ...
0 0 0 2025/08/27 arXiv:2505.05422v2 qzfm
量化预测模型的不确定性对于评估和减轻与数据驱动决策相关的风险至关重要,尤其是在电力市场等动荡的领域。机器学习方法可以提供高度准确的电价预测,这对于告知市场参与者的决策至关重要。但是,这些模型通常缺乏不确定性估计,这限制了决策者避免不必要的风险的能力 ...
0 0 0 2025/08/27 arXiv:2507.15079v1 hok888

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)