多模式大型语言模型(MLLM)在各种视觉的任务中都表现出了很强的性能,但是它们的内部处理动力仍然没有得到充实的态度。在这项工作中,我们引入了一个探测框架,以系统地分析MLLM如何处理跨层的视觉和文本输入。我们训练线性分类器以预测细粒的视觉类别(e ...
0 0 0 2025/09/01 arXiv:2508.20279v1 haoyi199815
检索提示的生成(RAG)表明,在指定的语料库内执行提问(QA)任务方面表现出了很高的熟练程度。尽管如此,仍然存在质量检查中抹布的许多故障实例。这些失败不仅归因于大语言模型(LLMS)的局限性;取而代之的是,由于两个局限性,它们主要源于LLM的不准确信息的检索:(1)当前的抹布方法在不考虑语义的情况下分段语料库,因此由于问题与段之间的相关性受损而难以找到相关的上下文 ...
0 0 0 2025/09/01 arXiv:2503.01713v3 lin3
大型语言模型(LLM)为自适应智能代理的发展做出了巨大贡献,并被定位为实现通用人工智能(AGI)的重要途径。然而, LLM 很容易产生事实上不正确的信息,并且经常产生破坏其可靠性的“幻影”内容,这对其在现实场景中的部署构成了严峻的挑战。通过结合外部数据库和信息检索机制来增强 LLM 是一条有效的途径 ...
0 0 0 2025/09/01 arXiv:2408.07611v2 jifen240
值得信赖的AI是强大的自动驾驶汽车部署。尽管端到端方法直接从原始数据中得出控制命令,但解释这些决策仍然具有挑战性,尤其是在复杂的城市场景中。这主要归因于具有非线性决策界限的非常深的神经网络,这使得掌握AI驱动决策背后的逻辑变得具有挑战性 ...
0 0 0 2025/09/01 arXiv:2508.18898v1 liujie
由于稀疏,安全关键的接触和纯粹学到的政策的脆弱性,穿越狭窄的光束对于类人动物具有挑战性。我们提出了一个物理接地的两阶段框架,该框架将XCOM/LIPM脚步模板与轻质残留计划器和简单的低级跟踪器融合在一起。第1阶段在平坦的地面上进行了训练:跟踪器通过在没有任何手工制作的中心线锁定的情况下向启发式脚步添加小的随机扰动来实现遵循脚步目标,从而获得稳定的接触时间表和强大的目标追踪跟踪 ...
0 0 1 2025/09/01 arXiv:2508.20661v2 lrk
在本文中,我们研究下一个篮子推荐问题。最近的方法使用不同的方法来实现更好的性能。但是,其中许多没有使用有关预测时间和篮子之间时间间隔的信息 ...
0 0 0 2025/09/01 arXiv:2307.16297v1 milimiko
作为突出的数据模式任务,时间序列预测在不同的应用程序中起关键作用。随着大语言模型(LLM)的显着进步,LLMs作为时间序列建模的基础体系结构的采用引起了人们的重大关注。尽管现有模型取得了一定的成功,但它们很少在预处理范式中既有模型的时间和频率特征,从而导致复杂时间序列的预测中的次优性能,这需要建模周期性和先前的信号模式知识 ...
0 0 0 2025/09/01 arXiv:2507.06502v1 dlightawn
3d物体检测中的漏报(fn)(例如,缺少对行人、车辆或其他障碍物的预测)可能会导致自动驾驶中出现潜在的危险情况... ...
0 1 11 2025/09/01 arXiv:2308.04556v1 sswwpplyy

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)