本文介绍了Artemis,这是一种端到端的自动驾驶框架,将自回归轨迹计划与Experture(MOE)结合在一起。传统的模块化方法患有错误传播,而现有的端到端模型通常采用静态的一弹性推理范例,而这些推理范式不足以捕获环境的动态变化。 Artemis通过顺序生成轨迹航路点来采用不同的方法,保留关键的时间依赖性,同时动态路由特定于场景的查询到专门的专家网络 ...
0 0 0 2025/05/06 arXiv:2504.19580v2 布朗瓶
密集的大语言模型(LLMS)将面临关键效率瓶颈,因为它们都会激活所有参数,无论输入复杂性如何。尽管现有的稀疏方法(静态修剪或动态激活)部分解决了这一问题,但它们要么缺乏对上下文或模型结构需求的适应性,要么缺乏产生过度的计算开销。受人脑的双重过程机制的启发 - 用于骨干的稀疏性和结构重新分析(P600)的预测性编码(N400) - 我们建议Clada,A \ textIt {\ textBf {\  ...
0 0 0 2025/05/06 arXiv:2502.19078v1 libai
大型语言模型(LLM)的快速发展导致了各种行业的LLM代理商广泛部署,包括客户服务,内容生成,数据分析甚至医疗保健。但是,随着越来越多的LLM代理的部署,出现了一个主要问题:这些代理没有标准的方式与外部工具或数据源进行通信。缺乏标准化协议使代理商难以合作或有效地进行扩展,并且限制了他们处理复杂的现实世界任务的能力 ...
0 0 0 2025/05/06 arXiv:2504.16736v2 yangwenjie
最近,自然语言一直是人类机器人相互作用的主要媒介。但是,它固有的缺乏机器人控制空间精度引起了诸如歧义和冗长的挑战。为了解决这些局限性,我们介绍了机器人视觉指导(ROVI),这是一种新颖的范式,可通过以对象为中心的手绘符号表示来指导机器人任务 ...
0 0 0 2025/05/06 arXiv:2505.00693v1 Langston
本文提出了一种学习新型4D体现世界模型的有效方法,该方法预测了3D场景随时间的动态演变,以响应体现的代理的动作,从而提供了空间和时间的一致性。我们建议通过对RGB-DN(RGB,DEPTH和正常)视频进行培训来学习4D世界模型。这不仅通过将详细的形状,配置和时间更改纳入其预测中,超过了传统的2D模型,而且还使我们能够有效地学习具有体现的代理的准确的逆动力学模型 ...
0 0 0 2025/05/06 arXiv:2504.20995v1 Langston
通过提供嵌入到传递给大语言模型 (LLM) 的提示中的上下文信息来一致地生成高质量答案取决于信息检索的质量。随着上下文信息语料库的增长,基于检索增强生成 (RAG) 的问答 (QA) 系统的答案/推理质量会下降。这项工作通过将经典文本分类与大语言模型(LLM)相结合来解决这个问题,从而能够从向量存储中快速检索信息并确保检索信息的相关性 ...
0 0 0 2025/05/06 arXiv:2406.16383v2 simple_666
基础模型通过在大规模数据集上提供了强大的多功能体系结构来彻底改变人工智能。但是,将这些庞大的模型适应特定的下游任务需要微调,这在计算资源中可能非常昂贵。参数有效的微调(PEFT)方法仅通过选择性更新一小部分参数来应对这一挑战 ...
0 0 0 2025/05/06 arXiv:2504.21099v1 chenzhuo-wang
实时语义的可用性大大提高了SLAM系统的核心几何功能,从而实现了许多机器人和AR/VR应用。我们提出了一种从RGB-D序列实时语义映射的新方法,该方法将2D神经网络和一个基于具有3D占用映射的SLAM系统的3D网络结合在一起。分割新帧时,我们会根据可区分渲染从以前的帧中执行潜在的特征重新投影 ...
0 0 0 2025/05/06 arXiv:2306.16585v2 康康23

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)