关于运动和空间的推理是多个现实世界应用所需的基本认知能力。尽管许多研究强调了大型多模式模型(MLMS)努力推理空间,但它们仅关注静态空间关系,而不是动态的运动和空间意识,即,即 ...

0 0 0 0 2025/07/21 arXiv:2412.07755v2 hx5563

大型语言模型(LLMS)已经证明了机器人技术中有希望的推理能力。但是,它们在多机器人系统中的应用仍然有限,尤其是在处理任务依赖性方面。本文介绍了DART-LLM,这是一个新颖的框架,该框架采用了定向的无环图(DAG)来对任务依赖性进行建模,从而使自然语言指令将自然语言指令分解为协调良好的子任务以进行多机器人执行。 DART-LLM包含四个关键组件:用于依赖性感知的任务分解的问题 - 解答(QA)LLM模块,机器人分配的崩溃函数模块,执行执行的驱动模块以及一个幻想模型(VLM)基于环境感知的对象探测器,用于环境感知,实现最终到达的最终任务执行 ...

0 0 0 0 2025/07/21 arXiv:2411.09022v2 mencius

随着AI能力朝着人类水平的绩效发展,可能会出现自然的过渡,而AI驱动的发展变得比以人为本的方法更有效。通往这种过渡的有前途的途径在于AI-For-ai(AI4AI),它利用AI技术自动化和优化AI系统本身的设计,培训和部署。尽管基于LLM的代理商表明有可能实现AI4AI,但他们通常无法完全利用代理在推理过程中探索解决方案期间积累的经验,从而导致效率低下和次优性能 ...

0 0 0 0 2025/07/21 arXiv:2506.16499v1 yj97419

铰接的3D对象生成对于创建不仅仅是静态的现实,功能性和可交互的虚拟资产是基础。我们介绍了Meshart,这是一种基于分层 Transformer 的方法,可通过干净,紧凑的几何形状生成铰接的3D网格,让人联想到人类制作的3D模型。我们以两个阶段的一部分方式以部分划分的方式进行铰接的网格生成 ...

0 0 0 0 2025/07/21 arXiv:2412.11596v2 happy

阿拉伯语是一种形态上丰富的语言,与英语相比,资源相对较少,语法较少。鉴于这些局限性,阿拉伯语自然语言处理(NLP)任务(例如情感分析(SA),命名实体识别(NER)和问题答案(QA))已被证明非常具有挑战性。最近,随着基于变形金刚的模型激增,基于语言的基于BERT的模型已被证明在语言理解方面非常有效,只要它们在非常大的语料库中进行了预训练 ...

0 0 0 0 2025/07/21 arXiv:2003.00104v4 2486408244

视觉模型(VLM)的最新进展通过增加视觉 Token 的数量来提高性能,这些图形通常比文本 Token 更长。但是,我们观察到,大多数真实的场景不需要如此广泛的视觉 Token 。尽管在与OCR相关任务的一小部分中,性能显着下降,但模型仍然在大多数其他只有1/4分辨率的VQA任务中都能准确 ...

0 0 0 0 2025/07/21 arXiv:2507.13348v1 Barca

当前的大型语言模型(LLMS)的知识编辑方法在传播有关相关事实的连锁反应时努力保持逻辑一致性。我们提出了链接的框架,该框架可以通过LLM逻辑推理功能协同知识衍生的逻辑规则,以实现系统的链条更新。通过自动从结构化知识库中提取逻辑模式并将其与LLMS的内部逻辑对齐,链接者会动态生成和编辑逻辑上连接的知识群集 ...

0 0 0 0 2025/07/21 arXiv:2507.08427v1 aulisa

大型语言模型(LLM)在自然语言处理中表现出了显着的功能。但是,在“知识图”回答任务(KGQA)中,仍然存在回答需要多跳推理的问题的问题。现有方法依赖于实体向量匹配,但是问题的目的是抽象的,很难与特定实体匹配 ...

0 0 0 0 2025/07/21 arXiv:2502.11491v1 DoubleSails

我们介绍了Meshpad,这是一种生成方法,可从草图输入创建3D网格。在艺术家设计的三角网格一代的最新进展为基础上,我们的方法解决了互动网格创建的需求。为此,我们专注于通过将编辑分解为网格区域的“删除”来启用一致的编辑,然后将“添加”新的网格几何形状进行“添加” ...

0 0 0 0 2025/07/21 arXiv:2503.01425v2 happy

最近的研究重点是通过模仿学习来增强较小模型的能力,并利用大型基础模型(LFMS)产生的输出。许多问题影响了这些模型的质量,从浅LFM输出的有限仿真信号等等;小规模同质培训数据;最值得注意的是缺乏严格的评估,导致高估了小型模型的能力,因为它们倾向于模仿样式,而不是LFM的推理过程。为了应对这些挑战,我们开发了ORCA(我们正在与法律团队合作,根据Llama的发布政策公开释放模型权重,该政策将在此HTTPS URL上发布,这是一个130亿个参数模型,该模型学会模仿LFMS的推理过程 ...

0 0 0 0 2025/07/21 arXiv:2306.02707v1 千禧狸花

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)