大型语言模型(LLMS)的最新进展已大大提高了文本到SQL任务的性能。但是,先前的方法通常依赖于推理时间提供的静态,预处理的数据库信息,这限制了模型充分理解数据库内容的能力。如果没有动态交互,LLM将被限制为固定的,人为提供的上下文,并且无法自主探索基础数据 ...

0 0 0 0 2025/07/04 arXiv:2506.07245v2 qzw

在文本到SQL任务的上下文中,表和列描述对于弥合自然语言和数据库架构之间的差距至关重要。本报告提出了一种方法,用于自动生成有效数据库描述时,当显式描述不可用时。所提出的方法采用双处理方法:一种粗到五个过程,然后进行精细到核的过程 ...

0 0 0 0 2025/07/04 arXiv:2502.20657v1 qzw

视觉语言模型(VLMS)显示出对自动驾驶的希望,但他们与幻觉,效率低下的推理和有限的现实验证的斗争阻碍了准确的感知和稳健的逐步推理。为了克服这一点,我们介绍了AgentThink,这是一个开创性的统一框架,该框架首次将思想链(COT)推理与动态,代理风格的工具调用有关自主驾驶任务。 AgentThink的核心创新包括:(i)结构化数据生成,建立一个自动驾驶工具库,以自动构建结构化的,自我验证的推理数据,以明确合并工具用法,以实现各种驾驶场景; (ii)采用有监督的微调(SFT)的两阶段培训管道,具有相对政策优化(GRPO),以配备VLMS的自主工具调用能力; (iii)代理风格的工具使用评估,引入了一种新型的多工具评估协议,以严格评估模型的工具调用和利用率 ...

0 0 0 0 2025/07/04 arXiv:2505.15298v3 15021163060

幻觉仍然是LLM的持续挑战。抹布旨在通过在上下文中扎根响应来减少幻觉。但是,即使提供上下文,LLMS仍然经常引入不支持的信息或矛盾 ...

0 0 0 0 2025/07/04 arXiv:2505.04847v1 victoriaheiheihei

大型语言模型(LLMS)最近在软件工程任务上提出了许多应用程序,尤其是代码生成的潜力。在当代挑战中,LLMS产生的代码通常遭受不准确和幻觉的影响,需要纠正外部投入。解决这些问题的最新策略是使用模型本身的输入(自称)来完善LLMS生成的代码 ...

0 0 0 0 2025/07/04 arXiv:2408.15658v1 Momomo

本文研究了MLLM的明确思维过程在基于规则的加强微调(RFT)中的作用。我们首先使用可验证的奖励进行微调提出了用于MLLM图像分类的CLS-RL。实验表明CLS-RL明显胜过SFT,并产生交叉概括效应 ...

0 0 0 0 2025/07/04 arXiv:2503.16188v4 麦兜

出现了深度学习方法,旨在转换音频信号,以便听起来好像是在同一房间中与参考记录记录的,并且在音频后期制作和增强现实中都有应用。在这项工作中,我们提出了鳍片,这是一个过滤的噪声塑料网络,该网络直接估算了回响语音中的时域冲动响应(RIR)。我们的域启发的体系结构具有时域编码器和过滤的噪声塑形解码器,该解码器将RIR建模为腐烂过滤的噪声信号的总和,以及直接的声音和早期反射组件 ...

0 1 0 0 2025/07/04 arXiv:2107.07503v1 wenwen

随着对基于语音互动模型的需求不断增加,端到端的口语模型(SLM)已成为有前途的解决方案。尽管这些模型需要全面的世界知识来实现​​有意义和可靠的人类互动,但现有的提问(QA)基准在评估SLM的知识理解方面缺乏,因为它们无法支持端到端的语音评估并说明了各种输入音频条件。为了解决这些局限性,我们提出了VoxeVal,这是一种新型的SpeechQA基准,可通过纯粹的语音相互作用评估SLM的知识理解 ...

0 0 0 0 2025/07/04 arXiv:2501.04962v4 zhangqi33

对于增强现实(AR)中的音频,对用户实际声学环境的了解对于呈现无缝融合到环境的虚拟声音至关重要。由于在实际的AR应用中通常不可行,因此需要从可用的声音来源推断出有关房间的信息。然后,可以使用相同房间的声学品质来渲染其他声音 ...

0 1 0 0 2025/07/04 arXiv:2409.14971v1 wenwen

大型语言模型(LLM)可以解决越来越多的复杂推理任务,同时在基本的数值理解和处理中犯了令人惊讶的错误(例如9.11> 9.9) ...

0 0 0 0 2025/07/04 arXiv:2411.03766v3 liyanan

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)