arxiv的文档

arxiv 南京

个性签名 ...

SDE-SQL: Enhancing Text-to-SQL Generation in Large Language Models via Self-Driven Exploration with SQL Probes

大型语言模型（LLMS）的最新进展已大大提高了文本到SQL任务的性能。但是，先前的方法通常依赖于推理时间提供的静态，预处理的数据库信息，这限制了模型充分理解数据库内容的能力。如果没有动态交互，LLM将被限制为固定的，人为提供的上下文，并且无法自主探索基础数据 ...

0 0 0 0 2025/07/04 arXiv:2506.07245v2 qzw

Automatic database description generation for Text-to-SQL

在文本到SQL任务的上下文中，表和列描述对于弥合自然语言和数据库架构之间的差距至关重要。本报告提出了一种方法，用于自动生成有效数据库描述时，当显式描述不可用时。所提出的方法采用双处理方法：一种粗到五个过程，然后进行精细到核的过程 ...

0 0 0 0 2025/07/04 arXiv:2502.20657v1 qzw

AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving

视觉语言模型（VLMS）显示出对自动驾驶的希望，但他们与幻觉，效率低下的推理和有限的现实验证的斗争阻碍了准确的感知和稳健的逐步推理。为了克服这一点，我们介绍了AgentThink，这是一个开创性的统一框架，该框架首次将思想链（COT）推理与动态，代理风格的工具调用有关自主驾驶任务。 AgentThink的核心创新包括：（i）结构化数据生成，建立一个自动驾驶工具库，以自动构建结构化的，自我验证的推理数据，以明确合并工具用法，以实现各种驾驶场景；（ii）采用有监督的微调（SFT）的两阶段培训管道，具有相对政策优化（GRPO），以配备VLMS的自主工具调用能力；（iii）代理风格的工具使用评估，引入了一种新型的多工具评估协议，以严格评估模型的工具调用和利用率 ...

0 0 0 0 2025/07/04 arXiv:2505.15298v3 15021163060

SDE-SQL: Enhancing Text-to-SQL Generation in Large Language Models via Self-Driven Exploration with SQL Probes

Automatic database description generation for Text-to-SQL

AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving

Benchmarking LLM Faithfulness in RAG with Evolving Leaderboards

An Empirical Study on Self-correcting Large Language Models for Data Science Code Generation

Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning

Filtered Noise Shaping for Time Domain Room Impulse Response Estimation From Reverberant Speech

VoxEval: Benchmarking the Knowledge Understanding Capabilities of End-to-End Spoken Language Models

Blind Spatial Impulse Response Generation from Separate Room- and Scene-Specific Information

Number Cookbook: Number Understanding of Language Models and How to Improve It

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）