一译 —— 文档和论文翻译、对照阅读、讨论和社区

Neural Fine-Tuning Search for Few-Shot Learning

在几次识别中，需要在一组课程上接受过培训的分类器，以迅速适应并推广到一组新颖的课程。为此，最近的研究表明，通过精心制作的适应体系结构进行微调的功效。但是，这提出了一个问题：如何设计最佳适应策略？在本文中，我们通过神经建筑搜索（NAS）的角度研究了这个问题 ...

0 0 0 2025/05/09 arXiv:2306.09295v1 edcyhn

DSDrive: Distilling Large Language Model for Lightweight End-to-End Autonomous Driving with Unified Reasoning and Planning

我们提出了DSDRIVE，这是一种量身定制的端到端范式，该范式旨在将自动驾驶汽车的推理和计划集成到统一的框架中。 DSDRIVE利用采用蒸馏方法的紧凑型LLM来保留大型视觉语言模型（VLM）的增强推理能力。为了有效地调整推理和计划任务，进一步开发了以Waypoint驱动的双头协调模块的形式，该模块将同步数据集结构，优化目标和学习过程 ...

0 0 0 2025/05/09 arXiv:2505.05360v1 布朗瓶

Steering Semantic Data Processing With DocWrangler

长期以来，非结构化的文本很难自动进行大规模分析。现在，大型语言模型（LLMS）通过启用{\ em语义数据处理}来提供前进的方向，其中熟悉的数据处理操作员（例如， ...

0 0 0 2025/05/09 arXiv:2504.14764v1 zhangxinhao

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

我们介绍了Goedel-Prover，这是一种开源大型语言模型（LLM），可在自动化的数学问题上实现最先进的（SOTA）性能（SOTA）性能。该领域的主要挑战是正式的数学报表和证明的稀缺性，我们通过以下方式解决这一问题。我们训练声明形式上的人将自然语言数学问题从Numina转换为形式语言（精益4），创建1个数据集 ...

0 0 0 2025/05/09 arXiv:2502.07640v3 fazai001

Semantic Operators: A Declarative Model for Rich, AI-based Data Processing

大语言模型（LLM）的语义能力有可能使丰富的分析和推理能够超过广泛的知识语料库。不幸的是，现有系统要么在没有性能保证的情况下优化昂贵的LLM驱动操作，要么提供有限的行列LLM操作，从而提供有限的鲁棒性，表现力和可用性。我们介绍了语义操作员，这是基于自然语言规范的宣言性和通用AI转换的第一个形式主义（e ...

0 0 0 2025/05/09 arXiv:2407.11418v3 zhangxinhao

DocETL: Agentic Query Rewriting and Evaluation for Complex Document Processing

分析非结构化数据一直是数据处理中的持续挑战。大型语言模型（LLMS）在这方面表现出了希望，这导致了有关LLM驱动的非结构化数据处理的最新建议。但是，这些框架专注于在使用LLMS执行用户指定的操作时降低成本，而不是提高准确性，执行大多数操作AS-IS（在单个LLM呼叫中） ...

0 0 0 2025/05/09 arXiv:2410.12189v3 zhangxinhao

Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation

持续的模仿学习（CIL）涉及从跨多个阶段和任务的演示中提取和积累任务知识以实现多任务策略。随着基础模型的最新进展，人们对基于适配器的CIL方法的兴趣越来越大，在这些方法中，为新证明的任务建立了适配器的参数。尽管这些方法隔离了特定任务的参数并倾向于减轻灾难性的遗忘，但它们限制了不同示范之间的知识共享 ...

0 0 8 2025/05/09 arXiv:2410.22658v2 kavin

Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning

世界知识的大量知识存储在关系数据库中。但是，由于对SQL等查询语言缺乏了解，用户从数据库中检索事实的能力受到限制。我们提出了SEQ2SQL，这是一个深层神经网络，用于将自然语言问题转化为相应的SQL查询 ...

0 0 0 2025/05/09 arXiv:1709.00103v7 qzw

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）