一译 —— 文档和论文翻译、对照阅读、讨论和社区

Steering Semantic Data Processing With DocWrangler

长期以来，非结构化的文本很难自动进行大规模分析。现在，大型语言模型（LLMS）通过启用{\ em语义数据处理}来提供前进的方向，其中熟悉的数据处理操作员（例如， ...

0 0 0 2025/05/09 arXiv:2504.14764v1 zhangxinhao

Goedel-Prover: A Frontier Model for Open-Source Automated Theorem Proving

我们介绍了Goedel-Prover，这是一种开源大型语言模型（LLM），可在自动化的数学问题上实现最先进的（SOTA）性能（SOTA）性能。该领域的主要挑战是正式的数学报表和证明的稀缺性，我们通过以下方式解决这一问题。我们训练声明形式上的人将自然语言数学问题从Numina转换为形式语言（精益4），创建1个数据集 ...

0 0 0 2025/05/09 arXiv:2502.07640v3 fazai001

Semantic Operators: A Declarative Model for Rich, AI-based Data Processing

大语言模型（LLM）的语义能力有可能使丰富的分析和推理能够超过广泛的知识语料库。不幸的是，现有系统要么在没有性能保证的情况下优化昂贵的LLM驱动操作，要么提供有限的行列LLM操作，从而提供有限的鲁棒性，表现力和可用性。我们介绍了语义操作员，这是基于自然语言规范的宣言性和通用AI转换的第一个形式主义（e ...

0 0 0 2025/05/09 arXiv:2407.11418v3 zhangxinhao

DocETL: Agentic Query Rewriting and Evaluation for Complex Document Processing

分析非结构化数据一直是数据处理中的持续挑战。大型语言模型（LLMS）在这方面表现出了希望，这导致了有关LLM驱动的非结构化数据处理的最新建议。但是，这些框架专注于在使用LLMS执行用户指定的操作时降低成本，而不是提高准确性，执行大多数操作AS-IS（在单个LLM呼叫中） ...

0 0 0 2025/05/09 arXiv:2410.12189v3 zhangxinhao

Incremental Learning of Retrievable Skills For Efficient Continual Task Adaptation

持续的模仿学习（CIL）涉及从跨多个阶段和任务的演示中提取和积累任务知识以实现多任务策略。随着基础模型的最新进展，人们对基于适配器的CIL方法的兴趣越来越大，在这些方法中，为新证明的任务建立了适配器的参数。尽管这些方法隔离了特定任务的参数并倾向于减轻灾难性的遗忘，但它们限制了不同示范之间的知识共享 ...

0 0 8 2025/05/09 arXiv:2410.22658v2 kavin

Seq2SQL: Generating Structured Queries from Natural Language using Reinforcement Learning

世界知识的大量知识存储在关系数据库中。但是，由于对SQL等查询语言缺乏了解，用户从数据库中检索事实的能力受到限制。我们提出了SEQ2SQL，这是一个深层神经网络，用于将自然语言问题转化为相应的SQL查询 ...

0 0 0 2025/05/09 arXiv:1709.00103v7 qzw

A Survey on Model-based Reinforcement Learning

强化学习（rl）通过与环境交互的试错过程来解决顺序决策问题。虽然强化学习在玩允许大量试错的复杂视频游戏方面取得了巨大成功，但在现实世界中犯错误总是不受欢迎的。为了提高样本效率并减少错误，基于模型的强化学习（mbrl）被认为是一个有前途的方向，它构建了可以在没有实际成本的情况下进行试错的环境模型... ...

0 0 1 2025/05/09 arXiv:2206.09328v1 chenlei

Curriculum Modeling the Dependence among Targets with Multi-task Learning for Financial Marketing

各种现实世界应用程序的多任务学习通常涉及具有逻辑顺序依赖性的任务。例如，在在线营销中，$ Impression \ RightArrow的级联行为模式通常以多任务方式将其建模为多个任务，其中任务之间的顺序依赖性简单地与明确定义的函数或隐式转移的函数或当前工作中的隐含转移信息连接。随着正面反馈随着任务顺序而变得更加稀疏，这些方法可以减轻长路径顺序任务的数据稀疏性问题 ...

0 0 0 2025/05/09 arXiv:2305.01514v1 superjoe

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）