一译 —— 文档和论文翻译、对照阅读、讨论和社区

Regret Minimization for Causal Inference on Large Treatment Space

预测哪种行动（治疗）将导致更好的结果是决策支持系统的核心任务。为了在实际情况下构建预测模型，由于缺乏随机对照试验（RCT）数据，从偏见的观察数据中学习是一个关键问题。为了处理这种有偏见的观察数据，最新的因果推理和反事实机器学习的努力集中在对二元动作空间潜在结果及其之间的差异的估计估计，即单个治疗效果 ...

0 0 0 2025/07/07 arXiv:2006.05616v1 zhr

Bootstrapping Grounded Chain-of-Thought in Multimodal LLMs for Data-Efficient Model Adaptation

多模式大语模型（MLLM）在使用自然语言解释图像方面表现出了显着的功能。但是，在不使用大规模数据集进行重新培训的情况下，这些模型很难适应专门的视力任务，例如 ...

0 0 0 2025/07/07 arXiv:2507.02859v1 baibaili

VerIF: Verification Engineering for Reinforcement Learning in Instruction Following

具有可验证奖励（RLVR）的增强学习已成为增强大语模型（LLM）的关键技术，验证工程起着核心作用。但是，在以下说明中，RL的最佳实践仍未得到充实。在这项工作中，我们探讨了RL中的验证挑战，以进行指导，并提出了Verif，验证方法将基于规则的代码验证与来自大型推理模型的基于LLM的验证相结合（e ...

0 0 0 2025/07/07 arXiv:2506.09942v1 musker

Spectral-Based Graph Neural Networks for Complementary Item Recommendation

建模互补关系极大地有助于推荐系统，并在购买一项时准确并迅速推荐后续项目。与传统的类似关系不同，可以连续购买具有互补关系的物品（例如iPhone和airpods Pro），它们不仅具有相关性，而且表现出差异。由于两个属性是对立的，因此建模互补关系具有挑战性 ...

0 0 0 2025/07/07 arXiv:2401.02130v4 癞蛤蟆

AV-RIR: Audio-Visual Room Impulse Response Estimation

捕获环境的声学特性的室内冲动响应（RIR）的准确估计对于语音处理和AR/VR应用非常重要。我们提出了一种新型的多模式多任务学习方法AV-RIR，可以准确地从给定的回响信号及其相应环境的视觉提示中准确估算RIR。 AV-RIR建立在一种新型的基于神经编解码器的架构的基础上，该体系结构有效地捕获环境几何形状和材料属性，并通过使用多任务学习来解决语音覆盖作为辅助任务 ...

0 1 0 2025/07/07 arXiv:2312.00834v2 wenwen

Pi-SQL: Enhancing Text-to-SQL with Fine-Grained Guidance from Pivot Programming Languages

文本到SQL将用户查询从自然语言转换为可执行的SQL程序，从而使非专家可以与复杂的数据库进行交互。现有的基于及时的方法制定了细致的文本指南和示例来促进SQL的生成，但是由于文本与低资源SQL程序之间的巨大语义差距阻碍了它们的准确性。在这项工作中，我们提出了PI-SQL，该PI-SQL将高资源Python程序纳入了自然语言查询和SQL程序之间桥接的枢纽 ...

0 0 0 2025/07/07 arXiv:2506.00912v2 qzw

IterGen: Iterative Semantic-aware Structured LLM Generation with Backtracking

大型语言模型（LLM）广泛用于诸如自然语言和代码生成之类的任务，但是它们的输出通常会遭受幻觉，毒性和不正确结果等问题。当前用于结构化LLM生成的库依赖于从左到右的解码，而无需支持回溯，从而限制了中期中纠正或完善输出的能力。为了解决这个问题，我们介绍了Itergen，这是一个用户友好的库，用于迭代，语法引导的LLM生成，使用户能够基于语法符号在生成的输出中向前和向后移动 ...

0 0 0 2025/07/07 arXiv:2410.07295v2 qzw

Direct Discriminative Optimization: Your Likelihood-Based Visual Generative Model is Secretly a GAN Discriminator

尽管基于可能性的生成模型，尤其是扩散和自回归模型，但在视觉产生方面取得了显着的保真度，但最大似然估计（MLE）物镜最小化了向前的KL差异，固有地遭受了模式覆盖的趋势，该趋势限制了在有限模型下产生质量的产生质量。在这项工作中，我们提出直接歧视性优化（DDO）作为一个统一的框架，该框架将基于可能性的生成训练和GAN型歧视整合在一起，以通过利用反向KL和自我生成的负面信号来绕过这一基本约束。我们的关键见 ...

0 0 0 2025/07/07 arXiv:2503.01103v3 wonders

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）