一译 —— 文档和论文翻译、对照阅读、讨论和社区

Auto-GDA: Automatic Domain Adaptation for Efficient Grounding Verification in Retrieval-Augmented Generation

尽管已证明检索功能增强的生成（RAG）可以增强大语言模型（LLM）输出的事实，但LLMS仍然患有幻觉，产生不正确或无关紧要的信息。一种常见的检测策略涉及促使LLM再次评估其反应是否基于检索的证据，但这种方法是昂贵的。另外，可以在推理时间使用轻巧的自然推理（NLI）模型以进行有效接地验证 ...

0 0 0 2025/04/15 arXiv:2410.03461v2 15966829631

Truthful or Fabricated? Using Causal Attribution to Mitigate Reward Hacking in Explanations

经过深思熟虑的解释被广泛用于检查大语言模型（LLMS）的决策过程并评估模型输出的可信度，这对于LLMS与人类之间的有效协作至关重要。我们证明了偏好优化 - 在对齐阶段的关键步骤 - 可以无意中降低这些解释的忠诚。之所以发生这种情况，是因为指导一致性的奖励模型（RM）的任务是优化响应的预期质量和解释的适当性（e ...

0 0 0 2025/04/15 arXiv:2504.05294v1 firefly2024

Right Question is Already Half the Answer: Fully Unsupervised LLM Reasoning Incentivization

尽管大型语言模型（LLMS）在诸如数学推理之类的挑战性任务中表现出了出色的功能，但现有的方法以增强推理能力，主要依赖于监督的微调（SFT），然后在预先培训后对推理特定数据进行了强化学习（RL）。但是，这些方法在很大程度上取决于外部监督，例如人类标记的推理痕迹，经过验证的金答案或预先训练的奖励模型 - 限制了可扩展性和实际适用性。在这项工作中，我们提出了熵最小化的政策优化（EMPO），这使得早期尝试 ...

0 0 0 2025/04/15 arXiv:2504.05812v1 firefly2024

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

我们介绍了量化大型语言模型（LLMS）编码和存储上下文信息的方法，表明 Token 通常被视为次要的（例如，确定词，标点符号）具有令人惊讶的高环境 ...

0 1 0 2025/04/15 arXiv:2502.15007v1 Forest_Lee

A Survey on Traffic Signal Control Methods

交通信号控制是一个重要且具有挑战性的现实问题，旨在通过协调其在道路交叉点的行动来最大程度地减少车辆的行程。当前使用的流量信号控制系统仍然在很大程度上依赖于过度简化的信息和基于规则的方法，尽管我们现在拥有更丰富的数据，更多的计算能力和高级方法来推动智能运输的开发。随着对智能运输的兴趣日益增长，使用机器学习方法（例如增强学习），该调查涵盖了广泛认可的运输方法以及有关交通信号控制加强的最新文献清单 .. ...

0 0 0 2025/04/15 arXiv:1904.08117v3 JayLiu

Dynamic Cheatsheet: Test-Time Learning with Adaptive Memory

尽管当前语言模型（LMS）在复杂的任务上具有令人印象深刻的性能，但通常以真空运行：每个输入查询都会单独处理，而无需保留以前尝试的见解。在这里，我们提出了动态备忘单（DC），这是一个轻巧的框架，它赋予了一个具有持久，不断发展的内存的黑盒LM。 DC没有反复重新发现或重新发现相同的解决方案和错误，而是使模型能够在推理时期存储和重复使用累积的策略，代码段以及一般解决问题的见解 ...

0 0 0 2025/04/15 arXiv:2504.07952v1 wanghuiyong

Objects as Points

检测将对象识别为图像中的轴对齐框。大多数成功的物体检测器都会列举出几乎详尽的潜在物体位置列表，并对每个物体进行分类。这是浪费、低效的，并且需要额外的后处理... ...

0 0 0 2025/04/15 arXiv:1904.07850v2 SGN001

CycleISP: Real Image Restoration via Improved Data Synthesis

大规模数据集的可用性有助于释放深卷积神经网络（CNN）的真正潜力。但是，对于单形图像降解问题，捕获真实数据集是一个不可接受的昂贵且繁琐的过程。因此，图像deno的算法主要是在合成数据上开发和评估的，这些数据通常以广泛的假设为添加剂白色高斯噪声（AWGN）产生 ...

0 0 0 2025/04/15 arXiv:2003.07761v1 ZeHeru

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）