一译 —— 文档和论文翻译、对照阅读、讨论和社区

SPJFNet: Self-Mining Prior-Guided Joint Frequency Enhancement for Ultra-Efficient Dark Image Restoration

当前的深色图像恢复方法具有严重的效率瓶颈，主要来自以下原因：（1）计算负担和误差校正成本与依赖外部先验（手动或跨模式）相关的误差校正成本； （2）复杂的多阶段增强管道中的冗余操作； （3）频率域方法中跨频率分量的不加选择的处理，导致全球计算的过度需求。为了应对这些挑战，我们提出了一个有效的自矿工提前引导的关节频率增强网络（SPJFNET）。具体而言，我们首先引入一个自矿指导模块（SMGM），该模块 ...

0 0 0 2025/09/01 arXiv:2508.04041v1 fany

Bootstrapping Conditional Retrieval for User-to-Item Recommendations

用户到项目的检索一直是推荐系统中的一个活跃研究领域，并且由于模型简单性和服务效率而被广泛采用。在这项工作中，我们关注一个称为\ textit {条件检索}的变体，我们希望检索项目与条件相关（例如， ...

0 0 0 2025/09/01 arXiv:2508.16793v1 dreamore

vAttention: Dynamic Memory Management for Serving LLMs without PagedAttention

有效利用 GPU 内存对于高吞吐量 LLM 推理至关重要。之前的系统提前为 KV 缓存保留内存，导致内部碎片导致容量浪费。受基于操作系统的虚拟内存系统的启发，vLLM 提出了 PagedAttention 来实现 KV 缓存的动态内存分配 ...

0 0 0 2025/09/01 arXiv:2405.04437v3 yli

Look-Back: Implicit Visual Re-focusing in MLLM Reasoning

多模式大语言模型（MLLM）在多模式推理方面取得了显着进步。但是，在推理的后期阶段，他们通常会过分依赖文本信息，从而忽略了视觉输入的关键整合。当前方法通常通过明确注入视觉信息来指导推理过程来解决此问题 ...

0 0 0 2025/09/01 arXiv:2507.03019v1 aries_young

rStar2-Agent: Agentic Reasoning Technical Report

我们介绍了RSTAR2-AGENT，这是一种14B数学推理模型，该模型训练了经纪性增强学习，以实现前沿级的性能。除了目前的长床外，该模型还展示了高级认知行为，例如在使用Python编码工具之前仔细思考，并反思代码执行反馈以自主探索，验证和完善复杂问题解决中的中间步骤。通过三个关键的创新来启用此功能，从而使代理RL有效地进行了规模：（i）具有可靠的Python代码环境的有效RL基础架构，可支持高通量 ...

0 0 0 2025/09/01 arXiv:2508.20722v1 takkeri

Agent Context Protocols Enhance Collective Inference

AI代理已经越来越擅长复杂的任务，例如编码，推理和多模式理解。但是，建立通才系统需要超越各个代理人进行集体推理 - 一种范式，其中具有多样化，任务专用代理的多代理系统通过结构化的沟通和协作相互补充。如今，协调通常以不精确的临时自然语言来处理，这限制了复杂的相互作用并阻碍与域特异性药物的互操作性 ...

0 0 0 2025/09/01 arXiv:2505.14569v1 1123

Context Engineering for Multi-Agent LLM Code Assistants Using Elicit, NotebookLM, ChatGPT, and Claude Code

大型语言模型（LLMS）在自动化代码生成和软件工程任务方面表现出了希望，但是由于上下文限制和知识差距，它们经常在复杂的多文件项目中挣扎。我们提出了一个新颖的上下文工程工作流程，该工作流程结合了多个AI组件：意图翻译器（GPT-5），以阐明用户需求，一种引起动力的语义文献检索，用于注入域知识，基于笔记本的文档综合，用于上下文理解，以及用于代码和验证的Claude多代代码系统。我们的集成方法利用了意图 ...

0 0 0 2025/09/01 arXiv:2508.08322v1 1123

Hi Robot: Open-Ended Instruction Following with Hierarchical Vision-Language-Action Models

可以在开放世界设置中执行一系列不同任务的通才机器人不仅能够理解完成目标所需的步骤，还可以处理任务执行期间的复杂说明，提示甚至反馈。复杂的说明（例如 ...

0 0 0 2025/09/01 arXiv:2502.19417v2 YONG

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）