一译 —— 文档和论文翻译、对照阅读、讨论和社区

CATANet: Efficient Content-Aware Token Aggregation for Lightweight Image Super-Resolution

基于 Transformer 的方法在低级视觉任务（例如图像超分辨率（SR））中表现出了令人印象深刻的性能。但是，其计算复杂性随空间分辨率而倍增。一系列作品试图通过将低分辨率图像分为本地窗户，轴向条纹或扩张的窗户来减轻此问题 ...

0 0 0 2025/06/06 arXiv:2503.06896v1 A心

Can Large Reasoning Models Self-Train?

扩展大语模型（LLM）的性能越来越取决于减少对人类监督的依赖的方法。从自动验证中学习的强化学习提供了替代方案，但由于对人类设计的验证者的依赖而造成的可伸缩性限制。自我训练（在模型自身提供监督信号的情况下）提出了令人信服的方向 ...

0 0 0 2025/06/06 arXiv:2505.21444v1 zhangxinhao

MVPainter: Accurate and Detailed 3D Texture Generation via Multi-View Diffusion with Geometric Control

最近，在3D对象生成中已经取得了重大进展。在生成的几何形状的基础上，当前的管道通常采用图像扩散模型来生成多视图RGB图像，然后通过纹理烘烤进行紫外线纹理重建。尽管在多个开源框架的支持下，3D几何产生有了显着改善，但3D纹理生成仍未得到充分震惊 ...

0 0 0 2025/06/06 arXiv:2505.12635v1 zhifeiji

Large Language Model Adaptation for Financial Sentiment Analysis

自然语言处理（NLP）最近通过对公司和市场的财务文件提供了高度宝贵的见解，从而在金融机构中获得了相关性。但是，由于文本的复杂性和特定术语的使用，金融领域的景观给NLP带来了额外的挑战。通才的语言模型往往在专门针对金融的任务中脱颖而出，即使使用具有良好自然语言理解和生成能力的大型语言模型（LLM） ...

0 0 0 2025/06/06 arXiv:2401.14777v1 Tulip

Pangu DeepDiver: Adaptive Search Intensity Scaling via Open-Web Reinforcement Learning

寻求信息需要迭代证据收集和反思性推理，但是大型语言模型（LLMS）仍在开放式问题回答中与之抗争。现有的方法依赖于基于Wikipedia的语料库和检索环境的静态提示规则或培训，从而限制了对现实世界中的Web环境的适应性，在这种情况下，歧义性，证据和噪音相互冲突是普遍的。这些受到限制的培训设置阻碍了LLM的学习，而不是动态地决定何时何地搜索，以及如何根据信息需求调整搜索深度和频率 ...

0 0 0 2025/06/06 arXiv:2505.24332v1 chrisxiong

Object Concepts Emerge from Motion

对象概念在人类视觉认知，实现物理世界中的感知，记忆和互动中起着基本作用。受到发育神经科学中的发现的启发 - 显示婴儿可以通过观察运动获得对象的理解，我们提出了一个以生物学启发的框架，以无监督的方式学习以对象为中心的视觉表示。我们的关键见解是，运动边界是对象级分组的强信号，可用于从原始视频中得出伪实例监督 ...

0 0 0 2025/06/06 arXiv:2505.21635v1 xubiao

Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding

大型语言模型（LLM）在情境知识理解中取得了巨大的成功。在本文中，我们表明，这些集中的巨大值在注意查询（Q）和键（k）的特定区域始终出现，而在各种现代 Transformer LLMS中的值（v）中没有此类模式（Q，K和V分别表示由查询，钥匙和值层输出的表示表示表示）。通过广泛的实验，我们进一步证明，这些巨大的值在解释上下文知识（从当前上下文窗口获得的知识获得）中起着关键作用，而不是检索存储在模型 ...

0 0 0 2025/06/06 arXiv:2502.01563v4 xubiao

Beyond Single Pass, Looping Through Time: KG-IRAG with Iterative Knowledge Retrieval

Graph检索效果生成（GraphRag）已被证明在提高需要外部知识的任务的大型语言模型（LLM）的性能方面非常有效。通过利用知识图（KGS），GraphRag改善了复杂推理任务的信息检索，提供了更精确和全面的检索，并对QAS产生了更准确的响应。但是，大多数抹布方法在解决多个步骤推理方面缺乏，尤其是在需要信息提取和推理时 ...

0 0 0 2025/06/06 arXiv:2503.14234v3 lin3

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）