一译 —— 文档和论文翻译、对照阅读、讨论和社区

Wave-Mamba: Wavelet State Space Model for Ultra-High-Definition Low-Light Image Enhancement

（uhd）（uhd）技术因其卓越的视觉质量而受到广泛关注，但也对微光图像增强（ llie）技术提出了新的挑战。uhd图像本身就具有较高的计算复杂度，导致现有的uhd uhd llie方法需要采用高倍下采样来降低计算成本 ...

0 1 0 2025/03/20 arXiv:2408.01276v1 wgkooo

Optimizing Code Runtime Performance through Context-Aware Retrieval-Augmented Generation

通过自动代码改进优化软件性能，为提高执行速度和效率提供了有希望的途径。尽管LLMS最近取得了进步，但其执行深入计划分析的能力仍然存在很大的差距。这项研究介绍了AutoPatch，这是一种旨在通过使LLMS自动生成优化的代码来弥合此差距的文化学习方法 ...

0 0 0 2025/03/19 arXiv:2501.16692v2 15966829631

GraphEdit: Large Language Models for Graph Structure Learning

图结构学习（GSL）专注于通过生成新颖的图结构来捕获图结构数据中节点之间的内在依赖关系和交互。图神经网络 (GNN) 已成为有前途的 GSL 解决方案，利用递归消息传递来编码节点间的相互依赖关系。然而，许多现有的 GSL 方法严重依赖显式图结构信息作为监督信号，这使得它们容易受到数据噪声和稀疏性等挑战的影响 ...

0 0 0 2025/03/19 arXiv:2402.15183v5 wozengyi

Decoupling Common and Unique Representations for Multimodal Self-supervised Learning

多传感器数据的可用性增加激发了人们对多模式自学学习的广泛兴趣。但是，大多数现有方法仅学习跨模态的共同表示，同时忽略了模式内训练和模态唯一的表示。我们提出了脱钩和独特的表示（Decur），这是一种简单而有效的自学学习方法 ...

0 0 0 2025/03/19 arXiv:2309.05300v3 tequila1128

Improving Retrieval-Augmented Generation through Multi-Agent Reinforcement Learning

检索增强的生成（RAG）被广泛用于将外部知识纳入大型语言模型，从而最大程度地减少了幻觉。标准的RAG管道可能包括多个组件，例如查询重写，文档检索，文档过滤和答案生成。但是，这些组件通常是通过监督的微调分别优化的，这可能导致单个模块的目标之间的未对准以及在提问（QA）任务中产生准确答案的总体目的 ...

0 0 0 2025/03/19 arXiv:2501.15228v1 18636279200

GraspSplats: Efficient Manipulation with 3D Feature Splatting

机器人对物体零件进行高效且零拍的能力对于实际应用至关重要，并且随着视觉模型（VLMS）的最新进展而变得越来越普遍。为了桥接2d-3d的差距以支持这种能力，现有方法依赖于神经场（NERFS）通过可区分的渲染或基于点的投影方法。但是，我们证明了NERF不适合场景的变化，因为它们的隐性和基于点的方法对于零件本地化而无需基于基于优化的零件定位 ...

0 0 0 2025/03/19 arXiv:2409.02084v1 guoweichao87

MISGENDERED: Limits of Large Language Models in Understanding Pronouns

内容警告：本文包含可能令人反感和可能触发的删除的示例。语言技术中的性别偏见已经得到了广泛的研究，但是研究主要仅限于性别的二元范式。考虑非二元性别认同也是至关重要的，因为不包括它们可能会对已经边缘化的群体造成进一步的伤害 ...

0 0 0 2025/03/19 arXiv:2306.03950v2 duck

Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models

具有 Transformer 架构的潜在扩散模型擅长生成高保真图像。然而，最近的研究揭示了这种两阶段设计中的优化困境：虽然增加视觉标记器中每个标记的特征维度可以提高重建质量，但它需要更大的扩散模型和更多的训练迭代才能实现可比较的生成性能。因此，现有系统通常采用次优解决方案，要么由于分词器内的信息丢失而产生视觉伪影，要么由于昂贵的计算成本而无法完全收敛 ...

0 0 0 2025/03/19 arXiv:2501.01423v3 haoyb22

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）