一译 —— 文档和论文翻译、对照阅读、讨论和社区

Dense Nested Attention Network for Infrared Small Target Detection

单帧红外小目标（SIRST）检测旨在将小目标与混乱背景区分开。随着深度学习的进步，基于CNN的方法由于其强大的建模能力而在通用对象检测中产生了有希望的结果。但是，现有的基于CNN的方法不能直接用于红外小目标，因为其网络中的汇总层可能会导致深层中的目标损失 ...

0 0 0 2025/05/20 arXiv:2106.00487v3 xcp

MegaScale-MoE: Large-Scale Communication-Efficient Training of Mixture-of-Experts Models in Production

我们提出了Megascale-Moe，这是一种量身定制的生产系统，该系统量其有效训练大型Experts（MOE）型号。 MUE成为一种有前途的体系结构，可扩展大型语言模型（LLM）到前所未有的大小，从而增强模型性能。但是，现有的MOE培训系统经历了培训效率的退化，这会因MOE模型的不断升级和硬件的持续发展而加剧 ...

0 0 0 2025/05/20 arXiv:2505.11432v2 hellogdc

Constrained Reinforcement Learning with Smoothed Log Barrier Function

与许多在奖励函数的传统控制方法相比，加强学习（RL）已被广泛应用于许多控制任务，并显着改善了性能。但是，对于许多现实世界中的问题，同时根据奖励和约束来提出优化问题通常更方便。通过奖励成型来优化这种受限的问题可能很困难，因为它需要用几个相互作用的术语对奖励功能进行乏味的手动调整 ...

0 0 0 2025/05/20 arXiv:2403.14508v1 zengyanxiang

Follow My Instruction and Spill the Beans: Scalable Data Extraction from Retrieval-Augmented Generation Systems

检索增强生成 (RAG) 通过在测试时结合外部知识来改进预训练模型，以实现定制适应。我们研究上下文检索 RAG 语言模型 (LM) 中数据存储泄漏的风险。我们表明，对手可以利用 LM 的指令跟踪功能，通过提示注入轻松地从使用指令调整 LM 构建的 RAG 系统的数据存储中逐字提取文本数据 ...

0 0 0 2025/05/20 arXiv:2402.17840v3 0x211

RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera Fusion

我们建议通过以下见解提高3D对象检测的准确性。室外3D场景感知中的雷达相机融合是由图像到bev转换限制的 - 如果无法准确估计像素的深度，那么BEV特征的天真组合实际上会集成了不一致的视觉内容。为了避免此问题，我们提出了一个基于查询的框架，该框架可以从Bird's-eye View（BEV）和原始图像视图中自适应对实例型功能进行自适应采样 ...

0 0 0 2025/05/20 arXiv:2412.12725v2 ttt

BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction

随机人类运动预测（HMP）通常已经通过生成的对抗网络和变异自动编码器来解决。大多数先前的作品旨在根据骨架关节的分散来预测高度多样化的运动。这导致了预测快速和运动发散运动的方法，这些运动通常与过去的运动不切实际且不连贯 ...

0 0 0 2025/05/20 arXiv:2211.14304v3 chenlei

MotionDiffuser: Controllable Multi-Agent Motion Prediction using Diffusion

我们提出了运动脱机器，一种基于扩散的表示，用于在多个智能体上联合分布未来轨迹。这种表示有几个关键优势：首先，我们的模型学习高度多模态分布，可以捕获不同的未来结果。其次 ...

0 0 0 2025/05/20 arXiv:2306.03083v1 jerome.zhou

Group-in-Group Policy Optimization for LLM Agent Training

基于小组的增强学习（RL）的最新进展已在数学推理等单转任务中驱动了前沿模型（LLMS）。但是，它们对长跑LLM代理训练的可伸缩性仍然有限。与静态任务不同，代理环境的互动在许多步骤中展开，并且通常会产生稀疏或延迟的奖励，从而使各个步骤的信贷分配变得更加具有挑战性 ...

0 0 0 2025/05/20 arXiv:2505.10978v1 chrisxiong

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）