一译 —— 文档和论文翻译、对照阅读、讨论和社区

Scalable Multi-Task Reinforcement Learning for Generalizable Spatial Intelligence in Visuomotor Agents

尽管强化学习（RL）在语言建模方面取得了巨大的成功，但其胜利尚未完全转化为视觉运动代理。 RL模型中的主要挑战是它们倾向于过度适合特定的任务或环境，从而阻碍了跨不同环境的可推广行为的获得。本文通过证明Minecraft中的RL-Finetnetened Visuomotor代理可以实现零拍的概括以实现零拍的概括，从而为这一挑战提供了初步答案 ...

0 0 0 2025/09/24 arXiv:2507.23698v1 mencius

AvatarShield: Visual Reinforcement Learning for Human-Centric Synthetic Video Detection

人工智能生成内容（AIGC）技术的快速发展，尤其是在视频生成中，导致了前所未有的创造力，但也增加了对信息完整性，身份安全和公共信任的威胁。现有的检测方法虽然在一般情况下有效，但缺乏以人为中心的视频的强大解决方案，由于其现实主义以及法律和道德滥用的潜力，这会带来更大的风险。此外，当前的检测方法通常遭受概括，可伸缩性有限以及对劳动密集型监督微调的依赖 ...

0 0 0 2025/09/24 arXiv:2505.15173v3 sun.jiping

OnePiece: Bringing Context Engineering and Reasoning to Industrial Cascade Ranking System

尽管对在工业搜索和推荐系统中复制大型语言模型（LLM）的扩展成功的兴趣越来越大，但大多数现有的工业努力仍然限于移植 Transformer 体系结构，这仅带来对强大深度学习建议模型（DLRMS）的增量改进。从第一个原则的角度来看，LLMS的突破不仅源于它们的架构，而且还源于两种互补的机制：上下文工程，它丰富了具有上下文提示的原始输入查询，以更好地启发模型能力和多步骤推理，从而迭代通过中间的推理路径 ...

0 0 0 2025/09/24 arXiv:2509.18091v1 13361168647

Qwen3-Omni Technical Report

我们提出了QWEN3-OMNI，这是一种单模型模型，该模型首次保持跨文本，图像，音频和视频的最先进性能，而没有任何相对于单模式对应物的降级。 QWEN3-OMNI匹配QWEN系列中同一大小的单模模型的性能，并且特别在音频任务上擅长。在36个音频和视听基准中，Qwen3-omni在32个基准和22个基准的开源SOTA上实现了22个基准SOTA，表现优于诸如Gemini-2之类的强闭合模型 ...

0 0 1 2025/09/24 arXiv:2509.17765v1 hwrabbit

DarwinWafer: A Wafer-Scale Neuromorphic Chip

神经形态计算有望像大脑一样的效率，但是当今的多芯片系统比PCB上的尺度缩放，并且会在带宽，潜伏期和能量中引起刻板级惩罚，从而破坏了生物学算法和系统效率。我们提出了Darwinwafer，这是一种超大型系统，在300毫米硅的插入器上取代了64个Darwin3芯片的晶圆尺度，高密度积分。每个芯片中的GALS NOC和带有分层时段同步的基于AER的异步晶片织物可在整个晶片上提供低延迟，相干的操作 ...

0 0 0 2025/09/24 arXiv:2509.16213v1 13057594548

Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling

从受到某种约束的语言模型中生成的主要方法是本地限制的解码（LCD），在每个时间步骤中逐步采样 Token ，因此永远不会违反约束。通常，这是通过 Token 掩盖来实现的：在词汇上循环并排除不合格 Token 。这种方法有两个重要的问题 ...

0 0 0 2025/09/24 arXiv:2504.05410v2 sevenlttt

Memory in Large Language Models: Mechanisms, Evaluation and Evolution

在统一的操作定义下，我们将LLM内存定义为在训练，填充或推理期间写入的持续状态，以后可以解决，并稳定地影响输出。我们提出了四部分分类法（参数，上下文，外部，程序/情节）和一个记忆四倍（位置，持久性，写入/访问路径，可控性）。我们通过链写作 - >读取 - >抑制/更新来链接机制，评估和治理 ...

0 0 3 2025/09/24 arXiv:2509.18868v1 hwrabbit

SLAM-Former: Putting SLAM into One Transformer

我们提出了SLAM Former，这是一种新型的神经方法，将完整的SLAM功能整合到单个 Transformer 中。与传统的大满贯系统相似，SLAM Former既包括一个串联运作的前端和后端。前端过程实时处理顺序单眼图像，以进行增量映射和跟踪，而后端则执行全局改进，以确保几何一致的结果 ...

0 0 0 2025/09/24 arXiv:2509.16909v1 康康23

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）