一译 —— 文档和论文翻译、对照阅读、讨论和社区

Fully Spiking Actor-Critic Neural Network for Robotic Manipulation

这项研究提出了基于完全尖峰神经网络（SNN）的混合课程增强学习（CRL）框架，用于9度自由的机器人手臂执行目标到达和掌握任务。为了减少网络复杂性和推理潜伏期，简化了SNN体系结构，仅包括输入和输出层，该输入层显示出资源约束环境的强大潜力。基于SNNS高推理速度，低能消耗和基于尖峰的生物学合理性的优势，临时进度分会的课程策略与近端政策优化（PPO）算法集成在一起 ...

0 0 0 2025/08/25 arXiv:2508.12038v1 odenkkk

A real-time, robust and versatile visual-SLAM framework based on deep learning networks

本文探讨了深度学习技术如何在具有挑战性的环境中改善基于视觉的大满贯性能。通过结合深度提取和深度匹配方法，我们引入了一种多功能混合视觉大满贯系统，旨在增强挑战性场景的适应性，例如弱光条件，动态照明，弱纹理区域和严重的抖动。我们的系统支持多种模式，包括单眼，立体声，单眼惯性和立体惯性配置 ...

0 0 0 2025/08/25 arXiv:2405.03413v3 xueyoo

Large Processor Chip Model

计算机系统体系结构是软件应用程序与基础硬件之间的关键桥梁，包括编译器，CPU，合并器和RTL设计等组件。从早期大型机到现代领域特定的架构的发展，是由计算需求的上升和半导体技术的进步所驱动的。但是，计算机系统体系结构设计中的传统范式正在面临重大挑战，包括依赖手动专业知识，跨软件和硬件层的优化分散，以及与探索宽敞的设计空间相关的高成本 ...

0 0 0 2025/08/25 arXiv:2506.02929v1 19113214550

AudioEditor: A Training-Free Diffusion-Based Audio Editing Framework

基于扩散的文本到原告（TTA）生成取得了重大进展，利用潜在扩散模型（LDM）产生高质量，多样和指导的音频。但是，除了一代之外，音频编辑的任务仍然同样重要，但受到相对较少的关注。音频编辑任务面临两个主要挑战：执行精确的编辑并保留未经编辑的部分 ...

0 0 0 2025/08/25 arXiv:2409.12466v2 CJY1018

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

培训有效的AI代理进行多转交互作用需要高质量的数据，以捕获现实的人类代理动力学，但是手动收集的数据却很少且昂贵。我们介绍了Apigen-MT，这是一个两阶段的框架，生成可验证和多样化的多转变代理数据。在第一阶段，我们的代理管道通过基本操作产生详细的任务蓝图，利用LLM审阅者委员会和迭代反馈循环 ...

0 0 0 2025/08/25 arXiv:2504.03601v4 zkq

mKG-RAG: Multimodal Knowledge Graph-Enhanced RAG for Visual Question Answering

最近，提出了检索功能增强的生成（RAG），以通过将外部知识数据库纳入生成过程，以扩大多模式大语言模型（MLLMS）的内部知识，该过程被广泛用于基于知识的视觉问题答案（VQA）任务。尽管取得了令人印象深刻的进步，但基于香草抹布的VQA方法依赖于非结构化文档并忽略知识元素之间的结构关系经常引入无关紧要或误导性的内容，从而降低了答案的准确性和可靠性。为了克服这些挑战，一个有希望的解决方案是将多模式知识图 ...

0 0 0 2025/08/25 arXiv:2508.05318v1 18636279200

Searching for Quantum Solitons in a 3+1 Dimensional Chiral Yukawa Model

我们在3+1尺寸的Yukawa模型中搜索通过重费稳定的静态孤子。我们计算重新归一化的能量功能，包括精确的一环量子校正，并对配置进行各种搜索，以最大程度地减少固定费米数的能量。我们使用相位移位参数化计算量子校正，在该参数中，我们通过识别具有相应Feynman图的天生系列的顺序来重新归一化 ...

0 0 0 2025/08/25 arXiv:hep-th/0112217v1 Jerrymoe

ReaL: Efficient RLHF Training of Large Language Models with Parameter Reallocation

人类反馈强化学习 (RLHF) 是支持大型语言模型 (LLM) 应用程序的关键技术。由于 RLHF 涉及不同的计算工作负载以及多个 LLM 之间复杂的依赖关系，因此直接采用监督训练中的并行化技术可能会导致性能不佳。为了克服这个限制，我们提出了一种名为参数ReaLlocation的新方法，它动态地重新分配集群中的LLM参数并在训练期间适应并行化策略 ...

0 0 0 2025/08/25 arXiv:2406.14088v2 shuowoshishui

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）