一译 —— 文档和论文翻译、对照阅读、讨论和社区

Policy-to-Language: Train LLMs to Explain Decisions with Flow-Matching Generated Rewards

随着人类越来越多地与由RL，LLM及以后的不同代理人共享环境，以自然语言解释其政策的能力对于可靠的共存至关重要。在本文中，我们基于LLM构建了一个模型的解释发生器。技术新颖性是训练该LLM的奖励是由生成流匹配模型产生的 ...

0 0 0 2025/05/11 arXiv:2502.12530v1 liangzai

OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation

双系统VLA（视觉语言行动）体系结构已成为体现情报研究的热门话题，但是缺乏足够的开源工作来进行进一步的性能分析和优化。为了解决这个问题，本文将总结并比较现有双系统体系结构的结构设计，并对现有双重系统体系结构的核心设计元素进行系统的经验评估。最终，它将提供一个低成本的开源模型，以进一步探索 ...

0 0 0 2025/05/11 arXiv:2505.03912v1 蔡明方

A Hessian-Based Assessment of Atomic Forces for Training Machine Learning Interatomic Potentials

近年来，已经引入了许多类型的机器学习潜力（MLP），它们能够代表具有接近第一原理准确性的高维势能表面（PES）。当前大多数MLP依赖于给予的原子能贡献，这是当地化学环境的函数。通常，除了总能量外，原子力还用于构建电势，因为它们提供了有关PES的详细局部信息 ...

0 0 0 2025/05/11 arXiv:2112.14533v1 ZeHeru

MemoChat: Tuning LLMs to Use Memos for Consistent Long-Range Open-Domain Conversation

我们提出了memochat，这是一种用于细化指令的管道，使大型语言模型（llm）能够有效地使用自行撰写的备忘录来维持一致的远程开放域对话。我们通过迭代的“记忆-检索-响应”循环演示了远程开放域对话。这需要我们为每个不同阶段精心设计量身定制的调优指令... ...

0 0 0 2025/05/11 arXiv:2308.08239v2 tangemon

$Δ$-Machine Learning to Elevate DFT-based Potentials and a Force Field to the CCSD(T) Level Illustrated for Ethanol

机器学习的进展促进了潜力的发展，这些电势既提供了第一原则技术的准确性，又提供了评估速度的巨大提高。最近，“ $ \ delta $  - 机器学习”已被用来提高基于低水平的势能表面（PES）的质量，例如 ...

0 0 0 2025/05/11 arXiv:2407.20050v1 ZeHeru

Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields

机器学习力场（MLFF）是昂贵的量子量子机械分子模拟的有前途的替代方法。鉴于感兴趣的化学空间多样性以及生成新数据的成本，重要的是要了解MLFF如何推广其训练分布。为了表征和更好地了解MLFF的分布变化，我们在化学数据集上进行诊断实验，揭示了构成重大挑战的常见转变，即使对于接受广泛数据训练的大型基础模型也是如此 ...

0 0 0 2025/05/11 arXiv:2503.08674v1 ZeHeru

MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits

为了减少开发开销并启用包含任何给定生成AI应用程序的潜在组件之间的无缝集成，最近发布并随后广泛采用了模型上下文协议（MCP）（Anthropic，2024）。 MCP是一个开放协议，它标准化了针对大型语言模型（LLM），数据源和代理工具的API调用。通过连接多个MCP服务器，每个服务器都使用一组工具，资源和提示来定义，用户可以定义由LLM完全驱动的自动化工作流 ...

0 0 0 2025/05/11 arXiv:2504.03767v2 bode135

Deep-learning density functional perturbation theory

从第一原理计算材料的扰动响应特性提供了理论与实验之间的重要联系，但由于高计算成本而瓶颈。在这里，提出了一个通用框架来通过神经网络执行密度功能扰动理论（DFPT）计算，从而大大提高了计算效率。自动分化应用于神经网络，促进衍生物的准确计算 ...

0 0 0 2025/05/11 arXiv:2401.17892v1 ZeHeru

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）