一译 —— 文档和论文翻译、对照阅读、讨论和社区

MemoChat: Tuning LLMs to Use Memos for Consistent Long-Range Open-Domain Conversation

我们提出了memochat，这是一种用于细化指令的管道，使大型语言模型（llm）能够有效地使用自行撰写的备忘录来维持一致的远程开放域对话。我们通过迭代的“记忆-检索-响应”循环演示了远程开放域对话。这需要我们为每个不同阶段精心设计量身定制的调优指令... ...

0 0 0 2025/05/11 arXiv:2308.08239v2 tangemon

$Δ$-Machine Learning to Elevate DFT-based Potentials and a Force Field to the CCSD(T) Level Illustrated for Ethanol

机器学习的进展促进了潜力的发展，这些电势既提供了第一原则技术的准确性，又提供了评估速度的巨大提高。最近，“ $ \ delta $  - 机器学习”已被用来提高基于低水平的势能表面（PES）的质量，例如 ...

0 0 0 2025/05/11 arXiv:2407.20050v1 ZeHeru

Understanding and Mitigating Distribution Shifts For Machine Learning Force Fields

机器学习力场（MLFF）是昂贵的量子量子机械分子模拟的有前途的替代方法。鉴于感兴趣的化学空间多样性以及生成新数据的成本，重要的是要了解MLFF如何推广其训练分布。为了表征和更好地了解MLFF的分布变化，我们在化学数据集上进行诊断实验，揭示了构成重大挑战的常见转变，即使对于接受广泛数据训练的大型基础模型也是如此 ...

0 0 0 2025/05/11 arXiv:2503.08674v1 ZeHeru

MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits

为了减少开发开销并启用包含任何给定生成AI应用程序的潜在组件之间的无缝集成，最近发布并随后广泛采用了模型上下文协议（MCP）（Anthropic，2024）。 MCP是一个开放协议，它标准化了针对大型语言模型（LLM），数据源和代理工具的API调用。通过连接多个MCP服务器，每个服务器都使用一组工具，资源和提示来定义，用户可以定义由LLM完全驱动的自动化工作流 ...

0 0 0 2025/05/11 arXiv:2504.03767v2 bode135

Deep-learning density functional perturbation theory

从第一原理计算材料的扰动响应特性提供了理论与实验之间的重要联系，但由于高计算成本而瓶颈。在这里，提出了一个通用框架来通过神经网络执行密度功能扰动理论（DFPT）计算，从而大大提高了计算效率。自动分化应用于神经网络，促进衍生物的准确计算 ...

0 0 0 2025/05/11 arXiv:2401.17892v1 ZeHeru

Prompted LLMs as Chatbot Modules for Long Open-domain Conversation

在本文中，我们提出了MPC（模块化提示聊天机器人），这是一种创建高质量对话代理而无需进行微调的新方法。我们的方法通过使用少量发射提示，经过思考链（COT）和外部记忆等技术，利用预训练的大语言模型（LLM）作为长期一致性和灵活性的单个模块。我们的人类评估结果表明，MPC与开放域对话中的微调聊天机器人模型相提并论，这是创建一致且引人入胜的聊天机器人的有效解决方案 ...

0 0 0 2025/05/11 arXiv:2305.04533v1 niuzai

Improved Fine-Tuning of Large Multimodal Models for Hateful Meme Detection

可恶的模因已成为互联网上的重大关注，需要强大的自动检测系统。尽管大型多模型模型在各种任务中表现出强烈的概括，但由于与新兴的社会趋势和突发新闻相关的模因的动态性质，它们对可恶的模因检测的概括不佳。最近的工作进一步凸显了在这种情况下，大型多模型模型的常规监督微调的局限性 ...

0 0 6 2025/05/10 arXiv:2502.13061v1 wkc1016

SCM: Enhancing Large Language Model with Self-Controlled Memory Framework

大规模语言模型 (LLM) 因其无法处理冗长的输入而受到限制。为了解决这个限制，我们提出了自控记忆（SCM）系统来释放大规模语言模型的无限长度输入能力。我们的SCM系统由三个关键模块组成：语言模型代理、内存流和内存控制器 ...

0 0 0 2025/05/10 arXiv:2304.13343v4 niuzai

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）