一译 —— 文档和论文翻译、对照阅读、讨论和社区

Design Patterns for Securing LLM Agents against Prompt Injections

随着由大型语言模型（LLM）提供动力的AI代理人变得越来越多功能并能够解决各种各样的任务，因此确保其安全性已成为一个关键的挑战。最紧迫的威胁之一是迅速的注射攻击，这些攻击利用了代理商对自然语言输入的弹性 - 当授予代理商访问工具或处理敏感信息时，这是一个特别危险的威胁。在这项工作中，我们提出了一组原则设计模式，用于建立具有可证明抗药性的AI代理 ...

0 0 0 2025/08/29 arXiv:2506.08837v3 lurenv

Cut the Crap: An Economical Communication Pipeline for LLM-based Multi-Agent Systems

大语言模型（LLM）能力的代理商的最新进步表明，集体智能可以极大地超过个人能力，这在很大程度上归因于精心设计的经过精心设计的跨间沟通拓扑。尽管绩效令人印象深刻，但现有的多代理管道固有地引入了大量 Token 开销，并增加了经济成本，这对其大规模部署构成了挑战。为了应对这一挑战，我们提出了一个经济，简单且可靠的多代理通信框架，称为$ \ texttt {agentPrune} $，该框架可以无缝集成 ...

0 0 0 2025/08/29 arXiv:2410.02506v1 cwd

Memento: Fine-tuning LLM Agents without Fine-tuning LLMs

在本文中，我们引入了一种新颖的学习范式，用于自适应大语模型（LLM）代理，该模型消除了对基础LLM的微调需求。现有方法通常是刚性的，依赖于静态，手工的反射工作流，或计算密集型，需要LLM模型参数的梯度更新。相比之下，我们的方法可以通过基于内存的在线增强学习来实现低成本的持续适应 ...

0 0 0 2025/08/28 arXiv:2508.16153v2 baishanxiaoqi

FlowForge: Guiding the Creation of Multi-agent Workflows with Design Space Visualization as a Thinking Scaffold

多代理工作流程已成为通过将其分解为多个子任务并将其分配给专业代理商来解决复杂任务的有效策略。但是，由于庞大而复杂的设计空间，设计最佳工作流程仍然具有挑战性。当前的实践在很大程度上依赖于从业者的直觉和专业知识，通常会导致设计固定或对试验的非结构化，耗时的探索 ...

0 0 0 2025/08/28 arXiv:2507.15559v1 woodman

From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents

信息检索是现代知识获取的基石，每天都在各种领域中都有数十亿个查询。但是，传统的基于关键字的搜索引擎越来越不足以处理复杂的多步骤信息需求。我们的立场是，具有推理和代理能力的大型语言模型（LLM）正在迎来了新的范式称为“代理深度研究” ...

0 0 0 2025/08/28 arXiv:2506.18959v3 llm

Atom-Searcher: Enhancing Agentic Deep Research via Fine-Grained Atomic Thought Reward

Large language models (LLMs) exhibit remarkable problem-solving abilities, but struggle with complex tasks due to static internal knowledge.检索增强的生成（RAG）增强了对外部信息的访问，但由于严格的工作流程，多跳的推理和战略搜索仍然有限。 Recent ad ...

0 0 0 2025/08/28 arXiv:2508.12800v2 uaene

LLM-based Agentic Reasoning Frameworks: A Survey from Methods to Scenarios

大语言模型（LLM）内在推理能力（LLM）的最新进展已引起基于LLM的代理系统，这些系统在各种自动化任务上表现出近乎人类的性能。但是，尽管这些系统在使用LLM方面具有相似之处，但代理系统的不同推理框架并以不同的方式组织推理过程。在这项调查中，我们提出了一个系统的分类法，该分类法分解了代理推理框架，并分析了这些框架如何通过在不同情况下比较其应用程序来主导框架级别的推理 ...

0 0 1 2025/08/27 arXiv:2508.17692v1 JayLiu

Deploying Ten Thousand Robots: Scalable Imitation Learning for Lifelong Multi-Agent Path Finding

终生的多代理路径发现（LMAPF）反复为多种代理人找到无冲突的路径，这些路径在达到当前目标时不断分配新目标。最近，该领域采用了基于学习的方法，该方法基于各个局部观察，可以反应地生成单步操作。但是，对于他们来说，与最佳基于搜索的算法的性能相匹配，尤其是在大规模设置中，这仍然是一项挑战 ...

0 0 0 2025/08/27 arXiv:2410.21415v2 kuioma

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）