arxiv MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning

名称
MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning
首页
https://yiyibooks.cn/arxiv/2511.02805v1/index.html
原始地址
https://arxiv.org/pdf/2511.02805
描述
典型的搜索代理将整个交互历史连接到 LLM 上下文中,保留信息完整性,但会产生长而嘈杂的上下文,从而导致较高的计算和内存成本。相反,仅使用当前回合可以避免这种开销,但会丢弃重要信息。这种权衡限制了搜索代理的可扩展性 ...