在本文中,我们引入了一种新颖的学习范式,用于自适应大语模型(LLM)代理,该模型消除了对基础LLM的微调需求。现有方法通常是刚性的,依赖于静态,手工的反射工作流,或计算密集型,需要LLM模型参数的梯度更新。相比之下,我们的方法可以通过基于内存的在线增强学习来实现低成本的持续适应 ...
0 0 0 2025/08/25 arXiv:2508.16153v1 astonishe

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)