arxiv MemGPT: Towards LLMs as Operating Systems

/documents/74892/

基本信息

文件基本信息

名称
MemGPT: Towards LLMs as Operating Systems
描述
大型语言模型 (LLM) 彻底改变了人工智能,但受到有限的上下文窗口的限制,阻碍了它们在扩展对话和文档分析等任务中的实用性。为了能够在有限的上下文窗口之外使用上下文,我们提出了虚拟上下文管理,这是一种从传统操作系统中的分层内存系统中汲取灵感的技术,该技术通过快速内存和慢速内存之间的数据移动提供大内存资源的外观。使用这种技术,我们引入了MemGPT(Memory-GPT),这是一个智能管理不同内存层的系统,以便在LLM有限的上下文窗口内有效地提供扩展上下文,并利用中断来管理其自身和用户之间的控制流。我们在两个领域评估了受操作系统启发的设计,现代 LLM 的有限上下文窗口严重影响了其性能:文档分析,MemGPT 能够分析远远超出底层 LLM 上下文窗口的大型文档;以及多会话聊天,MemGPT 可以创建会话代理,通过与用户的长期交互来记忆、反映和动态发展。我们在此 https URL 发布了用于实验的 MemGPT 代码和数据 ...