arxiv RecurrentGPT: Interactive Generation of (Arbitrarily) Long Text

名称
RecurrentGPT: Interactive Generation of (Arbitrarily) Long Text
首页
https://yiyibooks.cn/arxiv/2305.13304v1/index.html
原始地址
https://arxiv.org/abs/2305.13304
描述
Transformer 的固定大小上下文使得 GPT 模型无法生成任意长的文本。在本文中,我们介绍了 RecurrentGPT,这是一种基于语言的 RNN 递归机制模拟。 RecurrentGPT 建立在 ChatGPT 等大型语言模型 (LLM) 的基础上,并使用自然语言来模拟 LSTM 中的长短期记忆机制 ...