- 名称
- RecurrentGPT: Interactive Generation of (Arbitrarily) Long Text
- 描述
Transformer 的固定大小上下文使得 GPT 模型无法生成任意长的文本。在本文中,我们介绍了 RecurrentGPT,这是一种基于语言的 RNN 递归机制模拟。 RecurrentGPT 建立在 ChatGPT 等大型语言模型 (LLM) 的基础上,并使用自然语言来模拟 LSTM 中的长短期记忆机制 ...
Transformer 的固定大小上下文使得 GPT 模型无法生成任意长的文本。在本文中,我们介绍了 RecurrentGPT,这是一种基于语言的 RNN 递归机制模拟。 RecurrentGPT 建立在 ChatGPT 等大型语言模型 (LLM) 的基础上,并使用自然语言来模拟 LSTM 中的长短期记忆机制 ...