- 名称
- Aspects of human memory and Large Language Models
- 描述
大型语言模型 (LLM) 是巨大的人工神经网络,主要用于生成文本,但也提供非常复杂的语言使用概率模型。由于生成语义一致的文本需要一种有效的记忆形式,因此我们研究了 LLM 的记忆特性,并发现与人类记忆的关键特征惊人的相似之处。我们认为,大语言模型的类人记忆特性并不是从 LLM 架构中自动遵循的,而是从训练文本数据的统计中学习的 ...
大型语言模型 (LLM) 是巨大的人工神经网络,主要用于生成文本,但也提供非常复杂的语言使用概率模型。由于生成语义一致的文本需要一种有效的记忆形式,因此我们研究了 LLM 的记忆特性,并发现与人类记忆的关键特征惊人的相似之处。我们认为,大语言模型的类人记忆特性并不是从 LLM 架构中自动遵循的,而是从训练文本数据的统计中学习的 ...