与人类一样,大型语言模型 (LLM) 并不总是在第一次尝试时生成最佳输出。受人类如何完善书面文本的启发,我们引入了 Self-Refine,这是一种通过迭代反馈和完善来改进 LLM 初始输出的方法。主要思想是使用 LLM 生成初始输出;然后,相同的 LLM 为其输出提供反馈,并使用它迭代地完善自身 ...
与人类一样,大型语言模型 (LLM) 并不总是在第一次尝试时生成最佳输出。受人类如何完善书面文本的启发,我们引入了 Self-Refine,这是一种通过迭代反馈和完善来改进 LLM 初始输出的方法。主要思想是使用 LLM 生成初始输出;然后,相同的 LLM 为其输出提供反馈,并使用它迭代地完善自身 ...