与人类一样,大型语言模型 (LLM) 并不总是在第一次尝试时生成最佳输出。受人类如何完善书面文本的启发,我们引入了 Self-Refine,这是一种通过迭代反馈和完善来改进 LLM 初始输出的方法。主要思想是使用 LLM 生成初始输出;然后,相同的 LLM 为其输出提供反馈,并使用它迭代地完善自身 ...

0 0 1 4 2024/03/29 arXiv:2303.17651v2 brzyang

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)