- 名称
- Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning
- 描述
大型语言模型(LLM)在许多自然语言任务中表现出令人印象深刻的能力。然而,自回归生成过程使得LLM在进行多步推理时容易产生错误、幻觉和不一致陈述的。在论文中,通过将LLM的多步推理思维视为式搜索问题,我们的目标是通过引入Q*来解决病理学问题,Q*是一个通用、通用敏捷的框架,用于深思熟虑的规划指导LLM解码过程... ...
大型语言模型(LLM)在许多自然语言任务中表现出令人印象深刻的能力。然而,自回归生成过程使得LLM在进行多步推理时容易产生错误、幻觉和不一致陈述的。在论文中,通过将LLM的多步推理思维视为式搜索问题,我们的目标是通过引入Q*来解决病理学问题,Q*是一个通用、通用敏捷的框架,用于深思熟虑的规划指导LLM解码过程... ...