基本信息 - Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning

arxiv Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning

阅读

Star 0

名称: Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning

首页: https://yiyibooks.cn/arxiv/2406.14283v4/index.html

原始地址: https://arxiv.org/abs/2406.14283

描述

大型语言模型（LLM）在许多自然语言任务中表现出令人印象深刻的能力。然而，自回归生成过程使得LLM在进行多步推理时容易产生错误、幻觉和不一致陈述的。在论文中，通过将LLM的多步推理思维视为式搜索问题，我们的目标是通过引入Q*来解决病理学问题，Q*是一个通用、通用敏捷的框架，用于深思熟虑的规划指导LLM解码过程... ...

0%

上传成功 0 个文件