基本信息 - Boosting Deductive Reasoning with Step Signals In RLHF

arxiv Boosting Deductive Reasoning with Step Signals In RLHF

阅读

Star 0

名称: Boosting Deductive Reasoning with Step Signals In RLHF

首页: https://yiyibooks.cn/arxiv/2410.09528v2/index.html

原始地址: https://arxiv.org/pdf/2410.09528

描述

逻辑推理是大型语言模型 (LLM) 的一项关键任务，使它们能够解决复杂的问题。在推理任务中，多步推理提出了特殊的挑战。基于形式逻辑理论，我们开发了一种用于演绎推理数据的自动化方法，多步演绎（MuseD） ...

文件上传进度

0%

上传成功 0 个文件