arxiv Boosting Deductive Reasoning with Step Signals In RLHF

名称
Boosting Deductive Reasoning with Step Signals In RLHF
首页
https://yiyibooks.cn/arxiv/2410.09528v2/index.html
原始地址
https://arxiv.org/pdf/2410.09528
描述
逻辑推理是大型语言模型 (LLM) 的一项关键任务,使它们能够解决复杂的问题。在推理任务中,多步推理提出了特殊的挑战。基于形式逻辑理论,我们开发了一种用于演绎推理数据的自动化方法,多步演绎(MuseD) ...