- 名称
- Boosting Deductive Reasoning with Step Signals In RLHF
- 描述
逻辑推理是大型语言模型 (LLM) 的一项关键任务,使它们能够解决复杂的问题。在推理任务中,多步推理提出了特殊的挑战。基于形式逻辑理论,我们开发了一种用于演绎推理数据的自动化方法,多步演绎(MuseD) ...
逻辑推理是大型语言模型 (LLM) 的一项关键任务,使它们能够解决复杂的问题。在推理任务中,多步推理提出了特殊的挑战。基于形式逻辑理论,我们开发了一种用于演绎推理数据的自动化方法,多步演绎(MuseD) ...