arxiv Training Language Models to Reason Efficiently

名称
Training Language Models to Reason Efficiently
首页
https://yiyibooks.cn/arxiv/2502.04463v4/index.html
原始地址
https://arxiv.org/abs/2502.04463
描述
缩放模型的规模和培训数据已导致大语言模型(LLM)的性能取得了长足进步。但是,这种方法的回报减少需要替代方法来提高模型功能,尤其是在需要高级推理的任务中。利用长长的思想链的大型推理模型为解决问题的能力带来了前所未有的突破,但与长代相关的大量部署成本 ...