- 名称
- Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On
- 描述
在本文中,我们研究了潜在增强大型语言模型(LLM)数学推理能力的潜在因素。我们认为,现代 LLM 数学推理能力的数据缩放定律远未达到饱和,这凸显了模型的质量如何随着数据量的增加而提高。为了支持这一说法,我们引入了 Skywork-Math 模型系列,使用我们提出的 2 对常见 7B LLM 进行监督微调 (SFT) ...