arxiv Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On

名称
Skywork-Math: Data Scaling Laws for Mathematical Reasoning in Large Language Models -- The Story Goes On
首页
https://yiyibooks.cn/arxiv/2407.08348v1/index.html
原始地址
https://arxiv.org/pdf/2407.08348
描述
在本文中,我们研究了潜在增强大型语言模型(LLM)数学推理能力的潜在因素。我们认为,现代 LLM 数学推理能力的数据缩放定律远未达到饱和,这凸显了模型的质量如何随着数据量的增加而提高。为了支持这一说法,我们引入了 Skywork-Math 模型系列,使用我们提出的 2 对常见 7B LLM 进行监督微调 (SFT) ...