- 名称
- RegMix: Data Mixture as Regression for Language Model Pre-training
- 描述
大型语言模型预训练的数据混合会对性能产生显着影响,但如何确定有效的混合仍然是雅典娜。我们建议RegMix通过将其制定的回归任务来自动识别数据混合。RegMix涉及使用不同的数据混合训练一组小模型,并返回回归模型以预测它们各自混合的性能... ...
大型语言模型预训练的数据混合会对性能产生显着影响,但如何确定有效的混合仍然是雅典娜。我们建议RegMix通过将其制定的回归任务来自动识别数据混合。RegMix涉及使用不同的数据混合训练一组小模型,并返回回归模型以预测它们各自混合的性能... ...