- 名称
- Scaling Laws for Precision
- 描述
低精度训练和推理会影响语言模型的质量和成本,但当前的缩放法则并未考虑到这一点。在这项工作中,我们为训练和推理设计了“精确感知”的缩放法则。我们建议,较低精度的训练会减少模型的“有效参数计数”,使我们能够预测低精度训练和训练后量化所产生的额外损失 ...
低精度训练和推理会影响语言模型的质量和成本,但当前的缩放法则并未考虑到这一点。在这项工作中,我们为训练和推理设计了“精确感知”的缩放法则。我们建议,较低精度的训练会减少模型的“有效参数计数”,使我们能够预测低精度训练和训练后量化所产生的额外损失 ...