- 名称
- Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment
- 描述
与人类偏好保持一致可以防止大型语言模型 (LLM) 生成误导性或有毒内容,同时需要高成本的人类反馈。假设人类注释资源有限,有两种不同的分配方式可供考虑:更多样化的提示或更多样化的待标记响应。尽管如此,它们的影响之间还没有直接的比较 ...
与人类偏好保持一致可以防止大型语言模型 (LLM) 生成误导性或有毒内容,同时需要高成本的人类反馈。假设人类注释资源有限,有两种不同的分配方式可供考虑:更多样化的提示或更多样化的待标记响应。尽管如此,它们的影响之间还没有直接的比较 ...