arxiv Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

名称
Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment
首页
https://yiyibooks.cn/arxiv/2403.11124v2/index.html
原始地址
https://arxiv.org/pdf/2403.11124
描述
与人类偏好保持一致可以防止大型语言模型 (LLM) 生成误导性或有毒内容,同时需要高成本的人类反馈。假设人类注释资源有限,有两种不同的分配方式可供考虑:更多样化的提示或更多样化的待标记响应。尽管如此,它们的影响之间还没有直接的比较 ...