基本信息 - Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

arxiv Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

阅读

Star 1

名称: Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

首页: https://yiyibooks.cn/arxiv/2403.11124v2/index.html

原始地址: https://arxiv.org/pdf/2403.11124

描述

与人类偏好保持一致可以防止大型语言模型 (LLM) 生成误导性或有毒内容，同时需要高成本的人类反馈。假设人类注释资源有限，有两种不同的分配方式可供考虑：更多样化的提示或更多样化的待标记响应。尽管如此，它们的影响之间还没有直接的比较 ...

文件上传进度

0%

上传成功 0 个文件