arxiv High-Dimension Human Value Representation in Large Language Models

名称
High-Dimension Human Value Representation in Large Language Models
首页
https://yiyibooks.cn/arxiv/2404.07900v3/index.html
原始地址
https://arxiv.org/pdf/2404.07900
描述
大型语言模型 (LLM) 在各种任务和领域的广泛应用使得这些模型必须与人类价值观和偏好保持一致。鉴于人类价值调整的方法多种多样,从人类反馈强化学习(RLHF)到宪法学习等,迫切需要在模型发布之前了解注入这些模型的人类价值的范围和性质 ...