arxiv KTO: Model Alignment as Prospect Theoretic Optimization

名称
KTO: Model Alignment as Prospect Theoretic Optimization
首页
https://yiyibooks.cn/arxiv/2402.01306v1/index.html
原始地址
https://arxiv.org/pdf/2402.01306.pdf
描述
Kahneman 和 Tversky 的 $\textit{前景理论}$ 告诉我们,人类以一种有偏见但定义明确的方式感知随机变量;例如,人类是出了名的厌恶损失。我们表明,使法学硕士与人类反馈保持一致的目标隐含地包含了许多这些偏见——这些目标的成功(例如, ...