arxiv Evaluating Psychological Safety of Large Language Models

名称
Evaluating Psychological Safety of Large Language Models
首页
https://yiyibooks.cn/arxiv/2212.10529v3/index.html
原始地址
https://arxiv.org/abs/2212.10529
描述
在这项工作中,我们设计了公正的提示来系统地评估大型语言模型(LLM)的心理安全性。首先,我们使用两种性格测试测试了五种不同的 LLM :短黑三人格测试(SD-3)和大五人格测试(BFI)。所有模型在 SD-3 上的得分均高于人类平均水平,表明其性格模式相对较阴暗 ...