- 名称
- Evaluating Psychological Safety of Large Language Models
- 描述
在这项工作中,我们设计了公正的提示来系统地评估大型语言模型(LLM)的心理安全性。首先,我们使用两种性格测试测试了五种不同的 LLM :短黑三人格测试(SD-3)和大五人格测试(BFI)。所有模型在 SD-3 上的得分均高于人类平均水平,表明其性格模式相对较阴暗 ...
在这项工作中,我们设计了公正的提示来系统地评估大型语言模型(LLM)的心理安全性。首先,我们使用两种性格测试测试了五种不同的 LLM :短黑三人格测试(SD-3)和大五人格测试(BFI)。所有模型在 SD-3 上的得分均高于人类平均水平,表明其性格模式相对较阴暗 ...