arxiv Aligning Large Language Models with Representation Editing: A Control Perspective

名称
Aligning Large Language Models with Representation Editing: A Control Perspective
首页
https://yiyibooks.cn/arxiv/2406.05954v2/index.html
原始地址
https://arxiv.org/pdf/2406.05954.pdf
描述
将大型语言模型(LLM)与人类目标保持一致对于实际应用至关重要。然而,LLM以进行校准通常会受到训练不稳定的影响,并且需要大量的计算资源。测试时校准技术(例如提示和)引导解码)不会修改底层模型,并且它们的性能仍然依赖于原始模型的功能... ...