- 名称
- Mix-CPT: A Domain Adaptation Framework via Decoupling Knowledge Learning and Format Alignment
- 描述
由于不同的数据分布,使通用大语言模型(LLM)适应专业领域提出了巨大的挑战。这种适应通常需要对大量特定领域的语料库进行持续的预训练,以促进知识记忆,然后根据人类的指示和偏好进行训练以应用这些知识。然而,这种方法可能会由于缺乏知识利用意识而导致知识记忆效率低下,并且对 LLM 在有限的训练样本下同时学习知识利用和格式对齐提出了很高的要求 ...