- 名称
- Knowledge Fusion of Large Language Models
- 描述
虽然从头开始训练大型语言模型(LLM)可以生成具有独特功能和优势的模型,但其成本很高,并且可能会导致功能发音。或者,一种经济有效且引人注目的方法足以显现有的预训练LLM合并到更有效的模型中。然而,由于这些LLM的架构不同,直接混合它们的权重是不切实际的... ...
虽然从头开始训练大型语言模型(LLM)可以生成具有独特功能和优势的模型,但其成本很高,并且可能会导致功能发音。或者,一种经济有效且引人注目的方法足以显现有的预训练LLM合并到更有效的模型中。然而,由于这些LLM的架构不同,直接混合它们的权重是不切实际的... ...