- 名称
- ChatQA: Building GPT-4 Level Conversational QA Models
- 描述
在这项工作中,我们介绍了 ChatQA,这是一个对话式问题解答(QA)模型系列,可获得 GPT-4 级别的准确度。 具体来说,我们提出了一种两阶段指令调整方法,可以显著改善大型语言模型(LLM)的零样本会话 QA 结果。 为了处理对话式质量保证中的检索增强生成,我们在多轮质量保证数据集上对密集检索器进行了微调,其结果与使用最先进的查询重写模型相当,同时大大降低了部署成本。 值得注意的是,我们的 ChatQA-70B 在 10 个会话质量保证数据集上的平均得分超过了 GPT-4(54.14 比 53.90),而无需依赖 OpenAI GPT 模型的任何合成数据。