arxiv DiQAD: A Benchmark Dataset for End-to-End Open-domain Dialogue Assessment

名称
DiQAD: A Benchmark Dataset for End-to-End Open-domain Dialogue Assessment
首页
https://yiyibooks.cn/arxiv/2310.16319v1/index.html
原始地址
https://arxiv.org/abs/2310.16319
描述
对话评估在开放域对话系统的开发中起着至关重要的作用。现有的工作无法提供端到端和人类认知评估数据集,而它们只提供子指标,例如一致性或远离真实用户设置的注释者之间进行的对话。在本文中,我们发布了大规模对话质量评估数据集(DiQAD),用于自动评估开放域对话质量 ...