- 名称
- DiQAD: A Benchmark Dataset for End-to-End Open-domain Dialogue Assessment
- 描述
对话评估在开放域对话系统的开发中起着至关重要的作用。现有的工作无法提供端到端和人类认知评估数据集,而它们只提供子指标,例如一致性或远离真实用户设置的注释者之间进行的对话。在本文中,我们发布了大规模对话质量评估数据集(DiQAD),用于自动评估开放域对话质量 ...
对话评估在开放域对话系统的开发中起着至关重要的作用。现有的工作无法提供端到端和人类认知评估数据集,而它们只提供子指标,例如一致性或远离真实用户设置的注释者之间进行的对话。在本文中,我们发布了大规模对话质量评估数据集(DiQAD),用于自动评估开放域对话质量 ...