arxiv Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task

名称
Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task
首页
https://yiyibooks.cn/arxiv/1809.08887v5/index.html
原始地址
https://arxiv.org/pdf/1809.08887
描述
我们展示了 Spider,一个由 11 名大学生大规模、复杂和跨领域的语义解析和文本到 SQL 数据集组成的数据集。它由 10,181 个问题和 5,693 个独特的复杂 SQL 查询组成,涉及 200 个具有多个表的数据库,涵盖 138 个不同的领域。我们定义了一个新的复杂和跨域语义解析和文本到 SQL 任务,其中不同的复杂 SQL 查询和数据库出现在训练和测试集中... ...