arxiv IEPile: Unearthing Large-Scale Schema-Based Information Extraction Corpus

名称
IEPile: Unearthing Large-Scale Schema-Based Information Extraction Corpus
首页
https://yiyibooks.cn/arxiv/2402.14710v2/index.html
原始地址
https://arxiv.org/abs/2402.14710
描述
大型语言模型(LLM)在各个领域都展现出巨大的潜力;然而,它们在信息提取(IE)方面表现出显着的性能差距。需要注意的是,高质量的教学数据是提升LLM专业能力的关键,而目前的IE数据集往往规模小、碎片化、缺乏标准化模式。为此,我们引入了IEPile,一个综合性双语(英文和中文)IE指令语料库,其中包含约0. ...