少样本关系提取(FSRE)旨在从一组稀疏的标记语料库中提取关系事实。最近的研究表明,通过在监督对比学习框架内使用预训练语言模型 (PLM),FSRE 取得了有希望的结果,该模型同时考虑了实例和标签事实。然而,在这种学习范式中如何有效地利用大量实例标签对来包含具有丰富语义的学习表示尚未得到充分探索 ...
文档级关系提取(DocRE)旨在从多个句子的文档中确定两个实体之间的关系。最近的研究通常通过基于序列或图的模型来表示整个文档,以预测所有实体对的关系。然而,我们发现这样的模型并不稳健,并且表现出奇怪的行为:当整个测试文档作为输入时,它可以正确预测,但当删除非证据句子时,它会出错 ...
我们引入了用于少样本关系提取的元数据集,其中包括源自现有监督关系提取数据集 NYT29(Takanobu 等人,2019;Nayak 和 Ng,2020)和 WIKIDATA(Sorokin 和 Gurevych,2017)的两个数据集以及TACRED 数据集的少样本形式(Sabo 等人,2021) ...
知识增强深度学习范式是指识别领域知识并将其集成到深度模型中的范式。传统方法通常采用特定于任务的方法从各种来源收集外部知识。相比之下,大型语言模型经过广泛的预训练,可以作为外部知识的综合来源 ...
如果训练期间有足够的注释,关系提取(RE)任务在从句子中提到的两个实体中提取关系方面表现出了良好的性能。在实践中获得这样的注释将是劳动密集型的。现有的工作采用数据增强技术来生成超出有限注释的伪注释句子 ...
与句子级关系提取(DocRE)相比,文档级关系提取(DocRE)是一项更具挑战性的任务。它的目的是一次从多个句子中提取关系。在本文中,我们提出了一个具有三个新颖组件的 DocRE 半监督框架 ...
无监督关系提取(URE)旨在从开放域纯文本中发现命名实体对之间的潜在关系,而无需关系分布的先验信息。现有的URE模型利用对比学习,吸引正样本并排斥负样本以促进更好的分离,取得了不错的效果。然而,关系中细粒度的关系语义会产生虚假的负样本,破坏了固有的层次结构并阻碍了性能 ...
“搭便车”问题长期以来一直困扰着基于协作学习的教学法。搭便车问题最常见的解决方案是同行评估。其他现有的同伴评价方法也包括自我评价——因此很容易出现成绩膨胀,或者正如我们在这里所示,它们不准确,因为它们没有公平地奖励最努力的学生 ...
与句子级关系提取(RE)相比,文档级关系提取(RE)提出了新的挑战。一篇文档通常包含多个实体对,并且一个实体对在文档中多次出现,并与多种可能的关系相关联。在本文中,我们提出了两种新颖的技术,自适应阈值和局部上下文池,来解决多标签和多实体问题 ...
当只有少数带标签的文档可用时,如何识别文档中实体之间的语义关系?小样本文档级关系提取(FSDLRE)对于解决现实场景中普遍存在的数据稀缺问题至关重要。基于度量的元学习是 FSDLRE 广泛采用的有效框架,它构建用于分类的类原型。然而,现有的工作通常很难获得具有准确关系语义的类原型:1)为了构建目标关系类型的原型,它们聚合了持有该关系的所有实体对的表示,而这些实体对也可能持有其他关系,从而造成干扰原型 ...