如果训练期间有足够的注释,关系提取(RE)任务在从句子中提到的两个实体中提取关系方面表现出了良好的性能。在实践中获得这样的注释将是劳动密集型的。现有的工作采用数据增强技术来生成超出有限注释的伪注释句子 ...
与句子级关系提取(DocRE)相比,文档级关系提取(DocRE)是一项更具挑战性的任务。它的目的是一次从多个句子中提取关系。在本文中,我们提出了一个具有三个新颖组件的 DocRE 半监督框架 ...
无监督关系提取(URE)旨在从开放域纯文本中发现命名实体对之间的潜在关系,而无需关系分布的先验信息。现有的URE模型利用对比学习,吸引正样本并排斥负样本以促进更好的分离,取得了不错的效果。然而,关系中细粒度的关系语义会产生虚假的负样本,破坏了固有的层次结构并阻碍了性能 ...
“搭便车”问题长期以来一直困扰着基于协作学习的教学法。搭便车问题最常见的解决方案是同行评估。其他现有的同伴评价方法也包括自我评价——因此很容易出现成绩膨胀,或者正如我们在这里所示,它们不准确,因为它们没有公平地奖励最努力的学生 ...
与句子级关系提取(RE)相比,文档级关系提取(RE)提出了新的挑战。一篇文档通常包含多个实体对,并且一个实体对在文档中多次出现,并与多种可能的关系相关联。在本文中,我们提出了两种新颖的技术,自适应阈值和局部上下文池,来解决多标签和多实体问题 ...
当只有少数带标签的文档可用时,如何识别文档中实体之间的语义关系?小样本文档级关系提取(FSDLRE)对于解决现实场景中普遍存在的数据稀缺问题至关重要。基于度量的元学习是 FSDLRE 广泛采用的有效框架,它构建用于分类的类原型。然而,现有的工作通常很难获得具有准确关系语义的类原型:1)为了构建目标关系类型的原型,它们聚合了持有该关系的所有实体对的表示,而这些实体对也可能持有其他关系,从而造成干扰原型 ...
区分具有有限标记实例的实体对之间的关系对少样本关系分类提出了重大挑战。文本数据的表示提取跨越领域、实体和关系的丰富信息。在本文中,我们介绍了一种结合多句子表示和对比学习来增强信息提取的新方法 ...
我们提出了 FREDo,一个几次文档级关系提取 (FSDLRE) 基准测试。与建立在句子级关系提取语料库上的现有基准相反,我们认为文档级语料库提供了更多的真实性,特别是对于非上述(NOTA)分布。因此,我们提出了一组 FSDLRE 任务,并基于两个现有的监督学习数据集 DocRED 和 sciERC 构建了基准 ...
文档级关系提取(DocRE)旨在从长上下文中提取关系,是实现细粒度结构理解和生成可解释文档表示的关键挑战。受到ChatGPT等大型语言模型(LLM)中上下文学习能力最新进展的启发,我们的目标是为 DocRE 设计一种自动注释方法实现最少的人力。不幸的是,由于大量预定义的细关系粒度类型和不受 LLM 生成的控制,文档级关系的普通上下文学习可以说是不方便的... ...
关系提取(RE)是 NLP 的核心任务,即从文本中推断实体之间的语义关系。标准监督 RE 技术需要训练模块来标记包含实体跨度的标记,然后预测它们之间的关系。最近的工作将问题视为 \emph{sequence-to-sequence} 任务,将实体之间的关系线性化为根据输入生成的目标字符串 ...