我们提出了 FewRel 2.0,这是一项更具挑战性的任务,用于研究少镜头关系分类模型的两个方面:(1)它们能否适应只有少数实例的新领域? (2) 他们能否检测到非上述 (NOTA) 关系?为了构建 FewRel 2.0,我们基于 FewRel 数据集(Han 等人 ...
我们提出了一个少样本关系分类数据集 (FewRel),由源自维基百科并由众包工作者注释的 100 个关系的 70, 000 个句子组成。每个句子的关系首先通过远程监督方法识别,然后通过众包过滤。我们采用最新的最先进的少样本学习方法进行关系分类,并对这些方法进行彻底的评估 ...
少样本关系提取(FSRE)旨在从一组稀疏的标记语料库中提取关系事实。最近的研究表明,通过在监督对比学习框架内使用预训练语言模型 (PLM),FSRE 取得了有希望的结果,该模型同时考虑了实例和标签事实。然而,在这种学习范式中如何有效地利用大量实例标签对来包含具有丰富语义的学习表示尚未得到充分探索 ...
文档级关系提取(DocRE)旨在从多个句子的文档中确定两个实体之间的关系。最近的研究通常通过基于序列或图的模型来表示整个文档,以预测所有实体对的关系。然而,我们发现这样的模型并不稳健,并且表现出奇怪的行为:当整个测试文档作为输入时,它可以正确预测,但当删除非证据句子时,它会出错 ...
在基于图像的环境中学习有效的表示对于样本高效的强化学习(RL)至关重要。不幸的是,在强化学习中,表示学习与智能体的探索经验相混淆——学习有用的表示需要不同的数据,而有效的探索只有通过连贯的表示才能实现。此外,我们希望学习的表示不仅能够跨任务泛化,还能加速下游探索,以实现高效的特定任务训练 ...
我们引入了用于少样本关系提取的元数据集,其中包括源自现有监督关系提取数据集 NYT29(Takanobu 等人,2019;Nayak 和 Ng,2020)和 WIKIDATA(Sorokin 和 Gurevych,2017)的两个数据集以及TACRED 数据集的少样本形式(Sabo 等人,2021) ...
知识增强深度学习范式是指识别领域知识并将其集成到深度模型中的范式。传统方法通常采用特定于任务的方法从各种来源收集外部知识。相比之下,大型语言模型经过广泛的预训练,可以作为外部知识的综合来源 ...
如果训练期间有足够的注释,关系提取(RE)任务在从句子中提到的两个实体中提取关系方面表现出了良好的性能。在实践中获得这样的注释将是劳动密集型的。现有的工作采用数据增强技术来生成超出有限注释的伪注释句子 ...
与句子级关系提取(DocRE)相比,文档级关系提取(DocRE)是一项更具挑战性的任务。它的目的是一次从多个句子中提取关系。在本文中,我们提出了一个具有三个新颖组件的 DocRE 半监督框架 ...
无监督关系提取(URE)旨在从开放域纯文本中发现命名实体对之间的潜在关系,而无需关系分布的先验信息。现有的URE模型利用对比学习,吸引正样本并排斥负样本以促进更好的分离,取得了不错的效果。然而,关系中细粒度的关系语义会产生虚假的负样本,破坏了固有的层次结构并阻碍了性能 ...