我们探索关系分类(RC)的少样本学习(FSL)。着眼于 FSL 的现实场景,其中测试实例可能不属于任何目标类别(以上都不是,又名 NOTA),我们首先重新审视最近流行的 FSL 数据集结构,指出其不切实际数据分布。为了解决这个问题,我们提出了一种新的方法,用于从监督 RC 的可用数据集中导出更真实的几次测试数据,并将其应用于 TACRED 数据集 ...

0 0 0 0 2024/11/04 arXiv:2104.08481v1 张小平

从段落中提取多个关系的大多数方法都需要多次遍历该段落。在实践中,多次传递的计算成本很高,这使得难以扩展到更长的段落和更大的文本语料库。在这项工作中,我们通过仅对段落进行一次编码(单遍)来专注于多重关系提取的任务 ...

0 0 0 0 2024/11/04 arXiv:1902.01030v2 张小平

本文研究了少镜头关系提取,旨在通过在每个关系中使用一些标记示例进行训练来预测句子中一对实体的关系。为了更有效地推广到新的关系,在本文中,我们研究了不同关系之间的关系,并建议利用全局关系图。我们提出了一种新颖的贝叶斯元学习方法来有效学习关系原型向量的后验分布,其中原型向量的初始先验通过全局关系图上的图神经网络进行参数化 ...

0 0 0 0 2024/10/21 arXiv:2007.02387v1 张小平

多标签方面类别检测允许给定的评论句子包含多个方面类别,这在情感分析中更加实用并吸引了越来越多的关注。由于注释大量数据既费时又费力,因此在现实场景中经常出现数据稀缺的情况,这激发了多标签少样本方面类别检测。然而,对于这个问题的研究仍处于起步阶段,可用的方法还很少 ...

0 0 0 0 2024/09/29 arXiv:2206.13980v1 张小平

我们提出了 FewRel 2.0,这是一项更具挑战性的任务,用于研究少镜头关系分类模型的两个方面:(1)它们能否适应只有少数实例的新领域? (2) 他们能否检测到非上述 (NOTA) 关系?为了构建 FewRel 2.0,我们基于 FewRel 数据集(Han 等人 ...

0 0 0 0 2024/09/05 arXiv:1910.07124v1 张小平

我们提出了一个少样本关系分类数据集 (FewRel),由源自维基百科并由众包工作者注释的 100 个关系的 70, 000 个句子组成。每个句子的关系首先通过远程监督方法识别,然后通过众包过滤。我们采用最新的最先进的少样本学习方法进行关系分类,并对这些方法进行彻底的评估 ...

0 0 0 0 2024/09/05 arXiv:1810.10147v2 张小平

少样本关系提取(FSRE)旨在从一组稀疏的标记语料库中提取关系事实。最近的研究表明,通过在监督对比学习框架内使用预训练语言模型 (PLM),FSRE 取得了有希望的结果,该模型同时考虑了实例和标签事实。然而,在这种学习范式中如何有效地利用大量实例标签对来包含具有丰富语义的学习表示尚未得到充分探索 ...

0 0 0 0 2024/09/02 arXiv:2312.12021v3 张小平

文档级关系提取(DocRE)旨在从多个句子的文档中确定两个实体之间的关系。最近的研究通常通过基于序列或图的模型来表示整个文档,以预测所有实体对的关系。然而,我们发现这样的模型并不稳健,并且表现出奇怪的行为:当整个测试文档作为输入时,它可以正确预测,但当删除非证据句子时,它会出错 ...

0 0 0 0 2024/07/25 arXiv:2204.12679v1 张小平

我们引入了用于少样本关系提取的元数据集,其中包括源自现有监督关系提取数据集 NYT29(Takanobu 等人,2019;Nayak 和 Ng,2020)和 WIKIDATA(Sorokin 和 Gurevych,2017)的两个数据集以及TACRED 数据集的少样本形式(Sabo 等人,2021) ...

0 0 1 3 2024/06/11 arXiv:2404.04445v1 张小平

知识增强深度学习范式是指识别领域知识并将其集成到深度模型中的范式。传统方法通常采用特定于任务的方法从各种来源收集外部知识。相比之下,大型语言模型经过广泛的预训练,可以作为外部知识的综合来源 ...

0 0 0 0 2024/04/24 arXiv:2307.01640v1 张小平

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)