区分具有有限标记实例的实体对之间的关系对少样本关系分类提出了重大挑战。文本数据的表示提取跨越领域、实体和关系的丰富信息。在本文中,我们介绍了一种结合多句子表示和对比学习来增强信息提取的新方法 ...
我们提出了 FREDo,一个几次文档级关系提取 (FSDLRE) 基准测试。与建立在句子级关系提取语料库上的现有基准相反,我们认为文档级语料库提供了更多的真实性,特别是对于非上述(NOTA)分布。因此,我们提出了一组 FSDLRE 任务,并基于两个现有的监督学习数据集 DocRED 和 sciERC 构建了基准 ...
文档级关系提取(DocRE)旨在从长上下文中提取关系,是实现细粒度结构理解和生成可解释文档表示的关键挑战。受到ChatGPT等大型语言模型(LLM)中上下文学习能力最新进展的启发,我们的目标是为 DocRE 设计一种自动注释方法实现最少的人力。不幸的是,由于大量预定义的细关系粒度类型和不受 LLM 生成的控制,文档级关系的普通上下文学习可以说是不方便的... ...
关系提取(RE)是 NLP 的核心任务,即从文本中推断实体之间的语义关系。标准监督 RE 技术需要训练模块来标记包含实体跨度的标记,然后预测它们之间的关系。最近的工作将问题视为 \emph{sequence-to-sequence} 任务,将实体之间的关系线性化为根据输入生成的目标字符串 ...
为了构建指定的识别实体并提取它们之间的关系。最近的工作对这两个子任务进行联合建模,或者将它们放入一个构造预测框架中,或者通过共享表示来执行多个任务学习。在这项工作中,我们提出了一种用于实体和关系提取的简单模拟方法,并在标准基准(ACE04、ACE05和SciERC)上建立了新的最先进方法,获得了1.. ...
simcse,这是一个简单的对比学习框架,它极大地推进了最先进的句子嵌入。我们首先描述一种无监督方法,该方法采用输入句子并在对比目标中预测自身 ...
本文旨在有效地使大型语言模型(LLM)能够使用多模式工具。高级母语 LLM(例如 ChatGPT 和 GPT-4)通过复杂的提示工程显示出工具使用的巨大潜力。然而,这些模型通常依赖于高昂的计算成本和公开不可访问的数据...... ...
GPT-$3$ 在广泛的 NLP 任务中的卓越表现而受到广泛关注,特别是其强大且通用的上下文少样本学习能力。虽然取得了成功,但我们发现 GPT-$3$ 的相似结果在很大上下文围绕上下文中的选择。在这项工作中,我们研究是否有更有效的策略来明智地选择上下文中的上下文(相对于随机采样),从而更好地利用 GPT-$3$ 的小样本功能... ...