关系提取(RE)是 NLP 的核心任务,即从文本中推断实体之间的语义关系。标准监督 RE 技术需要训练模块来标记包含实体跨度的标记,然后预测它们之间的关系。最近的工作将问题视为 \emph{sequence-to-sequence} 任务,将实体之间的关系线性化为根据输入生成的目标字符串 ...
端到端关系提取旨在识别命名实体并提取它们之间的关系。最近的工作对这两个子任务进行联合建模,要么将它们放入一个结构化预测框架中,要么通过共享表示来执行多任务学习。在这项工作中,我们提出了一种用于实体和关系提取的简单流水线方法,并在标准基准(ACE04、ACE05 和 SciERC)上建立了新的最先进方法,获得了 1 ...
本文提出了 SimCSE,这是一个简单的对比学习框架,它极大地推进了最先进的句子嵌入。我们首先描述一种无监督方法,该方法采用输入句子并在对比目标中预测自身,仅使用标准 dropout 作为噪声。这种简单的方法效果出人意料地好,与之前的监督方法相当 ...
本文旨在有效地使大型语言模型(LLM)能够使用多模式工具。高级专有 LLM (例如 ChatGPT 和 GPT-4)通过复杂的提示工程显示出工具使用的巨大潜力。然而,这些模型通常依赖于高昂的计算成本和公开不可访问的数据 ...
GPT-$3$ 因其在广泛的 NLP 任务中的卓越性能而受到广泛关注,特别是其强大且通用的上下文少样本学习能力。尽管取得了成功,但我们发现 GPT-$3$ 的实证结果在很大程度上取决于上下文示例的选择。在这项工作中,我们研究是否有更有效的策略来明智地选择上下文中的示例(相对于随机采样),从而更好地利用 GPT-$3$ 的小样本功能 ...