为了构建指定的识别实体并提取它们之间的关系。最近的工作对这两个子任务进行联合建模,或者将它们放入一个构造预测框架中,或者通过共享表示来执行多个任务学习。在这项工作中,我们提出了一种用于实体和关系提取的简单模拟方法,并在标准基准(ACE04、ACE05和SciERC)上建立了新的最先进方法,获得了1.. ...
本文提出了 SimCSE,这是一个简单的对比学习框架,它极大地推进了最先进的句子嵌入。我们首先描述一种无监督方法,该方法采用输入句子并在对比目标中预测自身,仅使用标准 dropout 作为噪声。这种简单的方法效果出人意料地好,与之前的监督方法相当 ...
本文旨在有效地使大型语言模型(LLM)能够使用多模式工具。高级母语 LLM(例如 ChatGPT 和 GPT-4)通过复杂的提示工程显示出工具使用的巨大潜力。然而,这些模型通常依赖于高昂的计算成本和公开不可访问的数据...... ...
GPT-$3$ 在广泛的 NLP 任务中的卓越表现而受到广泛关注,特别是其强大且通用的上下文少样本学习能力。虽然取得了成功,但我们发现 GPT-$3$ 的相似结果在很大上下文围绕上下文中的选择。在这项工作中,我们研究是否有更有效的策略来明智地选择上下文中的上下文(相对于随机采样),从而更好地利用 GPT-$3$ 的小样本功能... ...