最近有关事件提取的工作已将该任务重新定义为问答(QA),并取得了有希望的结果。这种方法的优点在于,它通过直接预测事件参数而不首先提取候选者来解决传统基于标记的分类方法中发现的错误传播问题。然而,这些问题通常基于固定模板,很少利用相关论点等上下文信息 ...
当前的生成知识图构建方法通常无法通过简单地将自然语言扁平化为序列化文本或规范语言来捕获结构知识。然而,在代码等结构化数据上训练的大型生成语言模型在理解自然语言以进行结构预测和推理任务方面表现出了令人印象深刻的能力。直观地,我们解决了使用代码语言模型构建生成知识图的任务:给定代码格式的自然语言输入,目标是生成可以表示为代码完成任务的三元组 ...
语言大型模型通过阅读指导性提示解锁了强大的多任务功能。然而,最近的研究表明,现有的大型模型在信息提取任务上仍然存在困难。例如,gpt-3 ... ...
尽管大规模语言模型(LLM)已经在各个 NLP 任务上实现了 SOTA 性能,但其在 NER 上的性能仍然明显低于监督基线。这是由于 NER 和 LLM 两个任务之间的差距造成的:上面本质上是序列标记任务,而今晚是文本生成模型。在本文中,我们提出GPT-NER来解决这个问题... ...
传统的信息提取(IE)方法受到预定义类和静态训练范例的限制,通常在适应性方面表现不佳,尤其是在动态世界中。为了弥补这一差距,我们在本文中探索了一种基于指令的 IE 范例,利用大型语言模型 (LLM) 的强大跨任务泛化能力。我们观察到,大多数现有的 IE 数据集的标签集往往过于冗余,这导致在构建指令时包含大量与提取内容不直接相关的标签 ...
令人惊讶的是,大型语言模型 (LLM) 以及不断增长的基于提示的启发式方法现在提供了强大的现成方法,为无数经典的 NLP 问题提供了少量解决方案。然而,尽管早期结果很有希望,这些基于法学硕士的小样本方法仍然距离命名实体识别(NER)的最先进水平还很远,其中流行的方法包括通过端到端结构理解和微调来学习表示。标准标记语料库。在本文中,我们介绍了 PromptNER,这是一种用于少样本和跨域 NER 的最先进的新算法 ...
大型语言模型(LLM)已表现出卓越的通用性,例如理解任意实体和关系。事实证明,指令调整对于将 LLM 提炼成更具成本效益的模型(例如 Alpaca 和 Vicuna)是有效的。然而,这样的学生模型在下游应用中仍然远远落后于最初的法学硕士 ...
天体标识符等天文知识实体对于文献检索、知识图谱构建以及天文学领域的其他研究和应用至关重要。从文本中提取知识实体的传统方法面临着手动工作量大、泛化性差和维护成本高等挑战。因此,迫切需要改进方法来有效提取它们 ...
探索强大的大语言模型(LLM)在基本命名实体识别(NER)任务中的应用最近引起了广泛关注。这项工作旨在研究通过免训练的自我改进策略利用 LLM 突破零样本 NER 边界的可能性。我们提出了一个自我改进的框架,利用未标记的语料库来激发法学硕士在 NER 上的自学习能力 ...
大型语言模型 (LLM) 与指令调优相结合,在泛化到未见过的任务时取得了重大进展。然而,它们在信息提取(IE)方面不太成功,落后于特定任务模型。通常,IE 任务的特点是复杂的注释指南,这些指南描述任务并向人类提供示例 ...