大型语言模型(LLM)在各个领域都展现出巨大的潜力;然而,它们在信息提取(IE)方面表现出显着的性能差距。需要注意的是,高质量的教学数据是提升LLM专业能力的关键,而目前的IE数据集往往规模小、碎片化、缺乏标准化模式。为此,我们引入了IEPile,一个综合性双语(英文和中文)IE指令语料库,其中包含约0. ...

0 0 0 0 2024/05/03 arXiv:2402.14710v2 泽泽泽

我们提出了一种通过查询大型语言模型自动构建给定领域的概念层次结构的方法。我们使用 OpenAI 的 GPT 3.5 将此方法应用于各个领域 ...

0 0 0 0 2024/04/08 arXiv:2309.09898v1 泽泽泽

知识图谱(KG)为我们提供了一种结构化、灵活、透明、跨系统和协作的方式来组织社会、工业和科学学科各个领域的知识和数据。就有效性而言,KG 超越任何其他形式的代表形式。然而,知识图谱工程(KGE)需要对图结构、网络技术、现有模型和词汇、规则集、逻辑以及最佳实践的深入经验 ...

0 0 0 0 2024/04/08 arXiv:2307.06917v1 泽泽泽

事件描述实体的状态变化。在文档中,多个事件通过各种关系连接起来(例如 ...

0 0 0 0 2024/03/21 arXiv:2403.12523v1 泽泽泽

信息提取任务的难点在于处理特定于任务的标签模式和异构数据结构。最近的工作提出了基于大型语言模型的方法来统一建模不同的信息提取任务。然而,这些现有方法对于英语以外的中文信息提取能力存在缺陷 ...

0 0 0 0 2024/03/05 arXiv:2312.15548v2 泽泽泽

本文对用于知识图(KG)构建和推理的大型语言模型(LLM)进行了详尽的定量和定性评估。我们在八个不同的数据集上进行实验,重点关注四个代表性任务,包括实体和关系提取、事件提取、链接预测和问答,从而彻底探索法学硕士在构造和推理领域的表现。根据经验,我们的研究结果表明,以 GPT-4 为代表的法学硕士更适合作为推理助手,而不是少量信息提取器 ...

0 0 0 0 2024/03/05 arXiv:2305.13168v2 泽泽泽

扩展语言模型彻底改变了广泛的 NLP 任务,但很少全面探索大型语言模型的少样本关系提取。在本文中,我们通过详尽的实验研究了通过 GPT-3.5 进行少量关系提取的主要方法、上下文学习和数据生成 ...

0 0 1 2 2024/03/05 arXiv:2305.01555v4 泽泽泽

在海量语料库上预训练的大型语言模型 (LLM) 在许多 NLP 任务中表现出了令人印象深刻的小样本学习能力。常见的做法是将任务重新转换为文本到文本的格式,以便可以提示 GPT-3 等自然语言的生成式 LLM(NL-LLM)来解决它。然而,使用 NL-LLM 执行信息提取 (IE) 任务并非易事,因为 IE 任务的输出通常是结构化的,因此很难转换为纯文本 ...

0 0 0 0 2024/03/05 arXiv:2305.05711v2 泽泽泽

即使在零样本设置下,关系提取(RE)始终涉及一定程度的标记或未标记数据。最近的研究表明,只需给出自然语言提示,大型语言模型(LLM)就可以很好地迁移到开箱即用的新任务,这提供了从文本中提取关系而无需任何数据和参数调整的可能性。这项工作的重点是探索 LLM(例如 ChatGPT)作为零样本关系提取器的研究 ...

0 0 0 0 2024/03/05 arXiv:2310.05028v4 泽泽泽

信息提取(IE)旨在从自然语言文本中提取结构知识(例如实体、关系、事件),由于任务特定的模式和复杂的文本表达,这给现有方法带来了挑战 ...

0 1 0 0 2024/03/05 arXiv:2311.02962v1 泽泽泽

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)