通用关系提取器可以对任意关系进行建模,是信息提取的核心愿望。人们已经努力构建通用提取器,以表示与其表面形式的关系,或者将表面形式与现有知识图谱中的关系联合嵌入。然而,这两种方法的泛化能力都受到限制 ...
脚本学习研究刻板事件如何展开,使机器能够用隐含信息推理叙述。以前的作品大多将脚本视为事件的线性序列,而忽略了由于人们的环境选择而出现的潜在分支。因此,我们提出了 Choice-75,这是第一个挑战智能系统在给定描述性场景下做出决策的基准,包含 75 个脚本和 600 多个场景 ...
大型语言模型(LLM)在自然语言理解任务方面取得了相当大的进步,但在实现真正的通用人工智能之前仍然存在差距,特别是在数学推理能力方面的缺陷。我们假设 LLM 训练的本质是预测下一个 Token 的概率,这在有效建模数学推理方面提出了挑战,无论是从数据驱动的角度还是从理论的角度来看,都需要精确的计算。在本文中,我们通过丰富数据景观并引入新颖的数学数据集来应对这一挑战,并通过利用 Python 代码解释器的功能进行增强 ...
我们研究大规模知识图(KG)中学习推理的问题。更具体地说,我们描述了一种用于学习多跳关系路径的新型强化学习框架:我们使用基于知识图嵌入的具有连续状态的基于策略的代理,它通过采样最有希望的关系来扩展其在 KG 向量空间中的推理。小路。与之前的工作相比,我们的方法包括考虑准确性、多样性和效率的奖励函数 ...
图挖掘任务源于许多不同的应用领域,从社交网络、交通到电子商务等,近年来受到理论和算法设计社区的高度关注,并且已经出现了一些利用图挖掘任务的开创性工作。研究丰富的强化学习(RL)技术来解决图数据挖掘任务。然而,这些图挖掘方法和强化学习模型分散在不同的研究领域,这使得它们很难进行比较 ...
我们提出了一个开源且可扩展的知识提取工具包 DeepKE,支持知识库群体中复杂的低资源、文档级和多模式场景。 DeepKE实现了各种信息抽取任务,包括命名实体识别、关系抽取和属性抽取。通过统一的框架,DeepKE允许开发人员和研究人员定制数据集和模型,以便根据自己的需求从非结构化数据中提取信息 ...
多模态关系抽取是知识图谱构建的一项重要任务。在本文中,我们进行了深入的实证分析,表明视觉场景图中不准确的信息会导致模态对齐权重不佳,从而进一步降低性能。此外,视觉洗牌实验表明,当前的方法可能没有充分利用视觉信息 ...
大型语言模型(LLM)和检索增强生成(RAG)系统取得了进步,但它们的作用经常因多样性与社区关系结构的集成而受到阻碍,从而限制了它们事实上为提供了上下文丰富和准确检查。我们引入了CommunityKG-RAG(社区知识图搜索增强生成),这是一种新颖的零样本框架,将知识图(KG)内部的社区结构与RAG系统集成在一起CommunityKG-RAG 能够在消耗额外训练的情况下适应新的领域和查询,利用 KG 内社区结构的多跳性质来显着着信息检索的准确性和相关性提高 ... ...
多模态预训练的进步凸显了强大的多模态知识图(MMKG)表示学习框架的必要性。该框架对于将结构化知识大规模集成到多模态大语言模型(LLM)中至关重要,旨在缓解知识误解和多模态幻觉等问题。在这项工作中,为了评估模型在 MMKG 中准确嵌入实体的能力,我们重点关注两个广泛研究的任务:多模态知识图完成(MKGC)和多模态实体对齐(MMEA) ...
大型语言模型 (LLM) 在许多不同的自然语言处理 (NLP) 任务中表现出了卓越的性能。快速工程在增加 LLM 现有能力以实现各种 NLP 任务的显着性能提升方面发挥着关键作用。即时工程需要编写称为提示的自然语言指令,以结构化的方式从 LLM 中获取知识 ...