关系数据库中存储的数据量不断增加,导致各个部门需要高效查询和利用这些数据。然而,编写 SQL 查询需要专业知识,这给尝试访问和查询数据库的非专业用户带来了挑战。文本到 SQL 解析通过将自然语言查询转换为 SQL 查询来解决这个问题,从而使非专家用户更容易访问数据库 ...
自然语言处理 (NLP) 技术彻底改变了我们与信息系统交互的方式,重点是将自然语言查询转换为正式查询语言(例如 SQL)。然而,语料库查询语言 (CQL) 却不受重视,它是文本语料库中语言研究和详细分析的关键工具。手动构建 CQL 查询是一项复杂且耗时的任务,需要大量专业知识,这对研究人员和从业者来说都是一个巨大的挑战 ...
我们提供了材料科学知识图问答 (KGQA4MAT) 的综合基准数据集,重点关注金属有机框架 (MOF)。通过整合结构化数据库和从文献中提取的知识,构建了金属有机框架(MOF-KG)的知识图。为了增强领域专家对 MOF-KG 的可访问性,我们的目标是开发一个用于查询知识图谱的自然语言界面 ...
我们展示了 Spider,一个由 11 名大学生大规模、复杂和跨领域的语义解析和文本到 SQL 数据集组成的数据集。它由 10,181 个问题和 5,693 个独特的复杂 SQL 查询组成,涉及 200 个具有多个表的数据库,涵盖 138 个不同的领域。我们定义了一个新的复杂和跨域语义解析和文本到 SQL 任务,其中不同的复杂 SQL 查询和数据库出现在训练和测试集中... ...
图数据库(Graph DB)广泛应用于各个领域,包括金融、社交网络和医学。然而,由于其固有的复杂性和专业性,将自然语言(NL)转换为图形查询语言(GQL)(通常称为NL2GQL)被证明是具有挑战性的。一些方法试图利用大型语言模型 (LLM) 来解决类似的任务,例如 text2SQL ...
最近,大型语言模型 (LLM) 在各种自然语言处理应用中取得的成功,为利用 LLM 的基于知识图谱的新型问答系统开辟了道路。然而,阻碍其实现的主要障碍之一是缺乏将问题转换为相应 SPARQL 查询的训练数据,特别是在特定于领域的知识图谱的情况下。为了克服这一挑战,在本研究中,我们评估了几种微调 OpenLlama LLM 生命科学知识图问答的策略 ...
通过提供嵌入到传递给大语言模型 (LLM) 的提示中的上下文信息来一致地生成高质量答案取决于信息检索的质量。随着上下文信息语料库的增长,基于检索增强生成 (RAG) 的问答 (QA) 系统的答案/推理质量会下降。这项工作通过将经典文本分类与大语言模型(LLM)相结合来解决这个问题,从而能够从向量存储中快速检索信息并确保检索信息的相关性 ...
知识图(KG)中的特征选择越来越多地应用于不同领域,包括生物医学研究、自然语言处理(NLP)和个性化推荐系统。本文深入研究了知识图谱中的特征选择方法,强调了它们在增强机器学习 (ML) 模型功效、假设生成和可解释性方面的作用。通过这次全面的审查,我们的目标是促进知识图谱特征选择的进一步创新,为跨不同领域的更富有洞察力、更高效、更可解释的分析模型铺平道路 ...
将大型语言模型 (LLM) 与现有知识图谱 (KG) 数据库集成,为提高 LLM 的效率和减轻其“幻觉”提供了一条有前途的途径。鉴于大多数知识图谱驻留在图形数据库中,只能通过专门的查询语言(例如 ...
过去几十年见证了数据的激增,为需要数据、基于学习的人工智能技术奠定了基础。会话代理(通常称为 AI 聊天机器人)严重依赖此类数据来训练大型语言模型 (LLM) 并根据用户提示生成新内容(知识)。随着 OpenAI 的 ChatGPT 的出现,基于 LLM 的聊天机器人在 AI 社区中树立了新标准 ...