自然语言处理 (NLP) 技术彻底改变了我们与信息系统交互的方式,重点是将自然语言查询转换为正式查询语言(例如 SQL)。然而,语料库查询语言 (CQL) 却不受重视,它是文本语料库中语言研究和详细分析的关键工具。手动构建 CQL 查询是一项复杂且耗时的任务,需要大量专业知识,这对研究人员和从业者来说都是一个巨大的挑战 ...

0 0 0 0 2024/09/24 arXiv:2402.13740v1 huaizhe2000

我们提供了材料科学知识图问答 (KGQA4MAT) 的综合基准数据集,重点关注金属有机框架 (MOF)。通过整合结构化数据库和从文献中提取的知识,构建了金属有机框架(MOF-KG)的知识图。为了增强领域专家对 MOF-KG 的可访问性,我们的目标是开发一个用于查询知识图谱的自然语言界面 ...

0 0 0 0 2024/08/16 arXiv:2309.11361v2 huaizhe2000

我们展示了 Spider,一个由 11 名大学生大规模、复杂和跨领域的语义解析和文本到 SQL 数据集组成的数据集。它由 10,181 个问题和 5,693 个独特的复杂 SQL 查询组成,涉及 200 个具有多个表的数据库,涵盖 138 个不同的领域。我们定义了一个新的复杂和跨域语义解析和文本到 SQL 任务,其中不同的复杂 SQL 查询和数据库出现在训练和测试集中... ...

0 0 0 0 2024/10/01 arXiv:1809.08887v5 huaizhe2000

图数据库(Graph DB)广泛应用于各个领域,包括金融、社交网络和医学。然而,由于其固有的复杂性和专业性,将自然语言(NL)转换为图形查询语言(GQL)(通常称为NL2GQL)被证明是具有挑战性的。一些方法试图利用大型语言模型 (LLM) 来解决类似的任务,例如 text2SQL ...

0 0 0 0 2024/07/26 arXiv:2402.16567v2 huaizhe2000

最近,大型语言模型 (LLM) 在各种自然语言处理应用中取得的成功,为利用 LLM 的基于知识图谱的新型问答系统开辟了道路。然而,阻碍其实现的主要障碍之一是缺乏将问题转换为相应 SPARQL 查询的训练数据,特别是在特定于领域的知识图谱的情况下。为了克服这一挑战,在本研究中,我们评估了几种微调 OpenLlama LLM 生命科学知识图问答的策略 ...

0 0 0 0 2024/07/13 arXiv:2402.04627v1 huaizhe2000

通过提供嵌入到传递给大语言模型 (LLM) 的提示中的上下文信息来一致地生成高质量答案取决于信息检索的质量。随着上下文信息语料库的增长,基于检索增强生成 (RAG) 的问答 (QA) 系统的答案/推理质量会下降。这项工作通过将经典文本分类与大语言模型(LLM)相结合来解决这个问题,从而能够从向量存储中快速检索信息并确保检索信息的相关性 ...

0 0 1 2 2024/07/13 arXiv:2406.16383v1 huaizhe2000

知识图(KG)中的特征选择越来越多地应用于不同领域,包括生物医学研究、自然语言处理(NLP)和个性化推荐系统。本文深入研究了知识图谱中的特征选择方法,强调了它们在增强机器学习 (ML) 模型功效、假设生成和可解释性方面的作用。通过这次全面的审查,我们的目标是促进知识图谱特征选择的进一步创新,为跨不同领域的更富有洞察力、更高效、更可解释的分析模型铺平道路 ...

0 0 0 0 2024/07/09 arXiv:2406.14864v1 huaizhe2000

将大型语言模型 (LLM) 与现有知识图谱 (KG) 数据库集成,为提高 LLM 的效率和减轻其“幻觉”提供了一条有前途的途径。鉴于大多数知识图谱驻留在图形数据库中,只能通过专门的查询语言(例如 ...

0 0 2 3 2024/07/03 arXiv:2406.10710v1 huaizhe2000

过去几十年见证了数据的激增,为需要数据、基于学习的人工智能技术奠定了基础。会话代理(通常称为 AI 聊天机器人)严重依赖此类数据来训练大型语言模型 (LLM) 并根据用户提示生成新内容(知识)。随着 OpenAI 的 ChatGPT 的出现,基于 LLM 的聊天机器人在 AI 社区中树立了新标准 ...

0 0 0 0 2024/06/29 arXiv:2406.16937v1 huaizhe2000

知识图嵌入(KGE)技术对于学习知识图中实体和关系的紧凑表示至关重要,有助于高效推理和知识发现。虽然现有方法通常侧重于仅基于图结构训练 KGE 模型,或使用 KG 中的分类数据微调预训练的语言模型,但 KG-FIT 利用 LLM 引导的细化来构建实体集群的语义连贯的层次结构。通过在微调过程中将这种分层知识与文本信息结合起来,KG-FIT 有效地捕获了来自 LLM 的全局语义和来自 KG 的局部语义 ...

0 0 0 0 2024/06/26 arXiv:2405.16412v2 huaizhe2000

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)