动态检索增强生成(RAG)范式主动决定在大型语言模型(LLM)的文本生成过程中检索何时以及检索什么。该范例有两个关键要素:确定激活检索模块的最佳时刻(决定何时检索)以及在触发检索后制定适当的查询(确定检索什么)。然而,当前的动态 RAG 方法在这两方面都存在不足 ...

0 0 0 0 2024/12/18 arXiv:2403.10081v3 huaizhe2000

常识问答 (QA) 需要一个模型来掌握常识和事实知识,以回答有关世界事件的问题。许多现有方法将语言建模与知识图(KG)结合起来。然而,尽管知识图谱包含丰富的结构信息,但它缺乏上下文来提供对概念的更精确的理解 ...

0 0 0 0 2024/10/12 arXiv:2012.04808v3 huaizhe2000

正式验证软件属性是一项非常理想但劳动密集型的任务。最近的工作开发了使用证明助手(例如 Coq 和 Isabelle/HOL)自动进行形式验证的方法 ...

0 0 0 0 2024/09/28 arXiv:2303.04910v2 huaizhe2000

关系数据库中存储的数据量不断增加,导致各个部门需要高效查询和利用这些数据。然而,编写 SQL 查询需要专业知识,这给尝试访问和查询数据库的非专业用户带来了挑战。文本到 SQL 解析通过将自然语言查询转换为 SQL 查询来解决这个问题,从而使非专家用户更容易访问数据库 ...

0 0 0 0 2024/09/24 arXiv:2407.15186v3 huaizhe2000

自然语言处理 (NLP) 技术彻底改变了我们与信息系统交互的方式,重点是将自然语言查询转换为正式查询语言(例如 SQL)。然而,语料库查询语言 (CQL) 却不受重视,它是文本语料库中语言研究和详细分析的关键工具。手动构建 CQL 查询是一项复杂且耗时的任务,需要大量专业知识,这对研究人员和从业者来说都是一个巨大的挑战 ...

0 0 0 0 2024/09/24 arXiv:2402.13740v1 huaizhe2000

我们提供了材料科学知识图问答 (KGQA4MAT) 的综合基准数据集,重点关注金属有机框架 (MOF)。通过整合结构化数据库和从文献中提取的知识,构建了金属有机框架(MOF-KG)的知识图。为了增强领域专家对 MOF-KG 的可访问性,我们的目标是开发一个用于查询知识图谱的自然语言界面 ...

0 0 0 0 2024/08/16 arXiv:2309.11361v2 huaizhe2000

我们展示了 Spider,一个由 11 名大学生大规模、复杂和跨领域的语义解析和文本到 SQL 数据集组成的数据集。它由 10,181 个问题和 5,693 个独特的复杂 SQL 查询组成,涉及 200 个具有多个表的数据库,涵盖 138 个不同的领域。我们定义了一个新的复杂和跨域语义解析和文本到 SQL 任务,其中不同的复杂 SQL 查询和数据库出现在训练和测试集中... ...

0 0 0 0 2024/10/01 arXiv:1809.08887v5 huaizhe2000

图数据库(Graph DB)广泛应用于各个领域,包括金融、社交网络和医学。然而,由于其固有的复杂性和专业性,将自然语言(NL)转换为图形查询语言(GQL)(通常称为NL2GQL)被证明是具有挑战性的。一些方法试图利用大型语言模型 (LLM) 来解决类似的任务,例如 text2SQL ...

0 0 0 0 2024/07/26 arXiv:2402.16567v2 huaizhe2000

最近,大型语言模型 (LLM) 在各种自然语言处理应用中取得的成功,为利用 LLM 的基于知识图谱的新型问答系统开辟了道路。然而,阻碍其实现的主要障碍之一是缺乏将问题转换为相应 SPARQL 查询的训练数据,特别是在特定于领域的知识图谱的情况下。为了克服这一挑战,在本研究中,我们评估了几种微调 OpenLlama LLM 生命科学知识图问答的策略 ...

0 0 0 0 2024/07/13 arXiv:2402.04627v1 huaizhe2000

通过提供嵌入到传递给大语言模型 (LLM) 的提示中的上下文信息来一致地生成高质量答案取决于信息检索的质量。随着上下文信息语料库的增长,基于检索增强生成 (RAG) 的问答 (QA) 系统的答案/推理质量会下降。这项工作通过将经典文本分类与大语言模型(LLM)相结合来解决这个问题,从而能够从向量存储中快速检索信息并确保检索信息的相关性 ...

0 0 1 2 2024/07/13 arXiv:2406.16383v1 huaizhe2000

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)