通过解决幻觉,过时的知识和域适应性等问题,检索增强的生成(RAG)技术已成为提高大语言模型(LLM)可靠性的有前途解决方案。特别是,现有的抹布方法附加了从外部语料库或数据库中检索到LLMS的输入的相关文档,以指导其生成过程,我们将其称为“文化知识注入方法”。尽管这种方法很简单并且通常有效,但它具有固有的局限性 ...

0 0 0 0 2025/02/13 arXiv:2501.15915v1 huaizhe2000

大型语言模型 (LLM),包括 GPT-3.5、LLaMA 和 PaLM,似乎知识渊博并且能够适应许多任务。然而,我们仍然不能完全相信他们的答案,因为 LLM 患有 \textbf{幻觉}\textemdash 捏造不存在的事实,在有意识或无意识的情况下欺骗用户 ...

0 0 0 0 2025/01/20 arXiv:2310.01469v3 huaizhe2000

从大型文档语料库中有效地检索一组简明的候选者仍然是信息检索(IR)中的关键挑战。神经检索模型,特别是使用 Transformer 和预训练语言模型构建的密集检索模型,由于其卓越的性能而广受欢迎。然而,也有人批评它们缺乏可解释性和容易受到对抗性攻击 ...

0 0 0 0 2025/01/05 arXiv:2412.20756v1 huaizhe2000

动态检索增强生成(RAG)范式主动决定在大型语言模型(LLM)的文本生成过程中检索何时以及检索什么。该范例有两个关键要素:确定激活检索模块的最佳时刻(决定何时检索)以及在触发检索后制定适当的查询(确定检索什么)。然而,当前的动态 RAG 方法在这两方面都存在不足 ...

0 0 0 0 2024/12/18 arXiv:2403.10081v3 huaizhe2000

常识问答 (QA) 需要一个模型来掌握常识和事实知识,以回答有关世界事件的问题。许多现有方法将语言建模与知识图(KG)结合起来。然而,尽管知识图谱包含丰富的结构信息,但它缺乏上下文来提供对概念的更精确的理解 ...

0 0 0 0 2024/10/12 arXiv:2012.04808v3 huaizhe2000

正式验证软件属性是一项非常理想但劳动密集型的任务。最近的工作开发了使用证明助手(例如 Coq 和 Isabelle/HOL)自动进行形式验证的方法 ...

0 0 0 0 2024/09/28 arXiv:2303.04910v2 huaizhe2000

关系数据库中存储的数据量不断增加,导致各个部门需要高效查询和利用这些数据。然而,编写 SQL 查询需要专业知识,这给尝试访问和查询数据库的非专业用户带来了挑战。文本到 SQL 解析通过将自然语言查询转换为 SQL 查询来解决这个问题,从而使非专家用户更容易访问数据库 ...

0 0 0 0 2024/09/24 arXiv:2407.15186v3 huaizhe2000

自然语言处理 (NLP) 技术彻底改变了我们与信息系统交互的方式,重点是将自然语言查询转换为正式查询语言(例如 SQL)。然而,语料库查询语言 (CQL) 却不受重视,它是文本语料库中语言研究和详细分析的关键工具。手动构建 CQL 查询是一项复杂且耗时的任务,需要大量专业知识,这对研究人员和从业者来说都是一个巨大的挑战 ...

0 0 0 0 2024/09/24 arXiv:2402.13740v1 huaizhe2000

我们提供了材料科学知识图问答 (KGQA4MAT) 的综合基准数据集,重点关注金属有机框架 (MOF)。通过整合结构化数据库和从文献中提取的知识,构建了金属有机框架(MOF-KG)的知识图。为了增强领域专家对 MOF-KG 的可访问性,我们的目标是开发一个用于查询知识图谱的自然语言界面 ...

0 0 0 0 2024/08/16 arXiv:2309.11361v2 huaizhe2000

我们展示了 Spider,一个由 11 名大学生大规模、复杂和跨领域的语义解析和文本到 SQL 数据集组成的数据集。它由 10,181 个问题和 5,693 个独特的复杂 SQL 查询组成,涉及 200 个具有多个表的数据库,涵盖 138 个不同的领域。我们定义了一个新的复杂和跨域语义解析和文本到 SQL 任务,其中不同的复杂 SQL 查询和数据库出现在训练和测试集中... ...

0 0 0 0 2024/10/01 arXiv:1809.08887v5 huaizhe2000

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)