模型算法的进步、可扩展的基础模型架构以及充足的高质量数据集的可用性促进了人工智能生成内容(AIGC)的发展。尽管 AIGC 取得了令人瞩目的表现,但它仍然面临着挑战,例如难以维护最新的长尾知识、数据泄露的风险以及与训练和推理相关的高成本。检索增强生成(RAG)最近成为解决此类挑战的范例 ...

0 0 0 0 2024/04/12 arXiv:2402.19473v2 云汐瑶

检索增强生成(RAG)通过检索相关知识来增强大语言模型(LLM),在减轻 LLM 幻觉和提高响应质量方面显示出巨大的潜力,从而促进 LLM 在实践中的广泛采用。然而,我们发现现有的 RAG 系统不足以回答多跳查询,这需要对多个支持证据进行检索和推理。此外,据我们所知,现有的 RAG 基准测试数据集还没有关注多跳查询 ...

0 0 0 0 2024/04/09 arXiv:2401.15391v1 云汐瑶

这项调查探讨了大型语言模型 (LLM) 和向量数据库 (VecDB) 的协同潜力,这是一个新兴但快速发展的研究领域。随着 LLM 的激增,带来了一系列挑战,包括幻觉、过时的知识、高昂的商业应用成本和内存问题。 VecDB 通过提供一种有效的方法来存储、检索和管理 LLM 操作固有的高维向量表示,成为解决这些问题的引人注目的解决方案 ...

0 0 0 0 2024/03/29 arXiv:2402.01763v2 云汐瑶

我们引入了 REPLUG,这是一种检索增强的语言建模框架,它将语言模型 (LM) 视为黑匣子,并通过可调整的检索模型对其进行增强。之前的检索增强型语言模型通过特殊的交叉注意机制训练语言模型来编码检索到的文本,而 REPLUG 则不同,它只是将检索到的文档添加到冻结黑盒 LM 的输入中。这种简单的设计可以轻松应用于任何现有的检索和语言模型 ...

0 0 0 0 2024/03/27 arXiv:2301.12652v4 云汐瑶

自监督预训练技术在文档人工智能方面取得了显着的进步。大多数多模态预训练模型使用掩码语言建模目标来学习文本模态的双向表示,但它们在图像模态的预训练目标上有所不同。这种差异增加了多模态表示学习的难度 ...

0 0 1 1 2024/03/26 arXiv:2204.08387v3 云汐瑶

由于其有效的模型架构和大规模无标签扫描/数字生成文档的优势,文本和布局的预训练已被证明在各种视觉丰富的文档理解任务中是有效的。我们提出了具有新预训练任务的 LayoutLMv2 架构,以在单个多模式框架中对文本、布局和图像之间的交互进行建模。具体来说,通过双流多模态 Transformer 编码器,LayoutLMv2 不仅使用现有的屏蔽视觉语言建模任务,还使用新的文本图像对齐和文本图像匹配任务,这使得它可以更好地捕获跨模态交互在预训练阶段 ...

0 1 1 1 2024/03/26 arXiv:2012.14740v4 云汐瑶

近年来,预训练技术已在多种 NLP 任务中得到成功验证。尽管预训练模型广泛用于 NLP 应用,但它们几乎完全专注于文本级操作,而忽略了对于文档图像理解至关重要的布局和样式信息。在本文中,我们提出了 \textbf{LayoutLM} 来联合建模扫描文档图像中文本和布局信息之间的交互,这有利于大量现实世界文档图像理解任务,例如从扫描文档中提取信息 ...

0 1 1 3 2024/03/26 arXiv:1912.13318v5 云汐瑶

大型语言模型(LLM)已经证明了它们在上下文中学习的能力,使它们能够基于一些输入输出示例执行各种任务。然而,情境学习的有效性在很大程度上取决于所选示例的质量。在本文中,我们提出了一种新颖的框架来迭代训练密集检索器,该检索器可以为 LLM 识别高质量的上下文示例 ...

0 0 0 0 2024/04/18 arXiv:2307.07164v2 云汐瑶

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)