前沿语言模型展现了强大的推理能力和远景工具使用能力。然而,现有的 RAG 系统无法利用这些功能。他们仍然依赖两种范例:(1)设计一种算法,在一次中检索段落并将它们连接到模型的输入中,或者(2)预定义工作流程并提示模型逐步执行。这两种范式都不允许模型参与检索决策,从而阻碍了模型改进的有效扩展。在本文中,我们介绍了 A-RAG,这是一种 Agentic RAG 框架,它直接向模型公开分层检索接口。 A-RAG 提供三种检索工具:关键字搜索、语义搜索和块读取,使代理能够跨多个粒度自适应地搜索和检索信息。对多个开放域 QA 基准的实验表明,A-RAG 在检索到的 Token 相当或更低的情况下始终优于现有方法,这表明 A-RAG 有效地利用了模型功能并动态适应不同的 RAG 任务。我们进一步系统地研究 A-RAG 如何随模型大小和测试时间计算进行扩展。我们将发布我们的代码和评估套件以促进未来的研究。代码和评估套件可从此 https URL 获取 ...
随着现代在线服务系统的越来越复杂,了解系统的状态和行为对于确保其可靠性和稳定性至关重要。因此,公制监测系统被广泛使用,并成为在线服务系统中的重要基础架构。工程师通常通过手动编写特定于域的语言(DSL)查询来与指标数据进行交互,以实现各种分析目标 ...
一个基于检索的提示生成(RAG)的问题避开(QA)系统通过根据用户查询检索相关文档来增强大语言模型的知识。用户查询和文档短语之间的差异通常需要查询重写。但是,在专门的领域中,重写器模型可能由于特定于领域的知识而挣扎 ...
基于检索的大型语言模型(LLMS)在财务中广泛使用,以实现其在知识密集型任务上的出色表现。但是,标准化文件(例如 ...