传统的检索演奏生成(RAG)系统采用蛮力内部产品搜索来检索最类似的文档,然后与用户查询结合并传递给语言模型。这使模型可以访问外部知识并减少幻觉。但是,选择适当的k值仍然是实际应用中的重大挑战:小k可能无法检索足够的信息,而大k可以引入过度和无关紧要的内容 ...
基于图的检索效果生成(Graph-rag)通过在外部语料库上进行检索来增强大语言模型(LLMS)。但是,现有方法通常假设静态语料库,每当新文档到达时,都需要昂贵的全部重建,从而限制了它们在动态,不断发展的环境中的可扩展性。为了解决这些局限性,我们介绍了Erarag,这是一种新型的多层图形抹布框架,支持有效且可扩展的动态更新 ...
在本文中,我们开发了一个强大,有效的视觉大满贯系统,该系统利用了低阈值,基线线和闭环钥匙帧功能的空间抑制。使用ORB-SLAM2,我们的方法包括立体声匹配,框架跟踪,本地捆绑包调整以及线和点全局束调整。特别是,我们根据基线贡献了重新注射 ...
鉴于输入图及其标签/属性,图形学习的几个关键问题,例如查找可解释的子图,图形降解和图形压缩,可以归因于识别原始图的子图的基本问题。该子图应尽可能提供信息,但包含冗余和嘈杂的结构。此问题设置与众所周知的信息瓶颈(IB)原理密切相关,但是,对于不规则的图形数据和图形神经网络(GNNS),研究较少研究 ...
大型语言模型(LLMS)提供了强大的手段,以利用先验知识在数据有限时进行预测建模。在这项工作中,我们演示了LLM如何使用其压缩世界知识来生成本质上可解释的机器学习模型,即 ...
强化学习(RL)在提高大语言模型(LLM)的推理能力方面发挥了重要作用。一些研究将RL直接应用于\ textIt {较小}基本模型(称为零RL),并且还取得了显着的进步。但是,在本文中,我们表明,仅使用920个示例,基于基本模型的简单蒸馏方法可以清楚地超过零RL,通常需要更多的数据和计算成本 ...
图形用户界面(GUI)代理在理解和执行不同平台的用户指令方面取得了长足的进步。然而,将这些说明扎根于精确的界面元素仍然具有挑战性,尤其是在复杂,高分辨率,专业环境中。传统的监督芬特(SFT)方法通常需要大量不同的数据,并且表现出较弱的概括 ...
检测器对大语模型(LLM)产生的文本的功效很大程度上取决于大规模培训数据的可用性。但是,不需要此类数据的白盒零射击检测器受到LLM生成文本源模型的可访问性的限制。在本文中,我们提出了一种基于这样的观察结果,即从LLM的角度来看,人写的文本通常包含比LLM生成的文本更多的语法错误 ...
我们在连续的3D环境中开发了一个语言引导的导航任务,代理必须执行低级操作以遵循自然语言导航方向。通过位于连续的环境中,此设置可以提取以前工作中隐含的许多假设,这些假设将环境表示为稀疏的全景图,边缘具有与导航性相对应的边缘。具体而言,我们的设置丢弃了已知的环境拓扑,短距离甲骨文导航和完美代理定位的推定 ...
时间知识图(TKG)存储从涉及时间的数据中得出的事件。由于事件的时间敏感性,预测事件极具挑战性。此外,先前的TKG完成(TKGC)方法不能同时代表事件的及时性和因果关系 ...