大型语言模型(LLMS)的部署在很大程度上受其大量参数的阻碍。结构修剪已成为一种有前途的解决方案。先前的结构化修剪方法直接基于某些指标去除不重要的参数,这通常会导致知识丧失并需要广泛的重新训练 ...
思想链(COT)推理在大语言模型(LLM)和多模式大语言模型(MLLMS)中都表现出了显着的深层推理能力。但是,在中间步骤中错误的积累通常会破坏其可靠性。本文通过利用模型的固有真实性编码来介绍一种新颖的方法来校准COT推理精度 ...
当前的大型语言模型(LLM)代理表现出强大的推理和工具使用功能,但通常缺乏自我意识,无法有效地平衡这些方法。这种不平衡会导致工具过度使用,在该工具中,模型不必要地依靠外部工具来使用参数知识来解决的任务,从而增加了计算开销。受到人类元认知的启发,我们引入了Smart(使用工具的战略模型感知推理),该范式增强了代理商的自我意识,以优化任务处理并减少工具过度使用 ...
大型语言模型(LLM)能够在与用户长时间交互过程中处理冗长的对话历史,而无需额外的内存模块;然而,他们的反应往往会忽视或错误地回忆过去的信息。在本文中,我们重新审视 LLM 时代的记忆增强响应生成。虽然之前的工作重点是摆脱过时的记忆,但我们认为这些记忆可以提供上下文线索,帮助对话系统理解过去事件的发展,从而有利于响应的生成 ...
Internet使用率的增长促成了大量连续可用的数据,并创造了对数据的自动和高效组织的需求。在这种情况下,文本聚类技术很重要,因为它们旨在根据文档的特征来组织文档。更具体地说,层次和增量聚类技术可以以层次形式组织动态数据,从而确保该组织已更新并促进其探索 ...
分层聚类是一种广泛使用的方法,用于在多个粒度层面上群集数据集。尽管它很受欢迎,但现有的算法(例如层次结构聚类(HAC))仅限于离线设置,因此要求整个数据集可用。这禁止它们在现代学习应用程序中常见的大型数据集中使用 ...
选择哪些要求检查是人类事实检查者的一项耗时的任务,尤其是从包含多个句子和包含多个索赔的文件中。但是,现有的索赔提取方法更多地集中在识别和提取个人句子中的索赔,例如 ...
大型语言模型的最新进展已大大改善了其上下文窗口,但在有效的长期记忆管理方面的挑战仍然存在。我们介绍了一种算法,该算法利用动态的,树结构的内存表示形式来优化信息的组织,检索和集成,类似于人类认知模式。 MEMTREE通过层次进行内存,每个节点都封装了汇总的文本内容,相应的语义嵌入以及在树深处的抽象级别变化 ...
为了在长期对话中提供连贯和个性化的经验,现有方法通常通过在转向级,会话级别的对话历史上构造记忆库来执行检索增强响应产生,或者通过汇总本文本文,我们提出了两个关键发现,我们提出了两个关键发现:(1)记忆单元的范围限制了:转向级别的范围,并且会限制层次化的方法,并总结级别,并列出了层次,并总结了级别,并列出了级别,并列出了级别,并列出了。以及检索到的内容的语义质量。 (2)迅速的压缩方法,例如LLMlingua-2,可以有效地充当降解机制,从而增强不同粒度的记忆检索准确性。在这些见解的基础上,我们提出了SECOM,这种方法是通过引入对话分割模型来构建记忆库的方法,该模型将长期对话划分为局部连贯的细分市场,同时将基于压缩的基于压缩的deNo依次应用于内存单元以增强内存检索 ...
图像文本匹配一直是一个热门的研究主题,桥接了视觉和语言领域。它仍然具有挑战性,因为图像的当前表示通常缺乏相应的文本标题中的全局语义概念。为了解决这个问题,我们提出了一个简单且可解释的推理模型,以生成捕获场景的关键对象和语义概念的视觉表示 ...