尽管在视觉推理方面表现出色,但大型视觉模型(LVLM)可能会产生给定图像中不存在的幻觉内容。大多数现有的LVLM幻觉基准都受到限制,以评估与对象相关的幻觉。但是,关于两个物体之间关系的潜在幻觉,即 ...
深度研究代理是基于LLM的代理的重要类别。通过自主协调多步探索,有针对性的检索和高阶合成,它们将大量的在线信息转换为分析师级,引用丰富的报告 - 将手动台式研究用于几分钟。但是,系统地评估这些试剂能力的全面基准仍然没有 ...
通过在推理时检索到的外部证据来调节生成,检索授权的生成(RAG)已成为一种强大的范式来增强大语模型(LLM)。尽管RAG解决了参数知识存储的临界局限性,例如事实上的不一致和域的不灵活性,但它在检索质量,基础忠诚度,管道效率和鲁棒性方面引入了新的挑战,以应对嘈杂或对抗性输入。这项调查提供了对抹布系统最新进展的全面综合,提供了将体系结构分类为以猎犬为中心,以发电机为中心,混合和稳健性的设计的分类法 ...
解释图神经网络(GNN)由于需要解释性而引起了极大的关注,使用户能够更好地了解这些黑盒模型的行为,并从其预测中提取出宝贵的见解。尽管已经提出了许多事后实例级解释方法来解释GNN预测,但这些解释的可靠性仍然不确定,尤其是在分布外或未知的测试数据集中。在本文中,我们通过引入以理论原理为基础的置信度评分模块(confexplainer)引入解释器框架,以置信图(GIB-CC)为基础,该挑战量化了生成解释的可靠性 ...
通过直接访问人工写的参考作为记忆,在广泛的文本生成任务中取得了很大的进步。由于更好的内存通常会提示更好的生成〜(我们将其定义为原始问题)。传统的内存检索方法涉及选择与输入最高相似性的内存 ...
AI生成的内容(AIGC)技术的快速发展导致滥用高度现实的AI生成的图像(AIGI)在传播错误信息方面,对公共信息安全构成了威胁。尽管现有的AIGI检测技术通常是有效的,但它们面临两个问题:1)缺乏人为验证的解释,以及2)最新一代技术缺乏概括。为了解决这些问题,我们介绍了一个大规模且全面的数据集Holmes-Set,其中包括Holmes-Sftset,一个指令调整数据集,其中包含有关图像是否是AI生成的解释,以及Holmes-Dposet,一个人与与人对齐的偏好数据集 ...
子图识别旨在发现图形最有用的图形的压缩子结构。可以通过使用相互信息估计器优化图形信息瓶颈(GIB)来制定它。但是,GIB因其内在优化过程而受到训练不稳定和退化结果 ...
对于使用向量指数扩展现有的DBMS的需求越来越大,因此它们成为能够支持现代预测应用的统一系统,这些系统需要将矢量嵌入的联合查询以及对象的结构化属性和连接进行联合查询。我们提出Navix,这是一个具有两个主要设计目标的图形DBMS(GDBMS)的本机向量索引。首先,我们旨在实施一个基于磁盘的向量索引,该索引利用基础GDBM的核心存储和查询处理功能 ...
海洋生物的原位视觉观察对于发展行为理解及其与周围生态系统的关系至关重要。通常,这些观察结果是通过潜水员,标签和远程操作或人类式车辆收集的。然而,最近,配备了相机和具有GPU功能的嵌入式计算机的自主水下车辆正在为各种应用开发,尤其是可以用来补充这些现有的数据收集机制,这些数据收集机制更加困难 ...
大型语言模型(LLMS)在各种自然语言任务中表现出了出色的表现。但是,选择最佳LLM来响应用户查询通常需要在性能和成本之间保持微妙的平衡。尽管强大的模型可提供更好的效果,但它们的成本很高,而较小的型号更具成本效益,但功能较低 ...