本文解决了应用于多标签内容安全分类时从生成语言模型 (LLM) 导出可解释置信度分数的关键挑战。虽然像 LLaMA Guard 这样的模型可以有效识别不安全内容及其类别,但它们的生成架构本质上缺乏直接的类级概率,这阻碍了模型置信度评估和性能解释。这种限制使内容审核的动态阈值的设置变得复杂,并阻碍了细粒度的错误分析。本研究提出并评估了三种新颖的 Token 级概率估计方法来弥补这一差距。目的是增强模型的可解释性和准确性,并评估该框架在不同指令调整模型中的通用性。通过对综合生成的、严格注释的数据集进行大量实验,结果表明,利用 token logits 可以显着提高生成分类器的可解释性和可靠性,从而实现更细致的内容安全审核 ...
在许多高风险的机器学习应用中,模型必须指出预测何时不确定。虽然大型语言模型(LLM)可以在各种基准上达到甚至超过人类水平的准确性,但它们对错误响应的过度自信仍然是一种有据可查的失败模式。由于实现的计算成本和许多模型的闭源性质,传统的机器学习不确定性量化方法可能很难直接适应 LLM 。最近提出了各种黑盒方法,但这些方法通常依赖于启发式方法,例如自我语言信心。相反,我们提出了一个框架来衡量 LLM 在生成答案的解释分布方面的不确定性。虽然利用解释本身并不是一个新想法,但通过将每个可能的模型+解释对解释为测试时分类器,我们可以计算这些分类器中最有可能的后验答案分布。我们演示了该框架的特定实例如何使用解释蕴含作为我们的分类器可能性,在五个不同数据集的基线上提高置信度得分指标(特别是 AURC 和 AUROC)。我们相信这些结果表明我们的框架是量化 LLM 不确定性的原则良好且有效的方法 ...
过去两年,大型语言模型 (LLM) 的使用发展迅速。虽然这些 LLM 提供了相当大的便利,但它们也引起了安全问题,因为 LLM 很容易受到一些精心设计的文本扰动的对抗性攻击。在本文中,我们介绍了一种名为大型语言模型哨兵(LLAMOS)的新型防御技术,该技术旨在通过在将对抗性文本示例输入目标 LLM 之前纯化它们来增强 LLM 的对抗鲁棒性。我们的方法包括两个主要部分:a)代理指令,它可以模拟新的代理进行对抗性防御,在防御攻击的同时改变最少的字符以保持句子的原始含义; b) 防御指导,提供修改干净或对抗性示例的策略,以确保目标 LLM 的有效防御和准确输出。值得注意的是,即使没有从对抗性例子中学习,防御代理也表现出了强大的防御能力。此外,我们进行了一项有趣的对抗性实验,我们开发了两种代理,一种用于防御,一种用于攻击,并使它们相互对抗。在对抗性互动中,两个智能体都没有完全击败对方。对开源和闭源 LLM 的大量实验表明,我们的方法可以有效防御对抗性攻击,从而增强对抗性鲁棒性 ...
知识图谱(KG)长期以来一直是结构化知识表示和推理的基础设施。随着大型语言模型(LLM)的出现,知识图谱的构建进入了一个新的范式——从基于规则和统计的管道转向语言驱动的生成框架。本综述全面概述了LLM赋能的知识图谱构建的最新进展,系统分析了LLM如何重塑本体工程、知识提取和知识融合的经典三层流程。我们首先重新审视传统的知识图谱方法以建立概念基础,然后从两个互补的角度回顾新兴的 LLM 驱动的方法:基于模式的范式,强调结构、规范化和一致性;以及无模式范式,强调灵活性、适应性和开放发现。在每个阶段,我们综合代表性框架,分析其技术机制,并确定其局限性。最后,调查概述了主要趋势和未来的研究方向,包括 LLM 基于知识图谱的推理、代理系统的动态知识记忆以及多模态知识图谱构建。通过这次系统回顾,我们的目标是阐明 LLM 和知识图谱之间不断发展的相互作用,将符号知识工程和神经语义理解联系起来,以开发自适应、可解释和智能的知识系统 ...
基于深度神经网络的目标检测器不断发展,并用于多种应用,每种应用都有自己的一套要求。虽然安全关键型应用需要高精度和可靠性,但低延迟任务需要资源和能源高效的网络。实时检测器是高影响力的现实应用中的必需品,人们不断提出,但它们过分强调精度和速度的提高,而忽略了多功能性、鲁棒性、资源和能源效率等其他功能。现有网络的参考基准不存在,设计新网络的标准评估指南也不存在,这导致比较不明确且不一致。因此,我们对各种数据集上的多个实时检测器(基于锚点、关键点和 Transformer )进行了全面的研究,并报告了一系列广泛指标的结果。我们还研究了图像大小、锚尺寸、置信度阈值和架构层等变量对整体性能的影响。我们分析了检测网络针对分布变化、自然腐败和对抗性攻击的稳健性。此外,我们还提供校准分析来衡量预测的可靠性。最后,为了强调现实世界的影响,我们针对自动驾驶和医疗保健应用进行了两个独特的案例研究。为了进一步评估网络在关键实时应用中的能力,我们报告了在边缘设备上部署检测网络后的性能。我们广泛的实证研究可以作为工业界在现有网络上做出明智选择的指南。我们还希望激励研究界在网络设计和评估方面朝着新的方向发展,重点关注更大、更全面的概述,以产生深远的影响 ...
随着大型语言模型 (LLM) 的不断发展,理解和量化其预测的不确定性对于提高应用程序的可信度至关重要。然而,现有的LLM不确定性估计相关文献往往依赖于启发式方法,缺乏对方法的系统分类。在本次调查中,我们阐明了不确定性和置信度的定义,强调了它们的区别以及对模型预测的影响。在此基础上,我们整合贝叶斯推理、信息论和集成策略等理论视角,对启发式方法派生的各类不确定性估计方法进行分类。此外,我们还解决了将这些方法应用于 LLM 时出现的挑战。我们还探索将不确定性纳入不同应用的技术,包括分布外检测、数据注释和问题澄清。我们的评论从定义和理论角度提供了对不确定性估计的见解,有助于全面理解 LLM 的这一关键方面。我们的目标是激励 LLM 在现实场景中开发更可靠、更有效的不确定性估计方法 ...
大型语言模型 (LLM) 的最新进展在各种应用程序中取得了令人鼓舞的性能。尽管如此,整合长尾知识的持续挑战仍然阻碍了 LLM 在专业领域的无缝采用。在这项工作中,我们引入了 DALK(又名 LLM 和 KG 的动态联合增强)来解决这一限制,并展示其研究阿尔茨海默病 (AD) 的能力,阿尔茨海默病是生物医学的一个专业子领域,也是全球健康的优先事项。通过LLM和KG相互增强的协同框架,我们首先利用LLM构建一个源自AD相关科学文献的不断发展的AD特定知识图谱(KG),然后利用从粗到细的采样方法和新颖的自我意识知识检索方法从KG中选择适当的知识来增强LLM的推理能力。在我们构建的 AD 问答 (ADQA) 基准上进行的实验结果强调了 DALK 的功效。此外,我们还进行了一系列详细的分析,可以为 KG 和 LLM 相互增强的新兴主题提供有价值的见解和指南。我们将在此 https URL 发布代码和数据 ...
虽然高斯喷射的最新进展已经能够从图像中快速重建高质量的 3D 场景,但提取准确的表面网格仍然是一个挑战。当前的方法通过昂贵的后处理步骤提取表面,导致精细几何细节的丢失或需要大量时间并导致具有数百万个顶点的非常密集的网格。更根本的是,从体积表示到表面表示的后验转换限制了最终网格保留训练期间捕获的所有几何结构的能力。我们提出了 MILo,一种新颖的高斯泼溅框架,它通过从 3D 高斯中可微分地提取网格来弥合体积表示和表面表示之间的差距。我们设计了一个完全可微的过程,在每次迭代中直接根据高斯参数构建网格(包括顶点位置和连接性),高斯参数是训练期间唯一优化的量。我们的方法引入了三个关键的技术贡献:双向一致性框架,确保高斯表示和提取的网格在训练期间捕获相同的基础几何图形;在每次训练迭代时执行的自适应网格提取过程,使用高斯作为 Delaunay 三角剖分的可微主元;一种从 3D 高斯计算有符号距离值的新颖方法,可以实现精确的表面提取,同时避免几何侵蚀。我们的方法可以重建完整的场景,包括背景,具有最先进的质量,同时需要比以前的方法少一个数量级的网格顶点。由于重量轻且内部空,我们的网格非常适合物理模拟或动画等下游应用 ...
准确捕获特征交互对于推荐系统至关重要,最近的趋势表明,扩大模型容量可能是下一级别预测性能的关键驱动力。虽然之前的工作已经探索了各种模型架构来捕获多粒度特征交互,但对高效特征处理和扩展模型容量而不引起过多推理延迟的关注相对较少。在本文中,我们通过提出 Zenith 来解决这个问题,这是一种可扩展且高效的排名架构,可以以最小的运行时开销学习复杂的特征交互。 Zenith 旨在通过 Token Fusion 和 Token Boost 模块处理一些高维 Prime Token ,由于其改进的 Token 异质性,与其他最先进的排名方法相比,它表现出优越的缩放法则。通过将该架构部署到 TikTok Live(吸引全球数十亿用户的领先在线直播平台),证明了其在现实世界中的有效性。我们的 A/B 测试显示,Zenith 的在线 CTR AUC 和 Logloss 实现了 +1.05%/-1.10%,并在质量观察会话/用户方面实现了 +9.93% 的增长,在质量观察持续时间/用户方面实现了 +8.11% 的增长 ...
视觉语言模型(VLM)的出现为临床推理开辟了新的可能性,并在皮肤病诊断中表现出了良好的性能。然而,它们的可信度和临床实用性往往受到三个主要因素的限制:(1)数据异质性,不同的数据集缺乏一致的诊断标签和临床概念注释; (二)缺乏有根据的诊断依据,导致缺乏可靠的推理监督; (3)可扩展性和泛化性有限,因为在小型、密集注释的数据集上训练的模型很难将细致入微的推理转移到大型、稀疏注释的数据集上。为了解决这些限制,我们提出了 SkinR1,这是一种新颖的皮肤病学 VLM,它将基于教科书的深度推理与强化学习 (RL) 的广泛泛化能力相结合。 SkinR1 通过统一的端到端框架系统地解决了关键挑战。首先,我们设计了一个基于教科书的推理生成器,它综合了高保真、层次感知和差分诊断 (DDx) 信息的轨迹,提供可靠的专家级监督。其次,我们利用构建的轨迹进行监督微调(SFT),使模型具有基础推理能力。第三,我们开发了一种新颖的强化学习范式,通过结合疾病的层次结构,有效地将这些扎根的推理模式转移到大规模、稀疏的数据中。对多个皮肤科数据集的大量实验表明 SkinR1 实现了卓越的诊断准确性。消融研究证明了 SFT 灌输的推理基础的重要性 ...