通才机器人应在各种环境中有效执行。但是,大多数现有方法都在很大程度上依赖于扩展动作注释的数据来增强其功能。因此,它们通常仅限于单个物理规范,并难以在不同的实施方案和环境中学习可转移的知识 ...
本文提出了一场简单而有效的越狱袭击,名为Flipattack针对Black-Box LLMS。首先,从自回旋的性质来看,我们揭示了LLM倾向于从左到右理解文本,并发现当噪声添加到左侧时,它们很难理解文本。在这些见解的推动下,我们建议通过仅基于提示本身构建左侧噪声来掩盖有害提示,然后将此想法推广到4个翻转模式 ...
更长的思考,更好的表现:具有深层推理能力的大型语言模型,尤其是类似O1的模型,通过在推断期间产生广泛的思维过程表现出了出色的性能。这种权衡揭示了潜在的脆弱性:对手可以通过强迫无需思考过程的即时响应来损害模型绩效。为此,在本文中,我们介绍了一种新颖的攻击场景,以针对O1型模型的长时间思考过程并提出了Bot(Break Cot),该过程可以通过后门攻击选择性地破坏内在的推理机制 ...
我们增加了依靠推理LLMS-WE力模型来花费大量推理 Token 的应用程序的开销,即“过度思考”,以响应用户查询,同时提供上下文正确的答案 ...
科学任务的语言模型对科学出版物的文本进行了培训,该文本大多数以需要解析的PDF分发。 PDF解析方法从廉价的启发式方法(对于简单文档)到计算密集的ML驱动系统(对于复杂或退化的系统)。特定文档的“最佳”解析器选择取决于其计算成本及其产出的准确性 ...
gpt-4等通用基础模型在各种领域和任务中展现了令人惊讶的能力。然而,人们普遍认为它们无法与微调模型的专业能力相匹配。例如 ...
Graph神经网络(GNN)最近在图形结构数据上引起了人们对节点和图形分类任务的关注。但是,最近的多项工作表明,攻击者可以通过扰动图形结构(即 ...
插值和外推的概念在从深度学习到功能近似的各个领域都是基本的。每当此样品落在给定数据集凸面船体的边界内或边界上时,对于样本$ x $就会发生插值。当$ x $落入该凸船体之外时,会发生外推 ...