大型语言模型(LLM)通过使用工具和处理多种方式的能力增强了。这些新功能带来了新的好处以及新的安全风险。在这项工作中,我们表明攻击者可以使用视觉对抗性示例引起攻击者设计的工具使用情况 ...
大型语言模型(LLMS)的快速发展具有显着高级的代码完成功能,从而产生了新一代基于LLM的代码完成工具(LCCTS)。与通用LLM不同,这些工具具有独特的工作流程,将多个信息源集成为输入和优先级代码建议,而不是自然语言互动,这引入了独特的安全挑战。此外,LCCT通常依靠专有代码数据集进行培训,从而引起人们对敏感数据潜在暴露的担忧 ...
视觉语言大型模型在各种多模式任务中取得了巨大的成功,但是由于视频数据的固有复杂性和计算需求,将它们应用于视频理解仍然具有挑战性。尽管基于培训的视频LLM提供高性能,但他们通常需要大量资源进行培训和推理。相反,无训练方法通过在没有额外培训的情况下调整预先训练的图像-LLMS模型来提供更有效的替代方法,但是由于视频框架产生了大量的视觉 Token ,它们会面临推理效率瓶颈 ...
机器人技术和增强现实(AR)的整合为提高可用性,直觉和可访问性提供了推进人类机器人互动(HRI)的变革机会。这项工作引入了无控制器,由LLM驱动的语音命令伪装系统,使用户可以实时操纵其虚拟对应物,从而使用户能够对机器人进行操作。通过利用自然语言处理(NLP)和AR技术,我们的系统 - 使用Meta Quest 3进行了原型 - 消除了对物理控制器的需求,增强了易用性,同时最大程度地降低了与直接机器 ...
自从 LLM 出现以来,将自然语言查询转换为结构化 SQL 命令的情况正在增加。与之前的评论不同,本次调查全面研究了基于 LLM 的文本到 SQL 系统的演变,从早期基于规则的模型到高级 LLM 方法,以及 LLM 如何影响该领域。我们讨论基准、评估方法和评估指标 ...
时间知识图(TKG)推理具有两个设置:插值推理和外推理。他们俩都引起了很多研究兴趣,并且具有重要意义。前者的方法强调事实序列之间的时间相关性,而后者的方法则需要严格的年代知识顺序,而忽略了过去缺失的事实所提供的推断线索 ...
边缘计算越来越多地被提出作为减少运行同步定位和建图(allam)算法的移动设备资源消耗的解决方案,大多数边缘辅助,大多数边缘辅助,或者依赖于基于启发式方法选择要传输到边缘的信息。本文介绍了,或者依赖于基于启发式方法选择要传输到边缘的信息。本文介绍了(v)(v)和视觉惯性(vi)slam系统,它基于我们开发的用于选择关键帧子集(代表帧,它基于我们开发的用于选择关键帧子集(代表帧)的理论基础方法,可适 ...
基于内容的推荐系统在向数字世界中的用户传递个性化内容方面起着至关重要的作用。在这项工作中,我们介绍了Embsum,这是一个新颖的框架,可以在捕获用户参与历史记录中的互动时脱机预先计算用户和候选项目。通过利用验证的编码器模型和多意见层,eMbsum衍生了用户poly-ebedding(UPE)和内容poly-embedding(CPE)来计算用户和候选项目之间的相关性分数 ...