隐喻的想象力,即连接看似无关的概念的能力,是人类认知和交流的基础。尽管理解语言隐喻已经大大提高,但掌握了多模式的隐喻,例如在互联网模因中发现的隐喻,但由于其非常规的表达和隐含的含义,带来了独特的挑战。多模式隐喻识别的现有方法通常难以弥合字面和象征性解释之间的差距 ...
代理,主动塑造事件的能力对于人类互动和协作的方式至关重要。尽管正在开发LLM来模拟人类的行为并充当类似人类的代理,但几乎没有给予这些模型所拥有的代理商,以主动管理互动和协作的方向。在本文中,我们将代理商作为LLM的理想功能进行调查,以及如何进行测量和管理 ...
大型语言模型(LLM)在高质量的文本生成中很受欢迎,但即使通过加强学习与人类价值观保持一致,也可以产生有害内容。对抗提示可以绕过他们的安全措施。我们提出了LLM自卫,这是一种简单的方法,可以通过将LLM屏幕进行诱发的响应来防御这些攻击 ...
视觉模型(VLMS)在自然图像上表现出强烈的零拍概括,并在可解释的医学图像分析中表现出了早期的希望。但是,现有的基准并未系统地评估这些模型是真正的理由,例如人类临床医生还是仅模仿浅表模式。为了解决这一差距,我们提出了DRVD板凳,这是第一个用于临床视觉推理的多模式基准 ...
LLM解码是通过从高带宽内存中加载键值(KV)缓存的大批次和长上下文的瓶颈,该缓存膨胀了,该存储器会膨胀延迟的延迟,而解码限制的顺序性质则是并行性。我们分析了算术强度,并行化以及模型质量之间的相互作用,并质疑当前的体系结构是否完全利用现代硬件。这项工作重新设计了注意力以执行从内存加载的每个字节的更多计算,以最大程度地提高硬件效率,而无需交易并行可扩展性 ...
向量数据库已成为一种新类型的系统,该系统支持高维向量的有效查询。其中许多将其数据库作为云中的服务。但是,各种可用的CPU以及跨CPU缺乏矢量搜索基准,使用户很难选择一个 ...
能够在不同环境下自主操作的人形机器人长期以来一直是机器人专家的目标。然而,人形机器人的自主操作在很大程度上仅限于某一特定场景,这主要是由于难以获得通用技能。 3D 视觉运动策略(例如 3D 扩散策略 (DP3))的最新进展已显示出将这些功能扩展到更野外环境的希望 ...
机器人描述模型对于模拟和控制至关重要,但是它们的创建通常需要大量的手动努力。为了简化此建模过程,我们介绍了Autourdf,这是一种无监督的方法,用于从点云框架构建描述文件的描述文件。我们的方法利用基于群集的点云注册模型,该模型跟踪点簇的6-DOF变换 ...