大型视觉语言模型 (LVLM) 为各种视觉语言任务提供了显着的优势。然而,阻碍它们在现实世界场景中应用的一个挑战,特别是在安全性、鲁棒性和可靠性方面,是它们有限的语义基础能力,这涉及将语言与图像中引用的物理世界实体或概念连接起来。因此,迫切需要进行全面的研究来评估广泛使用的 LVLM 的语义基础能力 ...
现有的单模态和多模态显着目标检测(SOD)方法侧重于设计适合各自任务的特定架构。然而,为不同的任务开发完全不同的模型会导致劳动力和时间的消耗,以及高昂的计算和实际部署成本。在本文中,我们尝试在称为 UniSOD 的统一框架中解决单模态和多模态 SOD,该框架充分利用了不同任务之间重叠的先验知识 ...
神经常微分方程描述了值如何随时间变化。这就是为什么它们在连续数据建模中变得重要的原因,特别是当观察间隔不规则时。在本文中,我们提出了一种替代方案,通过使用神经网络直接对解曲线(ODE 的流程)进行建模 ...
大型语言模型 (LLM) 导致借助模型辅助的协作写作激增。由于不同的用户采纳同一模型的建议,因此产生的内容的多样性可能会减少,从而可能限制公共话语中的不同观点。在这项工作中,我们通过一项受控实验来衡量共同写作对多样性的影响,其中用户以三种设置撰写议论文——使用基础 LLM (GPT3)、反馈调整的 LLM (InstructGPT) 和无模型写作帮助 ...
大型语言模型(LLM)的广泛应用,特别是在安全关键领域,需要对 LLM 的对抗鲁棒性进行适当的评估。本文提出了一种有效的工具,通过基于提示的对抗性攻击(PromptAttack)来审计 LLM 的对抗性鲁棒性。 PromptAttack 将对抗性文本攻击转换为攻击提示,可以导致受害者 LLM 输出对抗性样本来欺骗自己 ...
我们研究最先进的模型回答信息检索的约束满足查询的能力(例如,“圣地亚哥的冰淇淋店列表”) ...
大型语言模型(LLM)在各种评估基准训练中都取得了令人瞩目的表现。然而,担心其大量语言料库中可能存在数据污染。此外,当前基准的静态性质和固定复杂性可能会减少LLM的先进能力... ...
准确的交通流预测很大程度上依赖于交通流数据的时空相关性。目前大多数研究分别捕获空间和时间维度的相关性,使得捕获复杂的时空异质性变得困难,并且通常以增加模型复杂性来提高预测精度为代价。尽管在时空同步建模领域已经有了突破性的尝试,但在性能和复杂性方面仍然存在显着的局限性。本次http URL研究提出了一种更快、更有效的时空同步交通流预测模型来解决这些问题 ...