近年来,视觉语言模型(VLM)在有效整合和处理文本和视觉信息的能力上获得了很大的突出。在各种应用程序(例如场景感知和机器人技术)中,这种集成显着提高了性能。但是,VLM的部署也引起了关键的安全和安全问题,需要进行广泛的研究来评估这些VLM系统可能带来的潜在脆弱性 ...
0 0 0 2025/09/02 arXiv:2502.06390v2 hhhhh
这项工作探讨了大语言模型(LLMS)中的顺序模型编辑,这是一项关键任务,涉及通过多轮编辑不断修改LLMS中的内部知识,每次都结合了更新或更正以调整模型输出而无需昂贵的再培训。现有的模型编辑方法,尤其是那些改变模型参数的方法,通常集中在单轮编辑上,并且在顺序模型编辑中通常面临重大挑战,其中尤其是模型遗忘和失败的问题。为了应对这些挑战,我们引入了一种新的模型编辑方法,即\ textbf {n} eur ...
0 0 0 2025/09/02 arXiv:2410.04045v1 wangteqi
视觉和语言导航(VLN)任务要求代理遵循文本说明以浏览3D环境。传统方法使用监督的学习方法,严重依赖于特定领域的数据集来培训VLN模型。最近的方法试图利用封闭源的大型语言模型(LLM)(例如GPT-4)以零拍的方式解决VLN任务,但面临与现实世界中昂贵的 Token 成本和潜在数据泄露有关的挑战 ...
0 1 0 2025/09/02 arXiv:2409.18794v2 小胖猴
可靠的3D对象感知对于自主驾驶至关重要。由于其在所有天气条件下的传感能力,4D雷达最近受到了很多关注。但是,与LIDAR相比,4D雷达提供了更少的点云 ...
0 0 0 2025/09/02 arXiv:2504.03438v2 sunny78669
随着深度神经网络(DNN)的快速发展,许多现实世界应用程序采用多种模型来执行复合任务,例如自动驾驶汽车上的共同进行分类,检测和分割模型。这样的多租户DNN推断案例极大地加剧了计算复杂性,并要求为图形级操作员调度,运行时级资源意识以及硬件调度程序支持提供全面的协作。但是,此类多租户推断的当前调度支持仍然相对落后 ...
0 0 0 2025/09/02 arXiv:2111.14255v1 gigi
遗憾是最近在收入最大化拍卖的自动化设计方面的突破。它将深度学习的灵活性与基于遗憾的方法相结合,以放宽激励兼容性(IC)约束(参与者更喜欢以真实的竞标)以近似最佳拍卖。我们提出了遗憾的两个独立改进 ...
0 0 0 2025/09/02 arXiv:2202.13110v4 tainren9
最近,聚集模型已成为训练视觉基础模型的强大方法,利用了现有模型(例如夹子,Dino和Sam)的多教学蒸馏。该策略可以有效地创建健壮的模型,结合了个别教师的优势,同时大大减少了计算和资源需求。在本文中,我们彻底分析了最先进的聚集模型,确定了关键挑战,包括分辨率模式转移,教师失衡,特质教师文物和过多的产出 Token  ...
0 0 0 2025/09/02 arXiv:2412.07679v2 ranking666
引导过滤器是一种用于边缘感知图像过滤的技术。由于具有良好的视觉质量,快速速度和易于实现的性能,导滤波器在真实产品中见证了各种应用,例如手机中的图像编辑应用程序和立体声重建,并已包含在MATLAB和OPENCV官方中。在本说明中,我们提醒您可以简单地将引导过滤器从O(n)时间加速到子采样比的O(n/s^2)时间 ...
0 0 0 2025/09/02 arXiv:1505.00996v1 myuan

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)