对大型多模型模型(LMM)的最新评估探索了它们在各个领域的功能,只有很少的基准专门针对城市环境。此外,现有的城市基准受到限于评估具有基本地区城市任务的LMM在单一观点下,导致对LMM在城市环境中的能力的评估不完整。为了解决这些问题,我们提出了Urbench,这是一种综合基准,旨在评估复杂的多视图城市场景中的LMM ...
0 0 0 2025/03/11 arXiv:2408.17267v3 wangyadong
深度学习是一种实现人工智能的现代方法。存在许多框架来实施机器学习任务;但是,性能受到计算资源的限制。使用量子计算机加速训练是一种有前途的方法 ...
0 0 0 2025/03/11 arXiv:1901.09133v1 pngyuo
在自主驾驶中,动态环境和角落案件对自我决策的鲁棒性构成了重大挑战。为了应对这些挑战,从端到端自主驾驶范式中的国家行动映射开始,我们引入了一条新颖的管道VDT-Auto。利用国家对视觉语言模型(VLM)的理解的进步,并结合了基于扩散 Transformer 的动作生成,我们的VDT-AUTO在几何和上下文上以对扩散过程的调理来解析环境 ...
0 0 0 2025/03/11 arXiv:2502.20108v2 313563
我们提出了一种新方法,用于无监督检测高分辨率,3d点云中的几何异常。特别是,我们建议将已建立的学生-教师异常检测框架适应三个维度。训练学生网络以匹配无异常点云上预训练教师网络的输出... ...
0 0 0 2025/03/11 arXiv:2202.11660v1 JokerLin
量子神经网络(QNN)是近期嘈杂的中间尺度量子(NISQ)设备可以在经典资源上找到有利的应用程序的有希望的方向之一。复发性神经网络是顺序学习的最基本网络,但是到目前为止,仍然缺乏量子复发性神经网络(QRNN)的规范模型,这无疑限制了量子深度学习领域的研究。在目前的工作中,我们提出了一种新型的QRNN,这将是一个很好的候选者作为规范QRNN模型,在其中,量子循环块(QRB)以硬件有效的方式构建,而Q ...
0 0 0 2025/03/11 arXiv:2302.03244v1 pngyuo
扩散模型的最新进展导致了音频驱动的唇同步的重大进展。但是,现有方法通常依赖于受约束的视听比对先验或中间表示的多阶段学习来迫使唇部运动合成。这导致复杂的训练管道和有限的运动自然性 ...
0 0 0 2025/03/11 arXiv:2502.11515v1 vonchenplus
我们提出了一个名为Gramian角场(QGAF)的时间序列预测方法。这种方法将量子计算技术的优势与深度学习相结合,旨在提高时间序列分类和预测的精度。我们通过设计特定的量子电路,成功地将股票返回时间序列数据转换为适合卷积神经网络(CNN)训练的二维图像 ...
0 0 0 2025/03/11 arXiv:2310.07427v3 pngyuo
多模型模型的一项基本任务是将引用的图像区域转换为人类首选语言描述。但是,现有方法忽略了不同任务的分辨率适应性需求,这会阻碍他们找出精确的语言描述。在这项研究中,我们提出了一种dynrefer方法,以通过模仿人类视觉认知的分辨率适应性来追求高准确区域级别 ...
0 0 0 2025/03/11 arXiv:2405.16071v2 18804024672

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)