受益于在通道或空间位置之间建立相互依赖性的能力,注意力机制最近已被广泛研究并广泛应用于各种计算机视觉任务中。在本文中,我们研究了轻量级但有效的注意力机制,并提出了三元组注意力,这是一种通过使用三分支结构捕获跨维度交互来计算注意力权重的新方法。对于输入张量 ...
0 1 0 2025/03/13 arXiv:2010.03045v2 phe
锥体特征表示是解决对象检测中规模变化的挑战的常见实践。但是,不同特征量表之间的不一致是基于特征金字塔的单发探测器的主要限制。在这项工作中,我们提出了一种新颖的和数据驱动的锥体特征融合策略,称为自适应空间特征融合(ASFF) ...
0 0 0 2025/03/13 arXiv:1911.09516v2 WHB
为了增强低光图像,通常是暴露的图像是高度不良的,即它们之间的映射关系是一对多的。先前基于像素的重建损失和确定性过程的工作未能捕获正常暴露图像的复杂条件分布,从而导致亮度不当,残留噪声和人工制品。在本文中,我们调查通过提出的归一化流模型对这种一对多关系进行建模 ...
0 0 0 2025/03/13 arXiv:2109.05923v1 tuxiaolv
3D 高斯溅射 (3DGS) 最近彻底改变了辐射场重建,无需烘焙即可实现高质量的新颖视图合成和快速渲染速度。然而,由于 3D 高斯的多视图不一致性质,3DGS 无法准确表示表面。我们提出了 2D 高斯分布 (2DGS),这是一种从多视图图像中建模和重建几何精确辐射场的新方法 ...
0 0 0 2025/03/13 arXiv:2403.17888v3 Sm0ggy
扩散模型在图像恢复任务中取得了令人鼓舞的结果,但由于耗时,计算资源的过度消耗和不稳定的恢复而遭受损失。为了解决这些问题,我们提出了一种鲁棒性,有效的基于扩散的低光图像增强方法,称为diffll。具体而言,我们提出了一个基于小波的条件扩散模型(WCDM),该模型利用扩散模型的生成能力来产生令人满意的感知保真度 ...
0 0 0 2025/03/13 arXiv:2306.00306v3 tuxiaolv
在视频中恢复密集和远程像素运动是一个具有挑战性的问题。困难的一部分来自3D到2D投影过程,导致2D运动结构域的阻塞和不连续性。虽然2D运动可能是复杂的,但我们认为基本的3D运动通常可以简单且较低 ...
0 0 0 2025/03/13 arXiv:2404.04319v1 hx5563
本文在所谓的参数方法的框架中介绍了形状不确定性定量的新型边界积分方法。关键思想是构建一个集成网格,其关联的权重函数包括随机边界施加的不规则性和非平滑度。因此,可以用相对较少的网格点进行准确评估溶液 ...
0 0 0 2025/03/13 arXiv:1704.07727v2 FOUR_A
在本文中,我们提出了一种称为“对比聚类(CC)”的单阶段在线聚类方法,该方法明确执行实例和群集级对比度学习。要具体而言,对于给定的数据集,正和负实例对是通过数据增强构建的,然后投影到特征空间中。在其中,实例和群集级对比度学习分别通过最大化正对的相似性,同时最大程度地减少负面的对比,在行和列空间中分别进行 ...
0 0 0 2025/03/13 arXiv:2009.09687v1 FOUR_A

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)