由于卷积神经网络(CNN)在从大规模数据中学习可概括的图像先验方面表现良好,因此这些模型已广泛应用于图像恢复和相关任务。最近,另一类神经架构 Transformers 在自然语言和高级视觉任务上表现出了显着的性能提升。虽然 Transformer 模型弥补了 CNN 的缺点(即 ...

0 0 0 0 2024/10/21 arXiv:2111.09881v2 tuxiaolv

图像去雾是一种代表性的低级视觉任务,它从有雾的图像中估计潜在的无雾图像。近年来,基于卷积神经网络的方法在图像去雾中占据主导地位。然而,最近在高级视觉任务中取得突破的视觉 Transformers 并没有为图像去雾带来新的维度 ...

0 0 0 0 2024/10/21 arXiv:2204.03883v1 tuxiaolv

在新兴的物联网生态系统中,多元时间序列(MTS)数据已经变得无处不在,凸显了时间序列预测在众多应用中的基本作用。长期 MTS 预测的关键挑战需要能够捕获系列内和系列间依赖性的熟练模型。深度学习的最新进展,尤其是 Transformer,已经显示出希望 ...

0 0 0 0 2024/10/21 arXiv:2307.01616v2 tuxiaolv

一致性模型 (CM) 是一类强大的基于扩散的生成模型,针对快速采样进行了优化。大多数现有的 CM 都是使用离散时间步长进行训练的,这会引入额外的超参数,并且容易出现离散化错误。虽然连续时间公式可以缓解这些问题,但它们的成功受到训练不稳定的限制 ...

0 2 1 1 2024/10/21 arXiv:2410.11081v1 tuxiaolv

时空(ST)预测已经在地球科学领域获得了事实上的关注,例如气象预测、人类流动感知等。然而,数据的稀缺加上传感器部署的高额费用导致了显着的数据不平衡。此外,过度定制且缺乏因果关系的模型进一步破坏了普遍性和可解释性 ...

0 0 0 0 2024/10/18 arXiv:2409.19608v1 tuxiaolv

Transformer 倾向于过度关注不相关的上下文。在这项工作中,我们引入了 Diff Transformer,它可以在消除噪音的同时增强对相关上下文的关注。具体来说,差分注意力机制将注意力分数计算为两个单独的 softmax 注意力图之间的差异 ...

0 1 1 6 2024/10/12 arXiv:2410.05258v1 tuxiaolv

低光图像增强致力于提高对比度、调整可见度并恢复颜色和纹理的失真。现有方法通常更注重通过增加低光图像的亮度来提高可见度和对比度,而忽视了颜色和纹理恢复对于高质量图像的重要性。针对上述问题,我们提出了一种新颖的亮度和色度双分支网络,称为 LCDBNet,用于低光图像增强,它将低光图像增强分为两个子任务,即: ...

0 0 0 0 2024/09/17 arXiv:2307.09104v1 tuxiaolv

尽管大规模文本到图像生成模型最近取得了进展,但用这些模型操纵真实图像仍然是一个具有挑战性的问题。现有编辑方法的主要局限性在于,它们要么无法在大范围的图像编辑上以一致的质量执行,要么需要耗时的超参数调整或扩散模型的微调以保留输入图像的图像特定外观。我们提出了一种新颖的方法,该方法通过引导机制基于改进的扩散采样过程 ...

0 0 0 0 2024/09/13 arXiv:2409.01322v2 tuxiaolv

准确的交通预测对于有效的城市规划和交通管理、实现高效的资源分配和增强的出行体验至关重要。然而,现有模型在泛化方面常常面临局限性,难以对未见过的地区和城市进行零样本预测,并且长期准确性下降。这主要是由于处理交通数据的空间和时间异质性所面临的固有挑战,以及跨时间和空间的显着分布变化 ...

0 0 0 0 2024/09/10 arXiv:2408.10269v1 tuxiaolv

参与式城市规划是现代城市规划的主流,需要居民的积极参与。然而,传统的参与范式需要经验丰富的规划专家,而且往往耗时且成本高昂。幸运的是,新兴的大型语言模型(LLM)已经显示出相当大的模拟类人代理的能力,可以用来轻松模拟参与过程 ...

0 0 0 0 2024/09/10 arXiv:2402.17161v1 tuxiaolv

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)