图像融合旨在通过将具有有限光谱信息的高分辨率图像与具有丰富光谱数据的低分辨率图像相结合来生成高分辨率多/高光谱图像。当前基于深度学习 (DL) 的图像融合方法主要依靠 CNN 或 Transformer 来提取特征并合并不同类型的数据。虽然 CNN 很高效,但它们的接受域有限,限制了它们捕获全局背景的能力 ...
0 0 0 2024/12/21 arXiv:2404.07932v3 pdssunny
开放集识别(OSR)假设未知实例在推理时突然出现。 OSR 的主要挑战是模型对未知数的响应是完全不可预测的。此外,开放集的多样性使其变得更加困难,因为实例具有不同的难度级别 ...
0 0 0 2024/12/21 arXiv:2207.10024v1 ninelie02
零样本异常检测 (ZSAD) 对于在不使用训练样本的情况下检测目标数据集中的异常模式至关重要,特别是在目标域和训练数据之间存在分布差异或由于访问受限而出现数据稀缺的情况下。尽管最近预训练的视觉语言模型在各种视觉任务中表现出强大的零样本性能,但它们专注于学习类语义,这使得它们直接应用于 ZSAD 具有挑战性。为了解决这种情况,我们提出了 GlocalCLIP,它独特地将全局和本地提示分开并联合优化  ...
0 0 0 2024/12/21 arXiv:2411.06071v3 magic
基于生成式预训练 Transformer 的大型语言模型 (LLM) 在知识图问答 (KGQA) 任务上取得了显着的性能。然而,由于生成范式带来的幻觉行为,LLM经常在KGQA中产生不接地气的子图规划或推理结果,这可能会阻碍基于LLM的KGQA模型的进步。为了解决这个问题,我们提出了一种新的基于 LLM 的判别推理(LDR)方法来显式地建模子图检索和答案推理过程 ...
0 0 0 2024/12/21 arXiv:2412.12643v1 Shmily
自动调制识别(AMR)可检测接收信号的调制方案,以便在不需要先验信息的情况下进行进一步的信号处理,并在此类信息丢失时提供基本功能。深度学习 (DL) 领域的最新突破为开发用于通信系统的高性能 DL-AMR 方法奠定了基础。与传统的调制检测方法相比,由于深度神经网络强大的特征提取和分类能力,DL-AMR方法取得了良好的性能,包括高识别精度和低误报 ...
0 0 0 2024/12/21 arXiv:2207.09647v1 luke2333333
在本文中,我们介绍了 Era3D,这是一种新颖的多视图扩散方法,可以从单视图图像生成高分辨率多视图图像。尽管在多视图生成方面取得了显着进步,但现有方法仍然存在相机先验不匹配、效率低下和分辨率低等问题,导致多视图图像质量较差。具体来说,这些方法假设输入图像应符合预定义的相机类型,例如相机类型 ...
0 0 0 2024/12/21 arXiv:2405.11616v3 美式
为 3D 重建任务生成一致的多个视图仍然是现有图像到 3D 扩散模型的挑战。一般来说,将 3D 表示合并到扩散模型中会降低模型的速度以及通用性和质量。本文提出了一个通用框架,可以从单个图像或利用场景表示转换器和视图条件扩散模型生成一致的多视图图像 ...
0 0 0 2024/12/21 arXiv:2405.03894v2 美式
我们提出了一种从单个 RGB 图像重建 3D 对象的新颖方法。我们的方法利用最新的图像生成模型来推断隐藏的 3D 结构,同时保持对输入图像的忠实。虽然现有方法在根据文本提示生成 3D 模型方面取得了令人印象深刻的结果,但它们没有提供一种简单的方法来调节输入 RGB 数据 ...
0 0 0 2024/12/21 arXiv:2311.05230v1 美式

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)