准确地描绘了遥感(RS)图像中现实世界的景观需要精确的对象与其环境之间的对齐。但是,自然图像的大多数现有合成方法优先考虑前景控制,通常将背景减少到纯质地。这忽略了前景与背景之间的相互作用,这可能导致RS场景中的不一致 ...

0 0 0 0 2025/02/05 arXiv:2412.08464v2 COO

本文提出了在设计现代卷积神经网络(Convnets)时大型卷积内核的范式。我们确定使用一些大型内核,而不是堆叠多个较小的内核,这可能是一种卓越的设计策略。我们的作品介绍了一套针对大型内核弯曲的建筑设计指南,以优化其效率和性能 ...

0 0 0 0 2025/02/04 arXiv:2410.08049v1 COO

语义分割对于许多应用程序来说是一项重要任务,但以有限的计算成本实现先进的性能仍然相当具有挑战性。在本文中,我们提出了 CGRSeg,这是一种基于上下文引导的空间特征重建的高效但有竞争力的分割框架。矩形自校准模块经过精心设计,用于空间特征重建和金字塔上下文提取 ...

0 0 0 0 2025/01/09 arXiv:2405.06228v2 COO

与一般物体相比,空中目标通常与周围环境杂乱的任意方向非轴对齐。与回归边界框方向的主流方法不同,本文利用自适应点表示提出了一种有效的自适应点学习方法来进行空中目标检测,该方法能够捕获任意方向实例的几何信息。为此,提出了三种定向转换函数,以方便准确定向的分类和定位 ...

0 0 0 0 2025/01/08 arXiv:2105.11111v4 COO

尽管发展迅速,但遥感目标检测对于检测高纵横比目标仍然具有挑战性。本文表明,大条带卷积是遥感目标检测的良好特征表示学习器,并且可以很好地检测各种长宽比的目标。基于大型带状卷积,我们构建了一种名为 Strip R-CNN 的新网络架构,它简单、高效且功能强大 ...

0 0 0 0 2025/01/08 arXiv:2501.03775v1 COO

传统模型专注于水平表格检测,但在旋转环境中表现不佳,限制了表格识别的进展。本文介绍了一项新任务:检测表格区域并定位旋转场景中的头尾部分。我们提出了相应的数据集、评估指标和方法 ...

0 0 0 0 2025/01/06 arXiv:2402.03315v1 COO

预训练和微调可以提高视觉任务的传输效率和性能。最近的增量调整方法为视觉分类任务提供了更多选择。尽管取得了成功,但现有的视觉增量调整技术未能超过对目标检测和分割等具有挑战性的任务进行全面微调的上限 ...

0 0 0 0 2025/01/03 arXiv:2408.08345v2 COO

由于尺寸和方向各不相同,航空图像中的定向物体检测提出了重大挑战。当前最先进的检测器通常依赖于两阶段或一阶段方法,通常采用基于锚点的策略,由于训练期间生成的锚点数量过多,这可能会导致计算成本高昂的操作。相比之下,无锚机制提供更快的处理速度,但会减少训练样本的数量,从而可能影响检测精度 ...

0 0 0 0 2024/12/30 arXiv:2412.14379v1 COO

减少延迟是最近超分辨率(SR)研究中的一个强劲趋势。虽然最近的进展利用了各种卷积块、注意力模块和主干来释放卷积神经网络 (ConvNet) 的全部潜力,但实现实时性能仍然是一个挑战。为此,我们提出了 PlainUSR,这是一种新颖的框架,包含三个相关的修改,以加速 ConvNet 实现高效的 SR ...

0 0 0 0 2024/12/27 arXiv:2409.13435v1 COO

对比语言图像预训练(CLIP)在各种图像级任务上表现出强大的零样本分类能力,从而引发了无需额外训练即可将 CLIP 用于像素级开放词汇语义分割的研究。关键是改进图像级CLIP的空间表示,例如用自注意力图或基于视觉基础模型的注意力图替换最后一层的自注意力图。在本文中,我们提出了一种新颖的分层框架,名为 CLIPer,它分层地改进了 CLIP 的空间表示 ...

0 0 0 0 2024/12/27 arXiv:2411.13836v1 COO

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)