我们提出了 DejaVu,一种新颖的框架,它利用条件图像再生作为训练过程中的额外监督,以改进深度网络以实现分割、深度估计和表面法线预测等密集预测任务。首先,我们对输入图像应用编辑,通过稀疏采样或选择性频率去除来去除某些结构信息。接下来,我们使用条件再生器,它将编辑后的图像和密集预测作为输入,并通过填充缺失的结构信息来重建原始图像 ...

0 0 0 0 2024/12/04 arXiv:2303.01573v2 hesy77

对于安全关键型应用来说,在分布外 (OoD) 场景(例如恶劣天气条件、传感器故障和噪声污染)下进行准确的深度估计是理想的。然而,现有的深度估计系统不可避免地会受到现实世界的损坏和扰动的影响,并且很难在这种情况下提供可靠的深度预测。在本文中,我们总结了 RoboDepth 挑战赛的获奖解决方案,这是一项旨在促进和推进稳健的 OoD 深度估计的学术竞赛 ...

0 0 0 0 2024/12/03 arXiv:2307.15061v2 hesy77

在本文中,我们研究了从无约束 RGB 单目夜间图像估计每像素深度图的问题,这是一项艰巨的任务,在文献中尚未得到充分解决。当使用夜间图像进行测试时,由于夜间图像之间存在较大的域偏移,最先进的白天深度估计方法会严重失败。由于缺乏白天图像中常见的均匀照明,用于训练这些网络的常见照片度量损失可能不适用于夜间图像,这使其成为一个难以解决的问题 ...

0 0 0 0 2024/11/29 arXiv:2010.01402v1 hesy77

当将在某些(源)数据集上训练的模型转移到目标测试数据时,由于它们之间的域差距,通常会观察到性能下降。弥补这一差距的现有方法,例如域适应(DA),可能需要训练模型的源数据(通常不可用),而其他方法,即 ...

0 0 0 0 2024/11/29 arXiv:2402.03312v4 hesy77

现在通常通过使用计算成本昂贵的深度神经网络或人工标记器来查询非结构化数据(例如视频或文本)来生成结构化信息,例如 ...

0 0 0 0 2024/11/28 arXiv:2009.04540v2 hesy77

无监督域适应(UDA)旨在将模型从标记的源域调整为未标记的目标域。在适应不利场景时,现有的 UDA 方法由于缺乏指令而无法表现良好,导致其模型忽略所有不利场景中的差异。为了解决这个问题,我们提出了 CoDA,它指示模型在场景和图像级别上区分、聚焦和学习这些差异 ...

0 0 1 6 2024/11/26 arXiv:2403.17369v3 hesy77

域适应在计算机视觉领域已得到广泛研究,但仍然需要在训练时访问目标图像,这在某些不常见的条件下可能很棘手。在本文中,我们提出了“提示驱动的零样本域适应”的任务,其中我们仅使用目标域自然语言的一般描述来适应在源域上训练的模型,即 ...

0 0 0 0 2024/11/26 arXiv:2212.03241v3 hesy77

虽然最先进的单目深度估计方法在理想环境下取得了令人印象深刻的结果,但在具有挑战性的照明和天气条件下(例如夜间或下雨的情况下),它们非常不可靠。在本文中,我们发现了这些安全关键问题,并使用 md4all 来解决它们:这是一种简单而有效的解决方案,可以在不利和理想条件下以及不同类型的学习监督下可靠地工作。我们通过在完美设置下利用现有方法的功效来实现这一目标 ...

0 0 0 0 2024/11/25 arXiv:2308.09711v1 hesy77

准确的真实深度注释很难获得,需要使用激光雷达传感器等特殊设备。自监督方法试图通过处理视频或立体声序列来克服这个问题,而这些序列可能并不总是可用。相反,在本文中,我们提出了一种域适应方法,使用完全注释的源数据集和未注释的目标数据集来训练单目深度估计模型 ...

0 0 0 0 2024/11/25 arXiv:2009.01579v1 hesy77

语义分割的域适应旨在在源域和目标域之间存在分布变化的情况下提高模型性能。利用辅助任务(例如深度估计)的监督有可能治愈这种转变,因为许多视觉任务彼此密切相关。然而,这种监督并不总是有效 ...

0 0 0 0 2024/11/25 arXiv:2104.13613v2 hesy77

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)