人类智能可以根据视觉和语言描述来检索任何人。然而,当前的计算机视觉社区分别研究不同场景下的特定行人重新识别(ReID)任务,这限制了其在现实世界中的应用。本文试图通过提出一种新的指令-ReID任务来解决这个问题,该任务要求模型根据给定的图像或语言指令来检索图像 ...

0 0 0 0 2024/04/19 arXiv:2306.07520v4 17861303983

基于视频的行人重新识别(Re-ID)旨在匹配非重叠摄像机上的行人视频序列。如何将视频的空间和时间信息嵌入到其特征表示中是一项实用但具有挑战性的任务。虽然大多数现有方法通过聚合图像特征并在神经网络中设计注意机制来学习视频特征,但它们仅探索高层特征中帧之间的相关性 ...

0 0 0 0 2024/04/08 arXiv:1908.01683v1 17861303983

以人为中心的视觉任务由于其广泛的应用而引起了越来越多的研究关注。在本文中,我们的目标是从大量未标记的人类图像中学习一般的人类表示,这可以最大程度地有利于下游以人类为中心的任务。我们将这种方法称为 SOLIDER,一种语义可控的自我监督学习框架 ...

0 0 0 0 2024/04/08 arXiv:2303.17602v1 17861303983

尽管行人重新识别(ReID)的性能得到了显着提升,但实际场景中的许多具有挑战性的问题尚未得到充分研究,例如复杂的场景和光照变化、视点和姿势变化以及大量身份信息。相机网络 ...

0 0 0 0 2024/04/07 arXiv:1711.08565v2 17861303983

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)