我们引入了 CoTracker,这是一种基于 Transformer 的模型,可以跨视频序列联合跟踪帧中的密集点。这与大多数现有的最先进的方法不同,这些方法独立跟踪点,忽略它们的相关性。我们表明联合跟踪可以显着提高跟踪精度和鲁棒性 ...
对视频的一般运动理解不仅涉及跟踪对象,还涉及感知其表面如何变形和移动。此信息对于推断 3D 形状、物理属性和对象交互非常有用。虽然在较长的视频剪辑中跟踪表面上的任意物理点的问题已经受到了一些关注,但到目前为止,还没有用于评估的数据集或基准 ...
本文解决了单幅图像的深度估计问题。现有的工作要么专注于泛化性能,而忽略度量标准,即 ...