JPEG 仍然是最广泛使用的有损图像编码方法之一。然而,JPEG 的不可微性质限制了深度学习管道中的应用。最近提出了几种可微分的 JPEG 近似来解决这个问题 ...
基于热图的方法通过似然热图对输出分布进行建模,在人体姿态估计领域占据主导地位。相比之下,基于回归的方法更有效,但性能较差。在这项工作中,我们探索最大似然估计(MLE)来开发一种高效且有效的基于回归的方法 ...
我们提出了一种新颖的掩模图像建模(MIM)方法,即上下文自动编码器(CAE),用于自监督表示预训练。我们通过在编码表示空间中进行预测来预训练编码器。预训练任务包括两个任务:掩码表示预测 - 预测掩码补丁的表示,以及掩码补丁重建 - 重建掩码补丁 ...