人体运动预测的目标是估计未来一段时间内人类的行为,是许多现实应用中的一项基本任务。然而,现有的工作通常集中于预测人体的主要关节,而没有考虑人手的微妙运动。在实际应用中,手势在人类与现实世界的交流中发挥着重要作用,表达了人类的首要意图 ...
得益于计算机视觉和机器学习的快速发展,视频分析任务已经从推断当前状态转变为预测未来状态。基于视觉的动作识别和视频预测就是这样的任务,其中动作识别是基于完整的动作执行来推断人类动作(当前状态),动作预测是基于不完整的动作执行来预测人类动作(未来状态)。这两项任务因其在现实世界中的爆炸性应用而成为最近特别流行的话题,例如视觉监控、自动驾驶车辆、娱乐和视频检索等 ...
我们提出了一种方法,通过使用稀疏的输入视图集优化底层连续体积场景函数,实现合成复杂场景的新颖视图的最先进的结果。我们的算法使用全连接(非卷积)深度网络表示场景,其输入是单个连续 5D 坐标(空间位置 $(x,y,z)$ 和观看方向 $(\theta, \phi)$ ),其输出是该空间位置处的体积密度和与视图相关的发射辐射率。我们通过查询沿相机光线的 5D 坐标来合成视图,并使用经典的体积渲染技术将输出颜色和密度投影到图像中 ...
对参与者之间的关系进行建模对于识别多人场景中的群体活动非常重要。本文旨在使用深度模型有效地学习参与者之间的判别关系。为此,我们建议构建一个灵活高效的演员关系图(ARG)来同时捕获演员之间的外观和位置关系 ...
时间建模对于多帧人体姿势估计至关重要。大多数现有方法直接采用光流或可变形卷积来预测全谱运动场,这可能会产生许多不相关的线索,例如附近的人或背景。如果不进一步努力挖掘有意义的运动先验,它们的结果就不是最优的,特别是在复杂的时空相互作用中 ...
尽管麦克斯韦在 160 年前就发现了电磁波的物理定律,但如何在庞大而复杂的电气环境中精确模拟射频信号的传播仍然是一个长期存在的问题。困难在于射频信号和障碍物(例如障碍物)之间复杂的相互作用 ...
两组实体(例如图像中的对象、句子中的单词)之间的跨域对齐是计算机视觉和自然语言处理的基础 ...
人体姿势分析由于其用途不断扩大,包括游戏、视频监控、运动表现分析和人机交互等,在研究界和实际应用中都引起了极大的关注。深度学习的出现显着提高了姿势捕捉的准确性,使得基于姿势的应用变得越来越实用。本文对利用深度学习的基于姿势的应用进行了全面的调查,包括姿势估计、姿势跟踪和动作识别 ...