我们提出了一种方法,通过使用稀疏的输入视图集优化底层连续立体场景函数,实现合成复杂场景的新颖视图的最先进的结果。我们的算法使用全连接(非图层)深度网络表示场景,其输入是单个连续5D坐标(空间位置$(x,y,z)$和观看方向$(\theta,\phi)$),其输出是该空间位置处的体积密度和与视图相关的发射辐射率。我们通过查询沿着相机光线的5D坐标来合成视图,并使用经典的体积渲染技术将输出颜色和密度投影到图像中... ...

0 1 2 9 2024/11/11 arXiv:2003.08934v2 Eny530

对参与者之间的关系进行建模对于识别多人场景中的群体活动非常重要。本文旨在使用深度模型有效地学习参与者之间的判别关系。为此,我们建议构建一个灵活高效的演员关系图(ARG)来同时捕获演员之间的外观和位置关系 ...

0 0 1 1 2024/03/23 arXiv:1904.10117v1 Eny530

时间建模对于多帧人体姿势估计至关重要。大多数现有方法直接采用光流或可变形卷积来预测全谱运动场,这可能会产生许多不相关的线索,例如附近的人或背景。如果不进一步努力挖掘有意义的运动先验,它们的结果就不是最优的,特别是在复杂的时空相互作用中 ...

0 0 0 0 2024/03/22 arXiv:2303.08475v2 Eny530

尽管麦克斯韦在 160 年前就发现了电磁波的物理定律,但如何在庞大而复杂的电气环境中精确模拟射频信号的传播仍然是一个长期存在的问题。困难在于射频信号和障碍物(例如障碍物)之间复杂的相互作用 ...

0 0 0 0 2024/03/21 arXiv:2305.06118v2 Eny530

我们提出了一种新的测试时间优化方法,用于估计视频序列中的密集和长距离运动。现有的光流或粒子视频跟踪算法通常在有限的时间窗口内运行,难以通过遮挡进行跟踪并保持估计运动轨迹的全局一致性。我们提出了一种完整且全局一致的运动表示,称为 OmniMotion,它可以对视频中的每个像素进行准确、全长的运动估计 ...

0 0 0 0 2024/05/05 arXiv:2306.05422v2 Eny530

两组实体(例如图像中的对象、句子中的单词)之间的跨域对齐是计算机视觉和自然语言处理的基础 ...

0 0 0 0 2024/03/14 arXiv:2006.14744v3 Eny530

人体姿势分析由于其用途不断扩大,包括游戏、视频监控、运动表现分析和人机交互等,在研究界和实际应用中都引起了极大的关注。深度学习的出现显着提高了姿势捕捉的准确性,使得基于姿势的应用变得越来越实用。本文对利用深度学习的基于姿势的应用进行了全面的调查,包括姿势估计、姿势跟踪和动作识别 ...

0 0 0 0 2024/03/08 arXiv:2310.13039v1 Eny530

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)