人体轨迹预测(HTP)在过去几年中取得了巨大的发展势头,并且已经提出了许多解决方案来解决它。适当的基准测试是比较方法的关键问题,本文解决了评估给定数据集相对于预测问题的复杂程度的问题。为了评估数据集的复杂性,我们围绕三个概念定义了一系列指标:轨迹可预测性;轨迹规律性;上下文复杂性 ...

0 0 0 0 2024/06/24 arXiv:2010.00890v2 Eny530

人体运动的不确定性要求轨迹预测系统使用概率模型来制定多模态现象并推断一组有限的未来轨迹。然而,大多数现有方法的推理过程依赖于蒙特卡罗随机采样,由于预测分布的长尾效应,不足以用有限的样本覆盖现实路径。为了促进随机预测的采样过程,我们提出了一种称为 BOsampler 的新方法,以无监督的方式通过贝叶斯优化自适应地挖掘潜在路径,作为一种顺序设计策略,其中新的预测依赖于先前抽取的样本 ...

0 0 0 0 2024/06/24 arXiv:2304.04298v1 Eny530

了解人群运动动态对于监控系统和自动驾驶等实际应用至关重要 ...

0 0 0 0 2024/06/17 arXiv:2005.08514v2 Eny530

随着无线通信技术的快速发展,无线接入点(AP)和物联网(IoT)设备已在我们的周围广泛部署。各种类型的无线信号(例如 ...

0 0 0 0 2024/05/09 arXiv:2206.09532v1 Eny530

将机器学习与几何推理相结合的神经渲染技术已成为从稀疏图像集中合成场景的新颖视图的最有前途的方法之一。其中,神经辐射场 (NeRF) 尤为突出,它训练深度网络将 5D 输入坐标(表示空间位置和观看方向)映射为体积密度和与视图相关的发射辐射。然而,尽管生成的图像达到了前所未有的真实感水平,NeRF 只适用于静态场景,可以从不同的图像中查询相同的空间位置 ...

0 0 0 0 2024/05/01 arXiv:2011.13961v1 Eny530

人体运动预测的目标是估计未来一段时间内人类的行为,是许多现实应用中的一项基本任务。然而,现有的工作通常集中于预测人体的主要关节,而没有考虑人手的微妙运动。在实际应用中,手势在人类与现实世界的交流中发挥着重要作用,表达了人类的首要意图 ...

0 0 0 0 2024/04/27 arXiv:2312.11972v2 Eny530

得益于计算机视觉和机器学习的快速发展,视频分析任务已经从推断当前状态转变为预测未来状态。基于视觉的动作识别和视频预测就是这样的任务,其中动作识别是基于完整的动作执行来推断人类动作(当前状态),动作预测是基于不完整的动作执行来预测人类动作(未来状态)。这两项任务因其在现实世界中的爆炸性应用而成为最近特别流行的话题,例如视觉监控、自动驾驶车辆、娱乐和视频检索等 ...

0 0 0 0 2024/04/08 arXiv:1806.11230v3 Eny530

我们提出了一种方法,通过使用稀疏的输入视图集优化底层连续体积场景函数,实现合成复杂场景的新颖视图的最先进的结果。我们的算法使用全连接(非卷积)深度网络表示场景,其输入是单个连续 5D 坐标(空间位置 $(x,y,z)$ 和观看方向 $(\theta, \phi)$ ),其输出是该空间位置处的体积密度和与视图相关的发射辐射率。我们通过查询沿相机光线的 5D 坐标来合成视图,并使用经典的体积渲染技术将输出颜色和密度投影到图像中 ...

0 1 2 9 2024/03/28 arXiv:2003.08934v2 Eny530

对参与者之间的关系进行建模对于识别多人场景中的群体活动非常重要。本文旨在使用深度模型有效地学习参与者之间的判别关系。为此,我们建议构建一个灵活高效的演员关系图(ARG)来同时捕获演员之间的外观和位置关系 ...

0 0 1 1 2024/03/23 arXiv:1904.10117v1 Eny530

时间建模对于多帧人体姿势估计至关重要。大多数现有方法直接采用光流或可变形卷积来预测全谱运动场,这可能会产生许多不相关的线索,例如附近的人或背景。如果不进一步努力挖掘有意义的运动先验,它们的结果就不是最优的,特别是在复杂的时空相互作用中 ...

0 0 0 0 2024/03/22 arXiv:2303.08475v2 Eny530

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)