如果人类的运动行为对于自主移动平台(例如自动驾驶汽车和社会机器人)至关重要,如果他们要在以人为本的环境中浏览。这是具有挑战性的,因为人类运动本质上是多模式的:鉴于人类运动路径的历史,人们将来有许多社会上合理的方式。我们通过结合序列预测和生成对抗网络的工具来解决这个问题:一个经常性的序列到序列模型观察运动历史并预测未来的行为,并使用一种新颖的合并机制来汇总人们的信息 ...
许多科学领域的数据具有潜在的结构,该结构是非欧国人空间。一些示例包括计算社会科学中的社交网络,通信中的传感器网络,大脑成像中的功能网络,遗传学中的调节网络以及计算机图形中的网状表面。在许多应用中,这种几何数据是大而复杂的(就社交网络而言,数十亿美元),并且是机器学习技术的自然目标 ...
高性能交通流量预测模型设计是一种智能运输系统的核心技术,是工业和学术社区的长期挑战但仍然具有挑战性的任务。物理原理和数据驱动模型之间缺乏整合是限制该领域发展的重要原因。在文献中,基于物理的方法通常可以清楚地解释流量流系统的动态过程,但准确性有限,而数据驱动的方法,尤其是具有黑盒结构的深度学习,可以提高性能,但由于缺乏合理的物理基础,无法完全受到信任 ...
在许多智能的系统和应用中,在复杂场景中的行人和汽车等代理商进行分析和预测轨迹变得越来越重要。丰富的代理商中社会互动行为的多样性和不确定性使这项任务比其他确定性计算机视觉任务更具挑战性。研究人员已经努力通过不同的数学模型和网络结构来量化这些相互作用对未来轨迹的影响,但是这个问题尚未得到很好的解决 ...
为了模拟人类行为的不确定性,随机轨迹预测需要对未来轨迹的复杂多模式分布。新兴的扩散模型揭示了它们在众多一代任务中的巨大表示能力,显示了随机轨迹预测的潜力。但是,昂贵的时间消耗可以阻止实时预测的扩散模型,因为需要大量的剥离步骤来确保足够的表示能力 ...
模拟物理系统是科学计算的核心组成部分,包括广泛的物理领域和应用。最近,数据驱动的方法激增,以补充传统的数值模拟方法,这是由减少计算成本和/或学习利用访问大量数据的新物理模型的机会的动机。但是,问题设置和应用的多样性导致了多种方法,每个方法都在不同的设置和不同的评估指标上进行了评估 ...
实时生成共同语音的手势需要时间连贯性和有效抽样。我们引入了加速滚动扩散,这是一种用于流式手势生成的新型框架,它扩展了具有结构化的渐进噪声调度的滚动扩散模型,从而实现了无缝的长期运动综合,同时保留了现实主义和多样性。我们进一步提出了滚动扩散梯子加速器(RDLA),这是一种新方法,将噪声时间表重组为逐步梯子,从而同时将多个框架固定 ...
文本到视频(T2V)一代的最新进展是由两个竞争范式驱动的:自回归语言模型和扩散模型。但是,每个范式都有内在的局限性:语言模型在视觉质量和错误积累中挣扎,而扩散模型缺乏语义理解和因果建模。在这项工作中,我们提出了Landiff,这是一个混合框架,通过粗到精细的一代协同范围 ...
统一的科学数据序列和结构(例如材料,分子,蛋白质)是一项关键任务 ...
较低场强度(例如3T)处于有限的空间分辨率的磁共振成像(MRI),这使得捕获临床诊断和神经成像研究至关重要的精细解剖学细节具有挑战性 ...