在各个地形上的腿部运动具有挑战性,需要从本体感受和视觉上精确地对机器人及其周围环境进行精确感知。但是,直接从高维视觉输入中学习通常是数据的信息和复杂。为了解决这个问题,传统方法试图先学习一项教师政策,并首先访问特权信息,然后学习学生政策以通过视觉输入模仿教师的行为 ...
0 0 0 2025/03/04 arXiv:2409.16784v1 tlok666
本文认为,在现实世界图像中,阐明人类姿势估计的人的姿势估计的任务。我们提出了一种共同解决检测任务和构成估计任务的方法:它占场景中的人数,识别遮挡的身体部位,并消除彼此近距离接近的人之间的身体部位。这种联合配方与以前的策略相反,该策略通过先检测人员并随后估算其身体姿势来解决该问题 ...
0 0 0 2025/03/04 arXiv:1511.06645v2 gaoming1
神经ODE与复发性神经网络(RNN)(如Gru-ode-bayes或Ode-RNN)的组合非常适合模拟不规则观察到的时间序列。尽管这些模型的表现优于现有的离散时间方法,但没有理论保证其预测能力。假设不规则采样的时间序列数据源自连续的随机过程,则$ l^2 $  - 最佳的在线预测是当前可用信息的有条件期望 ...
0 0 0 2025/03/04 arXiv:2006.04727v4 tuxiaolv
时间序列分析见证了从传统自动回归模型,深度学习模型到最近的变形金刚和大型语言模型(LLMS)的鼓舞人心的发展。在利用时间序列分析的视觉模型方面的努力也是在此过程中进行的,但由于该领域中的序列建模的主要研究,社区对社区的看法较低。但是,连续时间序列与LLM的离散 Token 空间之间的差异,以及在多元时间序列中明确建模变量相关性的挑战将一些研究的关注转移到了同样成功的大型视觉模型(LVM)和视觉语言 ...
0 0 0 2025/03/04 arXiv:2502.08869v1 skylor
最近,文本引导的可伸缩矢量图形(SVG)合成在诸如肖像和素描等领域中具有显着潜力。但是,从现有的文本到SVG方法产生的SVG通常缺乏可视化质量和多样性方面的编辑性和表现出缺陷。在本文中,我们提出了一种新型的文本引导矢量图形合成方法来解决这些局限性 ...
0 0 0 2025/03/04 arXiv:2411.17832v2 suxuefeng
随着语言模型支持越来越大的上下文大小,评估其有效利用该环境的能力变得越来越重要。我们分析了多个代码生成模型使用多个多步密钥检索任务在上下文Windows中最多为8K Token 的多个多步密钥检索任务处理远程依赖的能力。这些任务逐渐增加了难度,并且比流行的海景测试等测试更加细微地评估模型功能 ...
0 0 0 2025/03/04 arXiv:2407.21049v1 15966829631
研究表明,在网络规模数据上预先训练的基础模型能够以任务规划的形式封装有利于机器人操作的广泛世界知识。然而,这些计划的实际物理实施通常依赖于特定于任务的学习方法,这需要大量的数据收集并且难以推广。在这项工作中,我们介绍了通过零件空间约束进行机器人操纵( ...
0 0 0 2025/03/04 arXiv:2403.08248v1 yangmasheng
神经普通微分方程是建模时间动力学的有吸引力的选择。但是,一个基本问题是,对普通微分方程的解决方案是由其初始条件决定的,并且没有基于后续观察结果调整轨迹的机制。在这里,我们演示了如何通过\ emph {受控微分方程}的数学理解的数学来解决 ...
0 0 0 2025/03/04 arXiv:2005.08926v2 tuxiaolv

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)