记忆是所有人类活动的基础;没有记忆,人们几乎不可能在日常生活中执行任何任务。随着大型语言模型(LLM)的发展,其语言能力变得越来越与人类的能力相提并论。但是LLM有记忆吗?根据当前的性能,LLMS确实表现出记忆 ...
视频大语言模型(视频LLM)最近在一般视频理解中表现出了显着的功能。但是,他们主要关注整体理解,并努力捕获细粒度的空间和时间细节。此外,缺乏高质量的对象级视频指令数据和全面的基准进一步阻碍了他们的进步 ...
无监督的多重图形学习(UMGL)旨在学习各种边缘类型的节点表示,而无需手动标记。但是,现有研究忽略了一个关键因素:图形结构的可靠性。现实世界中的数据通常表现出复杂的性质,并包含大量的任务 - 无关紧要的噪声,严重损害了UMGL的性能 ...
由Ailon和Chazelle(Sicomp'09)转换的开创性Johnson-Lindenstrauss(Fast JL)将一组$ n $嵌入$ d $ d $二维的Euclidean Space中的空间中的$ k = o(\ varepsilon^{-2}} \ varepsilon)$。快速JL变换支持计算$ O(d \ ln d +k \ ln^2 n)$时间的数据点的嵌入,其中$ d \ ...
生成对抗方法在根据特定样式或视觉领域制作图像中的有效性最近打开了新的方向来解决无监督的域适应问题。已经表明,可以将标记为图像的源图像进行修改以模拟目标样本,即使原始缺乏带注释的数据,也可以直接训练目标域中的分类器。还已经评估了从目标到源域的逆映射,但仅通过适应的特征空间,因此没有新的图像生成 ...
我们提出了Moe-Loco,这是用于腿部机器人的多任务运动的专家(MOE)框架的混合物。我们的方法使一项政策能够处理各种地形,包括酒吧,坑,楼梯,斜坡和挡板,同时支持四足和双足步态。使用MOE,我们减轻了多任务增强学习中通常出现的梯度冲突,从而提高了训练效率和性能 ...
对于语义图像分割的域适应性非常必要,因为用像素级标签手动标记大型数据集很昂贵且耗时。现有的域适应技术可以在有限的数据集上起作用,或者与监督学习相比产生的性能不佳。在本文中,我们提出了一个新型的双向学习框架,用于分割的领域适应 ...
这项工作提出了完全集成的基于树的组合探索计划算法:Exploration-RRT(errt)。该算法的重点是在完全未知和非结构化的环境中为本地探索提供实时解决方案,同时直接将探索性行为,机器人安全路径计划和机器人驱动纳入中心问题。 ERRT提供了一个完整的抽样和基于树的解决方案,用于通过考虑最大化信息增益和最小化行驶距离和沿路径的机器人驱动之间的权衡,以评估“下一步” ...