随着大型语言模型,视觉模型和其他一般基础模型的最新兴起,多模式,多任务机器人技术的潜力越来越大,可以在自然语言输入的情况下在不同的环境中运行。一种这样的应用程序是使用自然语言说明的室内导航。但是,尽管最近进展了,但由于需要3D空间推理和语义理解,因此这个问题仍然具有挑战性 ...
0 0 0 2025/03/25 arXiv:2503.17406v1 蔡明方
现有的3D人姿势估计(HPE)方法具有很高的精度,但计算开销和缓慢的推理却遭受了较高的损失,而知识蒸馏方法无法解决关节和时间相关性之间的空间关系。在本文中,我们提出了稀疏的相关性和关节蒸馏(SCJD),这是一个新颖的框架,可以平衡3D HPE的效率和准确性。 SCJD引入了稀疏的相关输入序列下采样,以减少学生网络输入中的冗余,同时保留框架间的相关性 ...
0 0 0 2025/03/25 arXiv:2503.14097v1 zxiang7996
最大的内部产品搜索(MIPS)是机器学习应用程序(例如推荐系统)中无处不在的任务。鉴于查询矢量和$ n $ datom vectors在$ d $维空间中,MIP的目标是找到具有查询矢量最高内部产品的原子。现有的MIPS算法量表至少为$ O(\ sqrt {d})$,在高维设置中在计算上变得过于敏感 ...
0 0 0 2025/03/25 arXiv:2212.07551v3 Daenerays
相机和激光雷达是准确,强大的自动驾驶系统的信息传感器。但是,这些传感器经常表现出异质性本性,从而产生分布方式差距,从而面临着融合的重大挑战。为了解决这个问题,强大的融合技术至关重要,特别是对于增强3D对象检测的问题 ...
0 0 0 2025/03/25 arXiv:2407.15334v1 hannahshyshy
高能核碰撞产生夸克和胶子的非平衡等离子体,这些等离子体可热化和表现出流体动力流动。目前尚无可用的框架,可以将经典场模拟中的早期颗粒产生与随后的流体动力学进化联系起来。我们使用在QCD动力学理论中计算出的非平衡绿色功能构建这样的框架,以传播到水动力相的初始能量量张量 ...
0 0 0 2025/03/25 arXiv:1805.01604v3 kahsisjdhdkd
我们提出了一个模棱两可的神经网络,用于分别预测分子和周期晶体的振动和声子模式。这些预测是通过评估经过能量和力数据训练的学习能量模型的第二个衍生性Hessian矩阵。使用这种方法,我们能够有效预测无机晶体材料的声子分散和状态的密度 ...
0 0 0 2025/03/25 arXiv:2403.11347v1 ZeHeru
最近,语言模型(LMS)在代码生成任务中表现出令人印象深刻的熟练程度,尤其是在特定于代码的数据集(通常称为代码LMS)上进行微调时。但是,我们对代码LMS内部决策过程的理解,例如它们如何使用其(句法或语义)知识的方式仍然有限,这可能会导致意想不到的伤害,因为它们在现实生活中越来越多地使用。这促使我们在Codellama-7b模型上进行了第一个机械性解释性作用之一,以了解代码LMS如何执行句法完成任 ...
0 0 0 2025/03/24 arXiv:2502.18499v1 muzhi
几十年来,小型对象检测(SOD)一直是一项长期但艰巨的任务,开发了许多数据集和算法。但是,它们主要集中在可见或热模态上,而可见的热(RGBT)双峰很少探索。尽管最近已经开发了一些RGBT数据集,但是数量不足,有限类别,未对准图像和较大的目标大小不能提供公正的基准测试,以评估多类可见的可见性小对象检测(RGBT SOD)算法 ...
0 0 0 2025/03/24 arXiv:2406.14482v2 dddd

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)