我们提出了运动脱机器,一种基于扩散的表示,用于在多个智能体上联合分布未来轨迹。这种表示有几个关键优势:首先,我们的模型学习高度多模态分布,可以捕获不同的未来结果。其次 ...
基于小组的增强学习(RL)的最新进展已在数学推理等单转任务中驱动了前沿模型(LLMS)。但是,它们对长跑LLM代理训练的可伸缩性仍然有限。与静态任务不同,代理环境的互动在许多步骤中展开,并且通常会产生稀疏或延迟的奖励,从而使各个步骤的信贷分配变得更加具有挑战性 ...
红外传感是支持无人系统的核心方法,例如自动驾驶汽车和无人机。最近,红外传感器已被广泛部署在移动和固定平台上,以从长距离和视图广泛的视野中检测和分类。鉴于其在视觉图像分析域中的成功,还将深度学习应用于红外图像中的对象识别 ...
最近,llm,finllm)。然而,当问题中涉及数字变量时,现有的finllm在理解金融文本方面的表现并不令人满意。在本文中 ...
secsec数据上的meta-llama-3-70b-inStruct模型的域适应进行了广泛的实验 ...
我们研究了化学反应网络的响应,从均衡对反应速率的对数扰动驱动。观察到化学物种的平均数量的响应被观察到数量波动以及最大热力学驱动力的定量限制。我们证明了线性化学反应网络和一类具有单一化学物种的非线性化学反应网络的权衡 ...
裂纹分割可以通过准确识别裂纹尺寸和位置来在结构健康监测(SHM)中起关键作用,从而可以随着时间的推移监视结构损害。但是,由于记忆力有限,计算能力和能源资源有限,针对资源受限的微控制器的开裂分割进行了深入学习模型。为了应对这些挑战,这项研究探讨了针对Tinyml应用程序量身定制的轻质U-NET体系结构,重点介绍了三种优化策略:滤波器数减少,网络深度降低以及使用深度可分开的卷积(DWCONV2D) . ...
通过自然语言与人相互作用的机器人可以解锁众多应用,例如引用Grasp合成(RGS)。给定文本查询,RGS确定了稳定的抓握姿势,以操纵机器人工作区中的引用对象。 RGS包括两个步骤:视觉接地和掌握姿势估计 ...