单帧红外小目标(SIRST)检测旨在将小目标与混乱背景区分开。随着深度学习的进步,基于CNN的方法由于其强大的建模能力而在通用对象检测中产生了有希望的结果。但是,现有的基于CNN的方法不能直接用于红外小目标,因为其网络中的汇总层可能会导致深层中的目标损失 ...
我们提出了Megascale-Moe,这是一种量身定制的生产系统,该系统量其有效训练大型Experts(MOE)型号。 MUE成为一种有前途的体系结构,可扩展大型语言模型(LLM)到前所未有的大小,从而增强模型性能。但是,现有的MOE培训系统经历了培训效率的退化,这会因MOE模型的不断升级和硬件的持续发展而加剧 ...
与许多在奖励函数的传统控制方法相比,加强学习(RL)已被广泛应用于许多控制任务,并显着改善了性能。但是,对于许多现实世界中的问题,同时根据奖励和约束来提出优化问题通常更方便。通过奖励成型来优化这种受限的问题可能很困难,因为它需要用几个相互作用的术语对奖励功能进行乏味的手动调整 ...
检索增强生成 (RAG) 通过在测试时结合外部知识来改进预训练模型,以实现定制适应。我们研究上下文检索 RAG 语言模型 (LM) 中数据存储泄漏的风险。我们表明,对手可以利用 LM 的指令跟踪功能,通过提示注入轻松地从使用指令调整 LM 构建的 RAG 系统的数据存储中逐字提取文本数据 ...
我们建议通过以下见解提高3D对象检测的准确性。室外3D场景感知中的雷达相机融合是由图像到bev转换限制的 - 如果无法准确估计像素的深度,那么BEV特征的天真组合实际上会集成了不一致的视觉内容。为了避免此问题,我们提出了一个基于查询的框架,该框架可以从Bird's-eye View(BEV)和原始图像视图中自适应对实例型功能进行自适应采样 ...
随机人类运动预测(HMP)通常已经通过生成的对抗网络和变异自动编码器来解决。大多数先前的作品旨在根据骨架关节的分散来预测高度多样化的运动。这导致了预测快速和运动发散运动的方法,这些运动通常与过去的运动不切实际且不连贯 ...
我们提出了运动脱机器,一种基于扩散的表示,用于在多个智能体上联合分布未来轨迹。这种表示有几个关键优势:首先,我们的模型学习高度多模态分布,可以捕获不同的未来结果。其次 ...
基于小组的增强学习(RL)的最新进展已在数学推理等单转任务中驱动了前沿模型(LLMS)。但是,它们对长跑LLM代理训练的可伸缩性仍然有限。与静态任务不同,代理环境的互动在许多步骤中展开,并且通常会产生稀疏或延迟的奖励,从而使各个步骤的信贷分配变得更加具有挑战性 ...