解决缺失的模式和有限的标记数据对于推进稳健的多模式学习至关重要。我们提出了 Robult,这是一个可扩展的框架,旨在通过保留特定于模态的信息并通过新颖的信息论方法利用冗余来缓解这些挑战。 Robot 优化了两个核心目标:(1) 软正未标记 (PU) 对比损失,可最大限度地提高与任务相关的特征对齐,同时在半监督设置中有效利用有限的标记数据;(2) 潜在重建损失,可确保保留独特的模态特定信息 ...

0 0 0 0 2025/10/26 arXiv:2509.03477v1 zy_

基于大语言模型(LLM)的自动语音识别(ASR)由于其高识别精度和增强的多方言支持而最近引起了广泛关注。然而,LLM 的高解码延迟对实时 ASR 要求提出了挑战。尽管人们已经探索了推测解码来提高解码效率,但它们通常忽略了 ASR 任务的关键特征,并且实现的加速有限 ...

0 0 0 0 2025/10/26 arXiv:2507.18181v2 18811558339

能源需求的增长凸显了适当的地下储存的重要性,需要详细而准确的地下特征描述,而这些特征通常依赖于高质量的钻孔测井数据。然而,获得完整的测井数据既昂贵又耗时,并且由于井眼条件或工具错误而导致数据丢失的情况很常见。虽然机器学习和深度学习算法已经被用来解决这些问题,但它们通常无法捕获复杂测井序列中错综复杂的非线性关系和长期依赖性 ...

0 0 1 1 2025/10/26 arXiv:2412.05681v1 wang3076

为黑洞形成和蒸发的经典模型绘制了明确计算的彭罗斯图,其中黑洞是通过物质球壳的坠落而形成的,随后通过发射霍金辐射的球壳而蒸发。该模型基于已知的半经典效应,但不是半经典引力的完整解。该方法允许 $ds^2=-f(r)\,dt^2+f(r)^{-1}\,dr^2+r^2\,d\Omega^2$ 形式的任意内部度量,包括奇异和非奇异模型 ...

0 0 0 0 2025/10/26 arXiv:1907.04879v3 朝暮颜

最近,利用预先训练的视觉语言模型(VLM)来建筑视觉语言行动(VLA)模型已成为有效的机器人操纵学习的有前途的方法。但是,只有很少的方法将3D信号纳入VLMS进行动作预测,并且它们不能完全利用3D数据中固有的空间结构,从而导致样品效率较低。在本文中,我们介绍了BridgeVla,这是一种新颖的3D VLA模型,该模型(1)将3D输入投影到多个2D图像,确保输入与VLM骨架的输入对齐,(2)利用2D热图进行动作预测,统一输入和输出空间一致的2D图像空间 ...

0 0 0 0 2025/10/26 arXiv:2506.07961v2 kkkkk

实体人工智能的快速进步凸显了需要更先进、更集成的模型来感知、解释和预测环境动态。在此背景下,世界模型(WM)被引入,为实体智能体提供预测未来环境状态并填补知识空白的能力,从而增强智能体计划和执行行动的能力。然而,在处理具体代理时,确保预测对代理和环境都是安全的至关重要 ...

0 0 0 0 2025/10/25 arXiv:2510.05865v1 l770458802

机器人越来越多地用于番茄温室,以实现选择性收获和除叶等劳动密集型任务的自动化。为了执行这些任务,机器人必须能够准确有效地感知需要切割的植物节点,尽管其他植物部分的遮挡程度很高。我们将此问题表述为局部次佳视图(NBV)规划任务,其中机器人必须规划一组有效的相机视点以克服遮挡并提高感知质量 ...

0 0 0 0 2025/10/25 arXiv:2311.16759v2 zy1111

整流流模型在图像和视频生成任务中取得了显着的性能。然而,现有的数值求解器面临快速采样和高精度解决方案之间的权衡,限制了它们在重建和编辑等下游应用中的有效性。为了应对这一挑战,我们建议利用 Adams-Bashforth-Moulton (ABM) 预测校正器方法来提高修正流模型中 ODE 求解的准确性 ...

0 0 0 0 2025/10/25 arXiv:2503.16522v1 iiwdg

自注意力技术,特别是 Transformer,在文本处理领域占据主导地位,并且在计算机视觉分类任务中变得越来越流行。为了可视化导致特定分类的图像部分,现有方法要么依赖于获得的注意力图,要么采用沿着注意力图的启发式传播。在这项工作中,我们提出了一种计算 Transformer 网络相关性的新方法 ...

0 0 0 0 2025/10/25 arXiv:2012.09838v2 小小卡拉米

由于大型语言模型(LLM)在各个领域广泛应用,因此模型压缩对于降低成本和提高推论效率变得越来越重要。训练后修剪是一种有前途的方法,不需要资源密集型迭代培训,并且只需要少量的校准数据即可评估参数的重要性。先前的研究主要集中在设计先进的修剪方法上,而不同的校准数据对修剪性能的影响仍然缺乏系统的探索 ...

0 0 0 0 2025/10/25 arXiv:2410.17711v2 hxh123

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)