大型语言模型(LLMS)纳入机器人任务计划中,为复杂的长途工作流程解锁了更好的推理能力。但是,确保LLM驱动计划的安全仍然是一个关键的挑战,因为这些模型通常优先考虑任务完成而不是降低风险。本文介绍了更安全的(在机器人技术中执行安全性框架),该框架旨在将安全意识嵌入机器人任务计划中 ...
0 0 0 2025/06/23 arXiv:2503.15707v1 18601752667
大型语言模型(LLM)的最新进展已在结构化任务和编程等结构化任务中展示了令人印象深刻的推理能力,这在很大程度上是由可验证的奖励(RLVR)驱动的,该奖励(RLVR)使用了基于结果的信号,这些信号可扩展,有效,有效且可靠地反对奖励黑客。但是,由于缺乏通用,可验证的奖励信号,将类似的技术应用于开放式的长期推理任务仍然具有挑战性。为了解决这个问题,我们提出了直接推理优化(DRO),这是在开放式奖励信号的 ...
0 0 0 2025/06/23 arXiv:2506.13351v1 瓶子
多模式大语言模型(MLLM)的成功主要归因于大规模培训数据。但是,由于隐私问题,许多MLLM的培训数据无法使用。收集多模式数据的昂贵且劳动密集型的过程进一步加剧了问题 ...
0 0 0 2025/06/23 arXiv:2503.08741v3 crazy
我们使用3D高斯分裂(3D-GS)方法来应对零件级别的并发重建的挑战。通过两组不同的多视图图像,每个图像都在单独的静态关节构型中描绘一个对象,我们将在3D高斯表示中重建具有外观和几何信息的3D高斯表示对象。我们的方法通过多步优化过程将多个高度相互依存的参数解开,从而实现了稳定的优化过程和高质量的结果 ...
0 0 0 2025/06/23 arXiv:2503.08135v1 陆三七
重建在日常环境中普遍存在的铰接物体对于在增强/虚拟现实和机器人技术中的应用至关重要。但是,现有方法面临可伸缩性的限制(需要3D监督或昂贵的注释),鲁棒性问题(容易受到本地Optima的影响)以及呈现缺点(缺乏速度或摄影主义)。我们介绍了一个自我审议的类别 - 不可思议的框架,该框架利用3D高斯分裂(3DGS)重建了铰接式对象,并从两组在不同的铰接状态下捕获的构图的RGB图像中推断运动学对象,从而实 ...
0 0 0 2025/06/23 arXiv:2506.03594v1 陆三七
在大规模数据集中训练的诸如大语言模型(LLM)和多模式大语言模型(MLLM)之类的生成模型可能会导致他们记住并无意间揭示敏感信息,从而引发道德和隐私问题。尽管一些先前的作品在LLM的背景下探讨了这个问题,但由于跨模式的知识的纠缠性,它给MLLM带来了独特的挑战,这使得全面学习更加困难。为了应对这一挑战,我们提出了模态意识到神经元学习(MANU),这是一个新颖的MLLMS框架,旨在根据其对目标忘记数 ...
0 0 0 2025/06/23 arXiv:2502.15910v2 wuyi
视觉模型(VLM)的快速发展及其整合到具体的代理中,已解锁了强大的决策能力。但是,随着这些系统越来越多地部署在现实世界中,它们面临着越来越多的安全问题,尤其是在响应危险说明时。在这项工作中,我们提出了代理ActentsAfe,这是在危险说明下评估体现VLM代理的安全性的第一个综合基准 ...
0 0 0 2025/06/23 arXiv:2506.14697v1 18601752667
在这项工作中,我们提出了一种用于3D高斯脱落的新颖详细方法(LOD)方法,该方法可以实时渲染内存约束的设备上的大型场景。我们的方法引入了层次结构的LOD表示,迭代地基于相机距离选择高斯人的最佳子集,从而在很大程度上减少了渲染时间和GPU存储器的使用情况。我们通过应用深度感知的3D平滑过滤器来构建每个LOD级别,然后进行基于重要性的修剪和微调以保持视觉保真度 ...
0 0 0 2025/06/23 arXiv:2505.23158v1 18855807556

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)