我们提出了 SGS-SLAM,这是第一个基于高斯 Splatting 的语义视觉 SLAM 系统。它通过多通道优化融合了外观、几何和语义特征,解决了神经隐式 SLAM 系统在高质量渲染、场景理解和对象级几何方面的过度平滑限制。我们引入了一种独特的语义特征损失,有效弥补了传统深度和颜色损失在对象优化中的缺点 ...

0 0 0 0 2024/06/22 arXiv:2402.03246v5 HU12345

在本文中,我们从体现代理的角度重新思考场景重建问题:虽然经典观点侧重于重建精度,但我们的新观点强调底层功能和约束,以便重建的场景为模拟提供可操作的信息。与代理的互动。在这里,我们通过使用 RGB-D 数据流重建交互式场景来解决这个具有挑战性的问题,该场景通过 3D 体积全景映射模块捕获 (i) 对象和布局的语义和几何形状,以及 (ii) 通过以下方式捕获对象可供性和上下文关系:通过基于图形的场景表示来组织对象之间的物理常识推理。至关重要的是,这个重建的场景用基于零件的铰接式 CAD 模型取代了密集全景地图中的对象网格,以实现更细粒度的机器人交互 ...

0 0 0 0 2024/06/20 arXiv:2103.16095v1 HU12345

视觉地点识别和视觉定位是自动驾驶车辆导航和地图绘制的重要组成部分,尤其是在 GNSS 无法导航的场景中。最近的工作重点是地面或接近地面的应用,例如自动驾驶汽车或室内场景以及低空无人机飞行。然而,城市空中交通等应用需要在中高海拔的大面积户外环境中运行 ...

0 0 0 0 2024/06/11 arXiv:2205.11567v1 HU12345

我们提出了一种局部图像特征匹配的新方法。我们建议首先在粗略水平上建立像素级密集匹配,然后在精细水平上细化良好的匹配,而不是依次执行图像特征检测、描述和匹配。与使用成本量来搜索对应关系的密集方法相比,我们在 Transformer 中使用自注意力层和交叉注意力层来获取以两张图像为条件的特征描述符 ...

0 0 0 0 2024/05/29 arXiv:2104.00680v1 HU12345

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)