随着深度神经网络、预训练语言模型 (PLM) 和最近的大型语言模型 (LLM) 的出现,文本摘要研究经历了几次重大转变。因此,本次调查通过这些范式转变的视角,对文本摘要的研究进展和演变进行了全面的回顾。它分为两个主要部分:(1) LLM 时代之前的数据集、评估指标和汇总方法的详细概述,涵盖传统统计方法、深度学习方法和 PLM 微调技术,以及 (2) 第一个部分详细检查 LLM 时代在基准测试、建模和评估总结方面的最新进展 ...
从卫星图像中了解复杂地球表面的各向异性反射率对于许多应用至关重要。神经辐射场(NeRF)作为一种能够从多个图像推导出场景的双向反射分布函数(BRDF)的机器学习技术已经变得流行。然而,之前的研究主要集中在将 NeRF 应用于近距离图像,估计基本的 Microfacet BRDF 模型,这对于许多地球表面来说是不够的 ...
在这项工作中,我们提出了一种学习 2D 图像和 3D 点云匹配的局部跨域描述符的新方法。我们提出的方法是一个双自动编码器神经网络,它将 2D 和 3D 输入映射到共享的潜在空间表示中。我们表明,共享嵌入中的此类局部跨域描述符比从 2D 和 3D 域中的单独训练中获得的描述符更具辨别力 ...
3D 高斯分布 (3DGS) 已成为一种很有前途的 3D 场景表示方法,与神经辐射场 (NeRF) 相比,它可以减少计算开销。然而,3DGS 容易受到高频伪影的影响,并且在稀疏视点条件下表现出次优性能,从而限制了其在机器人和计算机视觉中的适用性。为了解决这些限制,我们引入了 SVS-GS,这是一种用于稀疏视点场景重建的新颖框架,它集成了 3D 高斯平滑滤波器来抑制伪影 ...
从一组稀疏的输入图像合成新颖的视图是一个具有很大实际意义的挑战性问题,特别是当相机姿势不存在或不准确时。由于位姿和深度之间的耦合以及单目深度估计的不准确性,在神经辐射场算法中直接优化相机位姿和使用估计深度通常不会产生良好的结果。在本文中,我们利用最新的 3D 高斯分布方法开发了一种新颖的构造和优化方法,用于无需相机姿态的稀疏视图合成 ...
在没有预先计算相机姿势的情况下训练神经辐射场 (NeRF) 具有挑战性。这个方向的最新进展证明了在前向场景中联合优化 NeRF 和相机姿势的可能性。然而,这些方法在摄像机剧烈移动时仍然面临困难 ...
由于 Shadow NeRF 和 Sat-NeRF,可以在基于 NeRF 的框架中考虑太阳角,以便使用卫星图像进行训练,从新的视角渲染场景。我们的工作扩展了这些贡献,并展示了如何使效果图适合特定季节。我们的主要挑战是创建一个神经辐射场 (NeRF),它可以独立于视角和太阳角渲染季节特征,同时仍然能够渲染阴影 ...
最近大量研究表明,多视图立体(MVS)匹配可以通过深度学习方法来解决。然而,这些努力都集中在近距离物体上,并且由于缺乏多视点航空图像基准,只有极少数基于深度学习的方法是专门为大规模3D城市重建而设计的。在本文中,我们提出了一个合成航空数据集,称为 WHU 数据集,是我们为 MVS 任务创建的,据我们所知,这是第一个大规模多视图航空数据集 ...
我们提出了一种端到端深度学习架构,用于从多视图图像进行深度图推理。在网络中,我们首先提取深度视觉图像特征,然后通过可微单应性扭曲在参考相机平截头体上构建 3D 成本体积。接下来,我们应用 3D 卷积对初始深度图进行正则化和回归,然后使用参考图像进行细化以生成最终输出 ...
我们提出了 Surf-NeRF,这是最近引入的阴影神经辐射场 (S-NeRF) 模型的修改实现。该方法能够从场景的一组稀疏卫星图像中合成新颖的视图,同时考虑到图片中存在的照明变化。经过训练的模型还可用于准确估计场景的表面高程,这通常是卫星观测应用所需的量 ...