3D高斯裂口已成为新型视图合成的替代3D表示,从其高质量的渲染结果和实时渲染速度中受益。但是,3D-GS学到的3D高斯人具有模棱两可的结构,没有任何几何约束。在分割各个对象时,3D-GS中的固有问题会导致一个粗糙的边界 ...
0 0 0 2025/05/02 arXiv:2401.17857v4 JackWang
近年来,3D 场景表示非常受欢迎。使用神经辐射场的方法对于新颖视图合成等传统任务是通用的。最近,出现了一些工作,旨在将 NeRF 的功能扩展到视图合成之外,用于语义感知任务,例如使用 2D 基础模型的 3D 特征场蒸馏进行编辑和分割 ...
0 0 0 2025/05/02 arXiv:2312.03203v3 JackWang
高斯的碎片通过实时实现高渲染性能彻底改变了新观点综合的世界。最近,研究重点是通过使用语义信息来丰富这些3D表示,以进行下游任务。在本文中,我们介绍了RT-GS2,这是使用高斯分裂的第一种可推广的语义分割方法 ...
0 0 0 2025/05/02 arXiv:2405.18033v2 JackWang
随机算法为两个无处不在的问题提供了解决方案:(1)主成分分析或高度矩形矩阵的单数值分布分布式计算,以及(2)低级别近似值的分布式计算(以单次值分解的形式)到任意矩阵中。精心磨练的算法产生的结果均优于Spark(流行的分布式计算平台)中的确定性实现的结果;特别是,虽然库存软件将不用警告返回左左单数矢量,而远离数字正常的矢量,但抛光的随机实现产生了左单数矢量,这些向量几乎与机器精度是正直的 ...
0 0 0 2025/05/02 arXiv:1612.08709v4 FOUR_A
基于视频的多模式大语言模型(VMLLM)在跨模式视频理解中表现出了巨大的潜力。但是,他们在细粒度理解中的能力在很大程度上仍然没有得到充实。鉴于其在以人为中心的情报中的关键作用,开发用于面部理解的VMLLS是一个基本问题 ...
0 0 0 2025/05/02 arXiv:2503.09158v2 cwd
训练最先进的深度神经网络的计算成本很高。减少训练时间的一种方法是使神经元的活动正常化。最近引入的一种称为批量归一化的技术,使用小批量训练案例中神经元的输入总和的分布来计算均值和方差,然后使用它们对每个训练案例上该神经元的输入总和进行归一化... ...
0 0 0 2025/05/02 arXiv:1607.06450v1 xx
我们介绍全对多场变换(AMT),这是一种用于视频框架插值的新网络体系结构。它基于两个基本设计。首先,我们为所有像素对构建双向相关量,并使用预测的双边流来检索相关性,以更新流量和插值内容 ...
0 0 0 2025/05/02 arXiv:2304.09790v1 Zhiyu_Yin
分布式人工智能生成的内容(AIGC)引起了极大的关注,但仍有两个关键挑战:最大化主观的经验质量(QOE)和提高能源效率,这在广泛采用的基于的生成扩散模型(GDM)的图像生成服务中特别明显。在本文中,我们提出了一种新型的以用户为中心的交互式AI(IAI)用于服务管理的方法,该方法具有分布式的基于GDM的AIGC框架,该框架强调了高效且合作的部署。所提出的方法通过允许具有语义上相似提示的用户共享Den ...
0 0 0 2025/05/02 arXiv:2311.11094v2 HaoLiu0209

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)