近年来,动画数据视频已广受欢迎。但是,由于创建和协调各种组件的复杂性,创作的数据视频仍然具有挑战性(例如 ...
0 0 0 2025/04/28 arXiv:2502.04801v1 chenzhuo-wang
随着信息的快速增长,推荐系统已成为提供个性化建议并克服信息超负荷的组成部分。但是,他们的实际部署经常遇到``肮脏''数据,在这些数据中,噪音或恶意信息可能会导致异常建议。因此,关于改善推荐系统对此类肮脏数据的鲁棒性的研究已引起了人们的重大关注 ...
0 0 0 2025/04/28 arXiv:2309.02057v2 xh
由于2D扩散生成模型的开发,以文本提示为条件的3D场景生成已经取得了显着发展。但是,3D场景的文字描述本质上是不准确的,并且在训练过程中缺乏细粒度的控制,从而导致场景产生不可思议。作为一个直观且可行的解决方案,3D布局允许精确地规范场景中的对象位置 ...
0 0 0 2025/04/28 arXiv:2501.02519v1 wonglliam
最近,文本引导的3D场景生成领域引起了极大的关注。与物理现实主义和高可控性保持一致的高质量一代对于实用的3D场景应用至关重要。但是,现有方法面临基本局限性:(i)难以捕获文本中描述的多个对象之间的复杂关系,(ii)无法生成物理上合理的场景布局,以及(iii)缺乏可控性和在组成场景中的可扩展性 ...
0 0 0 2025/04/28 arXiv:2502.01949v2 wonglliam
构建影像学的虚拟世界在各个领域都有应用,但是它通常要求训练有素的专业人员大量的劳动来运行常规的3D建模软件。为了使这一过程民主化,我们介绍了WorldCraft,该系统是一个系统,大型语言模型(LLM)代理利用程序生成来创建带有对象的室内和室外场景,从而使用户可以使用直觉的自然语言命令来控制单个对象属性和场景布局。在我们的框架中,协调代理人管理整个过程,并与两个专业的LLM代理合作完成场景创建:F ...
0 0 0 2025/04/28 arXiv:2502.15601v2 wonglliam
现代的机器学习模型用于场景理解,例如深度估计和对象跟踪,依赖于模仿现实世界部署场景的大型高质量数据集。为了解决数据稀缺性,我们为可扩展,高质量和可自定义的3D室内场景的合成数据生成提供了端到端系统。通过将文本对图像和多视图扩散模型与基于神经辐射场的网格融合在一起,该系统从文本提示中生成了HighFidelity 3D对象资产,并使用渲染工具将它们合并到预定的平面图中 ...
0 0 0 2025/04/28 arXiv:2504.09328v1 wonglliam
与静态知识图相比,时间知识图(TKG)可以捕获随着时间的流逝的进化和变化,更现实和笼统。但是,由于时间的概念介绍了学习规则的复杂性,因此,准确的图形推理,例如 ...
0 0 0 2025/04/28 arXiv:2402.12309v2 xuexizhanghao
我们介绍\ textit {Wonderverse},这是一个简单但有效的框架,用于生成可扩展的3D场景。与依赖迭代深度估计和图像插入的现有方法不同,通常会导致几何扭曲和不一致之处,Wonderverse利用了嵌入了视频生成基础模型中的强大的世界级别的先验,以创建高度沉浸式和几何形式和几何相一致的3D环境。此外,我们提出了一种用于可控3D场景扩展的新技术,以大大增加生成环境的规模 ...
0 0 0 2025/04/28 arXiv:2503.09160v3 wonglliam

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)