大型语言模型(LLM)在各种复杂的任务中表现出了显着的功能,但它们仍然遭受幻觉的困扰。引入外部知识(例如知识图)可以增强LLM提供事实答案的能力。 LLM具有交互式探索知识图的能力 ...
0 0 0 2025/04/22 arXiv:2502.12029v2 jwj5452365
能够在没有监督的情况下学习图像的密集语义表示是计算机视觉中的一个重要问题。然而,尽管它具有重要意义,但此问题仍然没有探索,其中有一些例外,这些例外考虑了狭窄的视觉域的小规模数据集上的无监督语义分割。在本文中,我们首次尝试解决传统上用于监督案件的数据集上的问题 ...
0 0 0 2025/04/22 arXiv:2102.06191v3 一支王同学
随着 LLM 参数的扩展,微调整个模型的计算成本变得令人望而却步。为了应对这一挑战,我们引入了 PEFT 方法、主奇异值和奇异向量自适应(PiSSA),它可以优化显着减小的参数空间,同时实现或超越全参数微调的性能。 PiSSA 受到 Intrinsic SAID 的启发,它表明预先训练的、过度参数化的模型存在于低内在维度的空间中 ...
0 0 0 2025/04/22 arXiv:2404.02948v4 szfmsmdx
我们介绍了一种新颖的3D样式传输技术StyleGaussian,可以将任何图像的样式即时转移到3D场景中,每秒10帧(FPS)。利用3D高斯脱落(3DGS),StyleGaussian实现了样式转移,而不会损害其实时渲染能力和多视图一致性。它通过三个步骤实现即时风格的转移:嵌入,转移和解码 ...
0 0 0 2025/04/22 arXiv:2403.07807v1 pip-install
3D 内容创建的最新进展主要利用通过分数蒸馏采样 (SDS) 进行基于优化的 3D 生成。尽管已经展现出有希望的结果,但这些方法常常受到每个样本优化缓慢的影响,限制了它们的实际使用。在本文中,我们提出了 DreamGaussian,一种新颖的 3D 内容生成框架,可以同时实现效率和质量 ...
0 0 0 2025/04/22 arXiv:2309.16653v2 pip-install
管道并行性(PP)被广泛用于训练大语言模型(LLMS),但随着飞行内微匹配的数量随着PP的程度而增长,其可伸缩性通常受到高激活记忆消耗的限制。在本文中,我们专注于通过利用PP中的不足的内存卸载策略来应对这一挑战。通过实证研究,我们发现,在大多数标准配置中,至少一半,可能是所有激活都可以用可忽略的开销来卸载 ...
0 0 0 2025/04/22 arXiv:2503.01328v1 白日衣衫尽
在3D引用表达分割(3D-RES)中,较早的方法采用了两个阶段的范式,提取分割建议,然后将它们与参考表达式匹配。但是,这种常规的范式遇到了重大挑战,最值得注意的是,初始提案的产生和推理速度的明显减速。认识到这些局限性,我们引入了创新的端到端超级文本匹配网络(3D-STMN),该网络(3D-STMN)丰富了依赖性驱动的见解 ...
0 0 0 2025/04/22 arXiv:2308.16632v1 Archer
在本文中,我们通过引入ART3D(将扩散模型和3D高斯分裂技术结合在一起的新型框架来探讨3D艺术场景生成中的现有挑战。我们的方法通过创新的图像语义传递算法有效地弥合了艺术和现实图像之间的差距。通过利用深度信息和初始艺术图像,我们生成了一个点云图,从而解决了域差异 ...
0 0 0 2025/04/22 arXiv:2405.10508v1 pip-install

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)