随着 LLM 参数的扩展,微调整个模型的计算成本变得令人望而却步。为了应对这一挑战,我们引入了 PEFT 方法、主奇异值和奇异向量自适应(PiSSA),它可以优化显着减小的参数空间,同时实现或超越全参数微调的性能。 PiSSA 受到 Intrinsic SAID 的启发,它表明预先训练的、过度参数化的模型存在于低内在维度的空间中 ...
我们介绍了一种新颖的3D样式传输技术StyleGaussian,可以将任何图像的样式即时转移到3D场景中,每秒10帧(FPS)。利用3D高斯脱落(3DGS),StyleGaussian实现了样式转移,而不会损害其实时渲染能力和多视图一致性。它通过三个步骤实现即时风格的转移:嵌入,转移和解码 ...
3D 内容创建的最新进展主要利用通过分数蒸馏采样 (SDS) 进行基于优化的 3D 生成。尽管已经展现出有希望的结果,但这些方法常常受到每个样本优化缓慢的影响,限制了它们的实际使用。在本文中,我们提出了 DreamGaussian,一种新颖的 3D 内容生成框架,可以同时实现效率和质量 ...
管道并行性(PP)被广泛用于训练大语言模型(LLMS),但随着飞行内微匹配的数量随着PP的程度而增长,其可伸缩性通常受到高激活记忆消耗的限制。在本文中,我们专注于通过利用PP中的不足的内存卸载策略来应对这一挑战。通过实证研究,我们发现,在大多数标准配置中,至少一半,可能是所有激活都可以用可忽略的开销来卸载 ...
在3D引用表达分割(3D-RES)中,较早的方法采用了两个阶段的范式,提取分割建议,然后将它们与参考表达式匹配。但是,这种常规的范式遇到了重大挑战,最值得注意的是,初始提案的产生和推理速度的明显减速。认识到这些局限性,我们引入了创新的端到端超级文本匹配网络(3D-STMN),该网络(3D-STMN)丰富了依赖性驱动的见解 ...
在本文中,我们通过引入ART3D(将扩散模型和3D高斯分裂技术结合在一起的新型框架来探讨3D艺术场景生成中的现有挑战。我们的方法通过创新的图像语义传递算法有效地弥合了艺术和现实图像之间的差距。通过利用深度信息和初始艺术图像,我们生成了一个点云图,从而解决了域差异 ...
信息盗窃攻击对大型语言模型(LLM)工具学习系统构成了重大风险。对手可以通过受损的工具来注入恶意命令,操纵LLMS将敏感信息发送给这些工具,从而导致潜在的隐私漏洞。但是,现有的攻击方法是面向黑框的,并且依赖无法灵活地适应用户查询更改和工具调用链的静态命令 ...
生成建模的最新进步,尤其是扩散模型,为时间序列建模开辟了新的方向,在预测和合成中实现了最新的性能。但是,由于数据和先验分布的差异很大,因此基于扩散的模型对简单,固定的先验过程的依赖使生成过程变得复杂。我们介绍了TSFLOW,这是时间序列的条件流量匹配(CFM)模型,该模型通过结合高斯过程,最佳传输路径和数据依赖于数据的先验分布来简化生成问题 ...