神经网络修剪和量化技术几乎与神经网络本身一样古老。但是,迄今为止仅发布了两者之间的临时比较。在本文中,我们着手回答哪个更好的问题:神经网络量化或修剪?通过回答这个问题,我们希望为未来的神经网络硬件做出的设计决策提供信息 ...
大型黑盒模型在众多应用中已变得无处不在。了解单个培训数据源对这些模型预测的影响对于提高其可信度至关重要。当前的影响估计技术涉及每个训练点的计算梯度或对不同子集的重复培训 ...
扩散模型学会了预测梯度的向量场。我们建议将链条规则应用于学习的梯度,并通过可区分渲染器的Jacobian将扩散模型的得分进行后传达,我们将其实例化为Voxel辐射场。该设置在多个摄像机视图上汇总2D分数为3D分数,并重新利用了3D数据生成的据预定的2D模型 ...
最近,大型语言模型(LLM)在上下文学习(ICL)的帮助下展示了处理新任务的令人印象深刻的能力。在大视觉语言模型(LVLM)的研究中,在实现 ICL 时,研究人员通常采用简单的策略,例如跨不同样本的固定演示,或直接通过视觉语言嵌入模型选择演示。这些方法不能保证配置的演示符合 LVLM 的需要 ...