随着预训练模型的不断增长,用于各种下游任务的所有参数的完整微调和存储都是昂贵且不可行的。在本文中,我们提出了一种新的参数有效的微调方法,即基于梯度的参数选择(GPS),表明只有从预训练的模型中调整一些选定的参数,同时保持其余模型冻结的剩余模型可以与完整的模型微调方法相比,可以产生相似或更好的性能。与现有的流行和最先进的参数有效的微调方法不同,我们的方法在培训和推理阶段期间都不会引入任何其他参数和计 ...
代码的等效表示(ers)是文本表示,可以保留与代码本身相同的语义,例如自然语言注释和伪代码 ...
我们提出了GS-IR,这是一种基于3D高斯脱落(GS)的新型逆渲染方法,该方法利用前向映射体积渲染以实现逼真的新型视图综合和重新确定结果。与以前使用隐式神经表示和音量渲染的作品不同(例如 ...
跨多个文档的核心分辨率在自然语言处理中构成了重大挑战,尤其是在知识图的领域中。这项研究介绍了一种创新方法,旨在识别和解决对出现在不同文本的相同实体的参考,从而增强了信息的连贯性和协作。我们的方法采用了动态链接机制,该机制将知识图中的实体与相应的文本提及相关联 ...
我们在动态场景中解决了3D重建的任务,其中对象运动降低了先前的3D指数回归方法的质量,例如DUST3R,最初是为静态3D场景重建而设计的。尽管这些方法在静态设置中提供了一种优雅而强大的解决方案,但它们在有动态动作的存在下挣扎,这些动态动态仅基于相机姿势破坏对齐。为了克服这一点,我们提出了d^2ust3r,以回归4D指数,以同时以馈送方式捕获静态和动态3D场景几何形状 ...
使用大型语言模型(LLMS)提供动力的代理商的社会,在解决问题的自动化问题中取得了重大进展。在金融中,努力主要集中在单独的系统上处理特定任务或独立收集数据的多代理框架。但是,多代理系统复制现实世界贸易公司的协作动态的潜力仍然没有得到充实 ...
traganything,它利用实体表示来实现对可控视频生成中任何对象的运动控制。与现有的运动控制方法相比,draganything,在获取其他引导信号(例如,在获取其他引导信号(例如,导航信号) ...
在本文中,我们通过解决了几个开放问题,对中文学习(ICL)进行了全面研究:(a)大型语言模型学到了哪种类型的ICL估计器? (b)ICL的适当性能指标是什么?错误率是多少? (c) Transformer 体系结构如何启用ICL?为了回答这些问题,我们采用贝叶斯观点并提出ICL作为预测与当前协变量相对应的响应的问题,鉴于从潜在变量模型中绘制的许多示例。为了回答(a),我们表明,在不更新神经网络参数 ...