随着大型语言模型(LLM)已变得越来越多地计算和记忆密集型,参数有效的微调(PEFT)方法现在是微调LLM的常见策略。流行的PEFT方法是低级适配器(LORA),它为选定的层增添了可训练的低级“适配器”。每个适配器由低级矩阵乘积组成,乘以等级依赖性因子 ...

0 0 0 0 2025/04/18 arXiv:2312.03732v1 Ethan_Liu

在本文中,我们提出了一种简单而有效的方法来稳定极深的 Transformer 。具体而言,我们引入了一个新的归一化函数(DeepNorm),以修改 Transformer 中的残差连接,并伴随理论得出的初始化。深入的理论分析表明,模型更新可以稳定地界定 ...

0 0 0 0 2025/04/09 arXiv:2203.00555v1 Ethan_Liu

部分标签学习(PLL)是一个重要的弱监督学习问题,它允许每个培训示例具有候选标签集,而不是单个地面真相标签。已经广泛探索了基于识别的方法,以解决PLL中的标签歧义问题,这些方法将真正的标签视为要识别的潜在变量。但是,确定正确且完全具有挑战性的真实标签,在模型训练过程中导致伪标签中的噪声 ...

0 0 0 0 2025/04/05 arXiv:2303.10365v3 Ethan_Liu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)