随着预期型型号(PMS)的不断增长,对它们进行微调变得更加昂贵和渴望。作为一种补救措施,低级适配器(LORA)将模型的主要审计权重冻结,只是在模型中引入了一些可学习的截短SVD模块(所谓的Lora块)。虽然洛拉块是参数效率的,但它们遇到了两个主要问题:首先,这些块的大小是固定的,无法在训练后修改(例如,如果我们需要更改Lora块的排名,那么我们需要从Scratch重新培训它们);其次,优化其排名需要详尽的搜索和精力 ...

0 0 0 0 2025/03/13 arXiv:2210.07558v2 18636279200

尽管经过预审慎的网络的特定任务填充导致了NLP的重大经验进步,但大型网络使得填充很难在多任务,内存约束的设置中部署。我们提出DIFF修剪作为一种简单的方法,以在预处理框架内启用参数有效的转移学习。这种方法将列式调查视为学习特定于任务的DIFF向量,该向量是在预验证的参数向量上应用的,该参数向量保持固定并在不同的任务中共享 ...

0 0 0 0 2025/03/13 arXiv:2012.07463v2 18636279200

检索增强的生成(RAG)通过整合从知识库中检索的外部知识来增强大型语言模型(LLM)。但是,它的有效性在根本上受到猎犬和知识库的可靠性的限制。在实际情况下,这些组成部分的缺陷通常会导致检索嘈杂,无关紧要或误导性的反事实信息,最终破坏了抹布系统的可信度 ...

0 0 0 0 2025/02/25 arXiv:2501.18365v1 18636279200

微调是针对特定任务量身定制预训练的大语言模型的主要方法。随着模型的规模和任务的多样性的扩展,参数有效的微调方法至关重要。使用最广泛的方法家族之一是低级适应(Lora)及其变体 ...

0 0 0 0 2025/02/17 arXiv:2401.04151v1 18636279200

培训模型可以充当可以有效地在复杂环境中(例如Web浏览器)中导航和执行操作的代理商,通常由于缺乏培训数据而具有挑战性。大型语言模型(LLMS)最近证明了以零镜头或少数拍摄方式导航新颖环境的能力,纯粹由自然语言指导作为提示引导。最近的研究还表明,LLM具有通过自我完善的能力超过其基本绩效 ...

0 0 0 0 2025/02/15 arXiv:2405.20309v2 18636279200

大型语言模型包含对世界的嘈杂知识,但很难训练或微调。另一方面,认知体系结构具有出色的解释性,并且可以灵活地进行更新,但需要大量的手动工作才能实例化。在这项工作中,我们结合了两全其美的最好的:引导基于认知的模型与大型语言模型中编码的嘈杂知识 ...

0 0 0 0 2025/02/11 arXiv:2403.00810v1 18636279200

监督的微调(SFT)通常用于训练语言模型,以模仿给定指令的带注释的响应。在本文中,我们挑战了这个范式,并提出了批评微调(CFT),该策略学会学会批评噪音响应,而不是简单地模仿正确的响应。受到强调批判性思维的人类学习过程的启发,CFT鼓励了更深入的分析和经常被标准SFT忽略的细微理解特征 ...

0 1 0 0 2025/02/09 arXiv:2501.17703v3 18636279200

现有的大型语言模型很难支持多种低资源语言,特别是资源极低的语言,因为这些语言可用于有效参数更新的训练数据很少。因此,我们调查 LLM 是否可以仅通过提示即时学习一门新语言。为了研究这个问题,我们收集了壮语的研究套件,目前尚无 LLM 支持这种语言 ...

0 0 0 0 2025/01/15 arXiv:2402.19167v2 18636279200

幻觉对大语言模型(LLM)的实际实施提出了重大挑战。参数化知识在生成事实内容时的利用受到 LLM 知识有限的限制,可能会导致内部幻觉。虽然整合外部信息有助于填补知识空白,但它也带来了不相关信息的风险,从而增加了外部幻觉的可能性 ...

0 0 0 0 2024/11/11 arXiv:2402.10612v2 18636279200

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)