低级适应性(LORA)是一种自然的方法,可以在通信受限的机器学习设置(例如联合学习的跨设备)中进行填充。在联邦学习的背景下研究洛拉的先前工作重点是改善洛拉对异质性和隐私性的稳健性。在这项工作中,我们考虑了进一步提高联邦洛拉(Lora)的沟通效率的技术 ...

0 0 0 0 2025/04/22 arXiv:2406.05233v1 IQ_QI

联合学习(FL)最近已应用于大语言模型(LLMS)的参数效率微调。尽管有希望,但由于客户的异质资源和数据分布,它引起了重大挑战。这项研究介绍了Flexlora,这是一种简单而有效的LLM微调汇总计划,在传统FL中降低了``桶效应''的````桶效应''',从而限制了客户提供充足资源的潜力,从而将他们绑定到了资源最少的参与者的能力 ...

0 0 0 0 2025/04/22 arXiv:2402.11505v2 IQ_QI

基金会模型(FMS)很好地适应了具有微调和联合学习(FL)的特定领域或任务,从而有可能使用智障本地数据对FMS进行隐私性微调。对于FMS的联合微调,我们考虑具有最大数十亿个小型参数尺寸的FMS,最大为10亿个数字,被称为“ evice FMS(ODFM”),可以在设备上进行推理以进行推理,但只能通过参数有效方法进行微调。在我们的工作中,我们通过提出一种使用异质性低级别近似值(Loras)(即Hetlora)提出一种新方法来解决ODFM联合微调的数据和系统异质性问题 ...

0 0 0 0 2025/04/15 arXiv:2401.06432v2 IQ_QI

SGD在 Transformer 上的显着余量比亚当的表现要差,但原因尚不清楚。在这项工作中,我们通过Hessian的镜头提供了一种解释:(i) Transformer 是“异质性”:参数块跨参数块的Hessian频谱差异很大,我们称之为“块异质性”的现象; (ii)异质性HAMPERS SGD:SGD在块异质性问题上的表现要比Adam差。为了验证(i)和(ii),我们检查了各种 Transformer ,CNN,MLP和二次问题,并发现SGD可以在没有阻碍异质性的问题上与Adam上的ADAM表现,但在存在异质性时的性能要比ADAM差 ...

0 0 0 0 2025/04/14 arXiv:2402.16788v4 IQ_QI

视觉问题回答(VQA)是一项挑战任务,结合了自然语言处理和计算机视觉技术,并逐渐成为多模式大语模型(MLLM)中的基准测试任务。我们调查的目的是概述VQA的开发以及及时性高的最新模型的详细描述。这项调查提供了对图像和文本的自然语言理解的最新综合,以及基于核心VQA任务的图像问题信息的知识推理模块 ...

0 0 0 0 2025/03/27 arXiv:2411.17558v1 IQ_QI

我们通过对学习的$ a $ a $ a $ $ b $矩阵的不对称分析的镜头进行联合学习的洛拉。为此,我们发现$ A $矩阵负责学习通用知识,而$ b $矩阵专注于捕获特定于客户的知识。基于这一发现,我们介绍了联合Share-a-a-Rank Apaptation(FEDSA-LORA),该改编(FEDSA-LORA)使用两个低级别训练的矩阵$ a $ a $ a $ and $ b $来对重量更新进行建模,但只有$ a $ a $矩阵与服务器共享用于聚合 ...

0 0 0 0 2025/03/04 arXiv:2410.01463v2 IQ_QI

低排名适应性(LORA)是预先训练的语言模型上最受欢迎的特定任务特定参数效率微调(PEFT)方法之一,其良好的性能和计算效率。洛拉(Lora)在每个冷冻预训练的模型模块的顶部注入了两个可训练的等级分解矩阵的产物。但是,当在保护联合学习(FL)的设置中应用于以下事实,LORA可能变得不稳定:1)数据异质性和多步局部更新的影响不可忽视,2)2)附加噪声在更新梯度上坚持更新以保证降低隐私(DP)可以降低效率(DP),以适应降低和3)的表现 ...

0 0 0 0 2025/03/04 arXiv:2403.12313v1 IQ_QI

低级别矩阵近似值,例如截断的奇异值分解和排名vealing QR分解,在数据分析和科学计算中起着核心作用。这项工作调查并扩展了最近的研究,该研究表明,随机化为执行低级矩阵近似的功能提供了强大的工具。这些技术比经典方法更充分地利用现代计算体系结构,并打开了处理真正庞大的数据集的可能性 ...

0 0 0 0 2025/02/26 arXiv:0909.4061v2 IQ_QI

联合学习(FL)提供了使用分布式私人数据集对预先培训的大型语言模型(LLM)进行微调的隐私解决方案,从而在保留数据隐私时实现了特定于任务的适应性。但是,由于大量的沟通和计算成本,在资源受限的联合场景中微调LLM中的广泛参数尤其具有挑战性。为了更深入地了解如何解决这些挑战,本文进行了比较分析,三个高级联合LLM(FEDLLM)框架,将知识蒸馏(KD)和拆分学习(SL)(SL)整合起来,以减轻这些问题:1)客户上传模型参数或梯度以实现直接有效的微调; 2)KD-FEDLLMS,它利用KD通过logits进行有效的知识共享; 3)拆分fedllms,将LLMS分为两个部分,在客户端上执行一个部分,而另一部分在服务器上执行,以平衡计算负载 ...

0 0 0 0 2025/02/25 arXiv:2501.04436v1 IQ_QI

将低级适应(LORA)与联邦学习(FL)集成在一起,最近受到了广泛的关注,旨在通过隐私保护分散的培训来适应经过审计的基础模型(FMS)以下游医疗任务。但是,由于洛拉和FL的直接组合,当前方法通常会遇到两个问题,即 ...

0 0 0 0 2025/02/23 arXiv:2410.12926v1 IQ_QI

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)