联合学习(FL)最近已应用于大语言模型(LLMS)的参数效率微调。尽管有希望,但由于客户的异质资源和数据分布,它引起了重大挑战。这项研究介绍了Flexlora,这是一种简单而有效的LLM微调汇总计划,在传统FL中降低了``桶效应''的````桶效应''',从而限制了客户提供充足资源的潜力,从而将他们绑定到了资源最少的参与者的能力 ...
0 0 0 2025/04/22 arXiv:2402.11505v2 IQ_QI
大型多模型(LMMS)在理解图像,视频和音频之外的音频方面表现出令人印象深刻的功能。但是,由于其在多阶段推理管道中的复杂体系结构和异质性特征,在生产环境中有效服务于生产环境会带来重大挑战。我们对六个代表性的开源模型进行了对两种突出的LMM架构,仅解码和交叉注意的首次全面系统分析,从而揭示了关键的系统设计含义 ...
0 0 0 2025/04/21 arXiv:2502.00937v2 tea5
在许多智能的系统和应用中,在复杂场景中的行人和汽车等代理商进行分析和预测轨迹变得越来越重要。丰富的代理商中社会互动行为的多样性和不确定性使这项任务比其他确定性计算机视觉任务更具挑战性。研究人员已经努力通过不同的数学模型和网络结构来量化这些相互作用对未来轨迹的影响,但是这个问题尚未得到很好的解决 ...
0 0 0 2025/04/21 arXiv:2310.05370v2 tuxiaolv
深度强化学习(RL)算法是解决视觉运动决策任务的强大工具。但是,训练有素的模型通常很难解释,因为它们被表示为端到端的深神经网络。在本文中,我们通过分析任务执行期间所使用的像素,并将它们与人类执行相同任务的像素进行比较,从而阐明了这些受过训练的模型的内部工作 ...
0 0 0 2025/04/21 arXiv:2010.15942v3 xdd
大型语言模型(LLM)代理正在迅速改进,以处理日益复杂的基于Web的任务。这些代理中的大多数都依靠通用,专有模型(例如GPT-4),并专注于设计更好的提示以提高其计划能力。但是,通用LLM并未经过专门培训以了解HTML等专业网络环境,并且他们经常在长马计划中挣扎 ...
0 0 0 2025/04/21 arXiv:2411.15004v2 panda__
社区检测技术对于社交媒体平台很有用,可以发现共享共同利益的用户群体紧密相连。但是,这种功能通常是因为无意间揭示其口味或偏好而可能使个人违反隐私侵犯的牺牲。因此,有些用户可能希望保留其匿名性,并出于各种原因(例如与政治或宗教组织的隶属关系)选择退出社区发现,而无需离开平台 ...
0 0 0 2025/04/21 arXiv:2310.08909v2 18045186869
在知识密集型任务中,尤其是在很少的学习限制下,检索增强的生成(RAG)模型在知识密集型任务中表现出色。我们介绍了Corag,这是一个将抹布扩展到协作设置的框架,客户使用协作通道商店共同培训共享模型。为了评估Corag,我们介绍了Crab,这是协作均质开放域问题答案的基准 ...
0 0 0 2025/04/21 arXiv:2504.01883v1 Daisyhhh
通过将外部的,特定于域的数据纳入生成过程,检索增强的生成(RAG)通过将外部,特定领域的数据结合到生成过程来增强大型语言模型(LLMS)。尽管LLM具有很高的能力,但它们通常依赖于静态的,预训练的数据集,从而限制了它们集成动态或私人数据的能力。传统的抹布系统通常使用单格架构来处理查询生成,数据检索和响应综合 ...
0 0 0 2025/04/21 arXiv:2412.05838v1 Daisyhhh

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)