我们提出 Ming-Flash-Omni,它是 Ming-Omni 的升级版本,建立在 Ling-Flash-2.0 的稀疏专家混合 (MoE) 变体之上,总参数为 1000 亿个,其中每个 Token 只有 61 亿个活跃参数 ...

0 0 0 0 2025/10/31 arXiv:2510.24821v1 mlp

模型合并是一种有效的训练后策略,用于集成来自共享基础模型的多个微调检查点的知识。现有方法在参数空间中运行,结合任务向量来减轻冲突,但仍然受到参数不一致的限制。我们提出了功能双锚(FDA),这是一个对输入表示空间进行建模的框架 ...

0 0 0 0 2025/10/30 arXiv:2510.21223v1 mlp

基础模型的最新进展凸显了多阶段训练的显着优势,特别强调训练中期作为连接训练前和训练后的重要阶段的出现。中期训练的特点是使用中间数据和计算资源,系统地增强数学、编码、推理和长上下文扩展等特定能力,同时保持基础能力。这项调查提供了大型语言模型 (LLM) 中期训练的正式定义,并研究了包含数据管理、训练策略和模型架构优化的优化框架 ...

0 0 0 0 2025/10/30 arXiv:2510.23081v1 mlp

训练大型推理模型的主要范例是从使用大量数据的下一个标记预测损失进行预训练开始。强化学习虽然在扩展推理方面功能强大,但仅在训练后的最后阶段引入,之后进行监督微调。虽然占主导地位,但这是否是最佳的训练方式?在本文中,我们提出了 RLP,一种信息驱动的强化预训练目标,它将强化学习的核心精神——探索——带入了预训练的最后阶段 ...

0 0 0 0 2025/10/09 arXiv:2510.01265v1 mlp

计算资源的指数扩展与高质量文本数据的有限增长之间日益扩大的差距现在限制了大型语言模型(LLM)的传统扩展方法。为了应对这一挑战,我们引入了预训练数据强化学习 (RLPT),这是一种用于优化 LLM 的新训练时间扩展范例。与之前主要通过监督学习来扩展训练的方法相比,RLPT 使策略能够自主探索有意义的轨迹,从预训练数据中学习,并通过强化学习 (RL) 提高其能力 ...

0 0 0 0 2025/10/09 arXiv:2509.19249v2 mlp

提高 LLM 推理能力的普遍范式围绕高质量、推理密集型数据的后期培训。虽然新兴文献表明推理数据在训练中期也越来越多地被纳入——这种做法相对更专有且不太公开特征——但此类数据在预训练中的作用仍不清楚。特别是,由于大多数前沿模型中预训练语料库的不透明性,在训练前和/或训练后不同阶段引入的推理数据的影响在科学文献中报道相对较少 ...

0 0 0 0 2025/10/09 arXiv:2510.03264v1 mlp

训练数据在大型语言模型 (LLM) 扩展中发挥着至关重要的作用,但高质量数据的供应有限。合成数据技术提供了绕过这些限制的潜在途径。我们使用统一的协议和缩放法则进行大规模实证研究(> 1000 个 LLM ,> 100k GPU 小时),比较自然网络数据、不同的合成类型(改写文本、生成的教科书)以及自然数据和合成数据的混合 ...

0 0 0 0 2025/10/09 arXiv:2510.01631v1 mlp

我们引入了合成引导预训练(SBP),这是一种语言模型(LM)预训练过程,它首先从预训练数据集中学习文档之间的关系模型,然后利用它来合成一个巨大的新语料库以进行联合训练。虽然标准预训练教会 LM 学习单个文档中标记之间的因果相关性,但它并不是为了有效地建模丰富的、可学习的文档间相关性而设计的,而这种相关性可能会带来更好的性能。我们通过设计计算匹配的预训练设置来验证 SBP,并从头开始在最多 1T Token 上预训练 3B 参数模型 ...

0 0 0 0 2025/10/09 arXiv:2509.15248v2 mlp

大型语言模型(LLM)拥有广泛的世界知识和强大的通用推理能力,但它们很难从标准机器学习(ML)任务的许多上下文示例中学习,即纯粹通过上下文学习(ICL)而不是梯度下降来利用多镜头演示。我们推出 MachineLearningLM,这是一种便携式持续预训练框架,为通用 LLM 提供强大的上下文 ML 功能,同时保留其一般知识和推理以适应更广泛的聊天工作流程。我们的预训练程序从数百万个结构因果模型 (SCM) 中综合了 ML 任务,涵盖的镜头数高达 1,024 ...

0 0 0 0 2025/10/09 arXiv:2509.06806v5 mlp

本文通过使用思维轨迹来增强现有文本数据来提高大语模型(LLM)培训的数据效率(LLM)培训的数据效率。训练前LLM的计算以前所未有的速度增长,而高质量数据的可用性仍然有限。因此,最大化可用数据的实用性构成了重大的研究挑战 ...

0 0 0 0 2025/09/28 arXiv:2509.20186v2 mlp

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)