mikecyz的文档

mikecyz

个性签名 ...

MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies

人们对开发具有多达万亿个参数的大型语言模型 (LLM) 的兴趣日益浓厚，但也引起了对资源效率和实际费用的担忧，特别是考虑到实验成本巨大。这种情况强调了探索小语言模型 (SLM) 作为资源高效替代方案的潜力的重要性。在这种背景下，我们引入了 MiniCPM，特别是 1 ...

0 0 0 0 2024/05/06 arXiv:2404.06395v2 mikecyz

Collaboration of Experts: Achieving 80% Top-1 Accuracy on ImageNet with 100M FLOPs

在本文中，我们提出了一个专家协作（CoE）框架，以汇集多个网络的专业知识以实现共同目标。每个专家都是一个单独的网络，拥有数据集独特部分的专业知识，这增强了集体能力。给定一个样本，委托人会选择一位专家，同时输出一个粗略的预测以支持提前终止 ...

0 0 0 0 2024/04/26 arXiv:2107.03815v2 mikecyz

DoReMi: Grounding Language Model by Detecting and Recovering from Plan-Execution Misalignment

大型语言模型（LLM）编码大量语义知识，并具有卓越的理解和推理能力。之前的工作探索了如何让 LLM 在机器人任务中落地，以生成可行且可执行的文本计划。然而，由于环境扰动或不完善的控制器设计，物理世界中的低层执行可能会偏离高层文本计划 ...

0 0 0 0 2024/04/17 arXiv:2307.00329v3 mikecyz

LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

大型语言模型已被广泛采用，但需要大量 GPU 内存进行推理。我们为 Transformer 中的前馈和注意力投影层开发了一种 Int8 矩阵乘法程序，它将推理所需的内存减少了一半，同时保留了完整的精度性能。使用我们的方法，可以加载 175B 参数 16/32 位检查点，转换为 Int8，并立即使用，而不会降低性能 ...

0 0 0 0 2024/04/16 arXiv:2208.07339v2 mikecyz

A White Paper on Neural Network Quantization

虽然神经网络在许多应用中取得了前沿进展，但它们通常需要很高的计算成本。如果我们想要将现代网络集成到具有严格功率和计算要求的边缘设备中，那么降低神经网络推理的功率和延迟是关键。神经网络量化是实现这些节省的最有效方法之一，但它引起的额外噪声可能会导致精度下降 ...

0 0 1 4 2024/04/16 arXiv:2106.08295v1 mikecyz

Understanding and Overcoming the Challenges of Efficient Transformer Quantization

基于 Transformer 的架构已成为各种自然语言处理任务事实上的标准模型。然而，它们的内存占用和高延迟阻碍了资源有限设备上的高效部署和推理。在这项工作中，我们探索 Transformer 的量化 ...

0 0 0 0 2024/04/16 arXiv:2109.12948v1 mikecyz

Embodied Neuromorphic Artificial Intelligence for Robotics: Perspectives, Challenges, and Research Development Stack

机器人技术帮助人类快速、准确、高效地完成多样化、复杂、密集的任务，成为提高人类生产力不可或缺的一部分。因此，机器人技术已被部署在从个人到工业用例的广泛应用中。然而，当前的机器人技术及其计算范式仍然缺乏具体智能来有效地与操作环境交互、以正确/预期的动作做出响应并适应环境的变化 ...

0 0 0 0 2024/04/12 arXiv:2404.03325v1 mikecyz

Improving Large Language Model Fine-tuning for Solving Math Problems

尽管在许多自然语言任务中取得了成功，但解决数学问题对于大型语言模型 (LLM) 来说仍然是一个重大挑战。 LLM 在解决数学问题时的一次通过和多次通过的表现之间存在很大差距，这表明 LLM 可能接近找到正确的解决方案，从而激励我们探索微调方法以释放 LLM 的表现。使用具有挑战性的数学数据集，我们研究了三种微调策略：（1）解决方案微调，我们进行微调以生成给定数学问题的详细解决方案； (2) 解决方案簇重新排序，其中 LLM 作为解决方案验证器/评估器进行微调，以在生成的候选解决方案簇中进行选择；（3）多任务顺序微调，将解决方案生成和评估任务有效地集成在一起，以提高LLM的性能 ...

0 0 0 0 2024/04/02 arXiv:2310.10047v1 mikecyz

Pretraining Language Models with Human Preferences

语言模型 (LM) 经过预先训练，可以模仿互联网文本，包括由 LM 生成的、违反人类偏好的内容：谎言、攻击性评论、个人身份信息、低质量或有错误的代码等等。在这里，我们探索预训练 LM 的替代目标，同时引导它们生成符合人类偏好的文本。我们通过三项任务中的人类反馈对预训练的五个目标进行了基准测试，并研究它们如何影响预训练 LM 的一致性和能力之间的权衡 ...

0 1 0 0 2024/03/22 arXiv:2302.08582v2 mikecyz

Principle-Driven Self-Alignment of Language Models from Scratch with Minimal Human Supervision

最近的人工智能助理代理，例如 ChatGPT，主要依靠带有人类注释的监督微调（SFT）和来自人类反馈的强化学习（RLHF）来使大语言模型（LLM）的输出与人类意图保持一致，确保它们是乐于助人、道德且可靠。然而，由于获得人类监督的成本高昂以及质量、可靠性、多样性、自我一致性和不良偏差等相关问题，这种依赖性可能会严重限制人工智能助理代理的真正潜力。为了应对这些挑战，我们提出了一种名为“自调整”的新方法，该方法结合了原则驱动的推理和 LLM 的生成能力，可以在最少的人类监督下实现人工智能代理的自调整 ...

0 0 1 1 2024/03/21 arXiv:2305.03047v2 mikecyz