mikecyz的文档

mikecyz

个性签名 ...

Understanding and Overcoming the Challenges of Efficient Transformer Quantization

基于 Transformer 的架构已成为各种自然语言处理任务事实上的标准模型。然而，它们的内存占用和高延迟阻碍了资源有限设备上的高效部署和推理。在这项工作中，我们探索 Transformer 的量化 ...

0 0 0 0 2024/04/16 arXiv:2109.12948v1 mikecyz

Embodied Neuromorphic Artificial Intelligence for Robotics: Perspectives, Challenges, and Research Development Stack

机器人技术帮助人类快速、准确、高效地完成多样化、复杂、密集的任务，成为提高人类生产力不可或缺的一部分。因此，机器人技术已被部署在从个人到工业用例的广泛应用中。然而，当前的机器人技术及其计算范式仍然缺乏具体智能来有效地与操作环境交互、以正确/预期的动作做出响应并适应环境的变化 ...

0 0 0 0 2024/04/12 arXiv:2404.03325v1 mikecyz

Improving Large Language Model Fine-tuning for Solving Math Problems

尽管在许多自然语言任务中取得了成功，但解决数学问题对于大型语言模型 (LLM) 来说仍然是一个重大挑战。 LLM 在解决数学问题时的一次通过和多次通过的表现之间存在很大差距，这表明 LLM 可能接近找到正确的解决方案，从而激励我们探索微调方法以释放 LLM 的表现。使用具有挑战性的数学数据集，我们研究了三种微调策略：（1）解决方案微调，我们进行微调以生成给定数学问题的详细解决方案； (2) 解决方案簇重新排序，其中 LLM 作为解决方案验证器/评估器进行微调，以在生成的候选解决方案簇中进行选择；（3）多任务顺序微调，将解决方案生成和评估任务有效地集成在一起，以提高LLM的性能 ...

0 0 0 0 2024/04/02 arXiv:2310.10047v1 mikecyz

Pretraining Language Models with Human Preferences

语言模型 (LM) 经过预先训练，可以模仿互联网文本，包括由 LM 生成的、违反人类偏好的内容：谎言、攻击性评论、个人身份信息、低质量或有错误的代码等等。在这里，我们探索预训练 LM 的替代目标，同时引导它们生成符合人类偏好的文本。我们通过三项任务中的人类反馈对预训练的五个目标进行了基准测试，并研究它们如何影响预训练 LM 的一致性和能力之间的权衡 ...

0 1 0 0 2024/03/22 arXiv:2302.08582v2 mikecyz

Principle-Driven Self-Alignment of Language Models from Scratch with Minimal Human Supervision

最近的人工智能助理代理，例如 ChatGPT，主要依靠带有人类注释的监督微调（SFT）和来自人类反馈的强化学习（RLHF）来使大语言模型（LLM）的输出与人类意图保持一致，确保它们是乐于助人、道德且可靠。然而，由于获得人类监督的成本高昂以及质量、可靠性、多样性、自我一致性和不良偏差等相关问题，这种依赖性可能会严重限制人工智能助理代理的真正潜力。为了应对这些挑战，我们提出了一种名为“自调整”的新方法，该方法结合了原则驱动的推理和 LLM 的生成能力，可以在最少的人类监督下实现人工智能代理的自调整 ...

0 0 1 1 2024/03/21 arXiv:2305.03047v2 mikecyz

Sequence Parallelism: Long Sequence Training from System Perspective

Transformer 在各种任务上都取得了可喜的成果。然而，自注意力的内存需求与序列长度成二次方。现有的工作侧重于从算法的角度降低时间和空间复杂度 ...

0 0 0 0 2024/03/19 arXiv:2105.13120v3 mikecyz

Data Engineering for Scaling Language Models to 128K Context

我们研究了将语言模型的上下文长度扩展到 128K 的持续预训练方法，重点是数据工程。我们假设长上下文建模，特别是 \textit{在任意输入位置利用信息的能力}，是一种大部分已经通过大规模预训练获得的能力，并且这种能力可以很容易地扩展到比训练时看到的~（例如 ...

0 0 0 0 2024/03/18 arXiv:2402.10171v1 mikecyz

BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences

有效的注意力模块在基于 Transformer 的大型语言模型 (LLM) 的成功中发挥了至关重要的作用，但这些注意力模块的二次时间和内存复杂性在处理长序列时也构成了挑战。长序列问题的一种潜在解决方案是利用分布式集群来并行计算多个设备上的注意力模块（例如， ...

0 0 0 0 2024/03/18 arXiv:2403.09347v1 mikecyz

Tool Learning with Foundation Models

人类拥有创造和利用工具的非凡能力，使他们能够克服身体限制并探索新领域。随着基础模型的出现，人工智能系统有可能像人类一样熟练地使用工具。这个范式，i ...

0 0 0 0 2024/03/13 arXiv:2304.08354v2 mikecyz

Efficient Tool Use with Chain-of-Abstraction Reasoning

为了实现符合人类期望的忠实推理，大型语言模型 (LLM) 需要将其推理建立在现实世界知识（例如网络事实、数学和物理规则）的基础上 ...

0 0 0 0 2024/03/13 arXiv:2401.17464v2 mikecyz