heiheihei的文档

heiheihei

个性签名 ...

Scaling Instructable Agents Across Many Simulated Worlds

构建可以在任何 3D 环境中遵循任意语言指令的具体 AI 系统是创建通用 AI 的关键挑战。实现这一目标需要学习将语言融入感知和具体行动中，以完成复杂的任务。可扩展、可指导、多世界代理 (SIMA) 项目通过训练代理在各种虚拟 3D 环境中遵循自由形式的指令来解决这个问题，包括策划的研究环境以及开放式商业视频游戏 ...

0 0 0 0 2024/04/18 arXiv:2404.10179v2 heiheihei

Scaling Laws and Interpretability of Learning from Repeated Data

最近的大型语言模型已经在海量数据集上进行了训练，但也经常在重复数据上进行训练，要么是故意为了提高更高质量的数据的权重，要么是无意的，因为重复数据删除并不完美，并且模型暴露在句子、段落处的重复数据中，或文档级别。一些作品报告了这种重复数据对性能的巨大负面影响。在本文中，我们试图系统地研究重复数据并从机制上理解其影响 ...

0 0 0 0 2024/04/18 arXiv:2205.10487v1 heiheihei

Is DPO Superior to PPO for LLM Alignment? A Comprehensive Study

人类反馈强化学习 (RLHF) 是目前使用最广泛的方法，使大型语言模型 (LLM) 与人类偏好保持一致。现有的 RLHF 方法可以大致分为基于奖励的或无奖励的。 ChatGPT 和 Claude 等新颖应用程序利用基于奖励的方法，首先学习奖励模型并应用演员批评算法，例如近端策略优化 (PPO) ...

0 0 0 0 2024/04/18 arXiv:2404.10719v1 heiheihei

Pre-training Small Base LMs with Fewer Tokens

我们研究了从现有大型基础语言模型 (LM) 开始开发小型基础语言模型 (LM) 的简单方法的有效性：首先从较大的 LM 继承一些 Transformer 块，然后在非常小的子集（0.1 \%) 较大模型的原始预训练数据。我们将这个简单的配方称为 Inheritune，并首先演示它如何用 1 构建一个小型基础 LM ...

0 0 0 0 2024/04/17 arXiv:2404.08634v1 heiheihei

Scaling (Down) CLIP: A Comprehensive Analysis of Data, Architecture, and Training Strategies

本文研究了对比语言图像预训练（CLIP）在缩小到有限计算预算时的性能。我们从数据、架构和训练策略三个维度来探索 CLIP。在数据方面，我们证明了高质量训练数据的重要性，并表明较小的高质量数据集可以优于较大但质量较低的数据集 ...

0 0 0 0 2024/04/17 arXiv:2404.08197v2 heiheihei

LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders

大型纯解码器语言模型 (LLM) 是当今大多数 NLP 任务和基准测试中最先进的模型。然而，社区只是慢慢地将这些模型用于文本嵌入任务，这需要丰富的上下文表示。在这项工作中，我们引入了 LLM2Vec，这是一种简单的无监督方法，可以将任何仅解码器的 LLM 转换为强大的文本编码器 ...

0 0 0 0 2024/04/10 arXiv:2404.05961v1 heiheihei

Grammar-Constrained Decoding for Structured NLP Tasks without Finetuning

尽管性能令人印象深刻，但大型语言模型 (LM) 在未进行微调以准确遵循所需的输出格式时，仍然难以可靠地生成复杂的输出结构。为了解决这个问题，可以使用语法约束解码（GCD）来控制 LM 的生成，保证输出遵循给定的结构。然而，大多数现有的 GCD 方法仅限于特定任务，例如解析或代码生成 ...

0 0 0 0 2024/04/09 arXiv:2305.13971v6 heiheihei

Grammar Prompting for Domain-Specific Language Generation with Large Language Models

大型语言模型 (LLM) 可以通过少量上下文示例学习执行各种自然语言任务。然而，对于从高度结构化的语言生成字符串（例如 ...

1 0 0 0 2024/04/09 arXiv:2305.19234v3 heiheihei

Training LLMs over Neurally Compressed Text

在本文中，我们探讨了在高度压缩的文本上训练大型语言模型（LLM）的想法。虽然标准子词标记器以较小的因子压缩文本，但神经文本压缩器可以实现更高的压缩率。如果可以直接在神经压缩文本上训练 LLM ，这将在训练和服务效率方面带来优势，并且更容易处理长文本跨度 ...

0 0 0 0 2024/04/09 arXiv:2404.03626v1 heiheihei

Simple and Scalable Strategies to Continually Pre-train Large Language Models

大型语言模型（LLM）通常会在数十亿个 Token 上进行预训练，只有在新数据可用时才会重新开始该过程。更有效的解决方案是持续预训练这些模型，与重新训练相比，可以节省大量计算量。然而，新数据引起的分布变化通常会导致先前数据的性能下降或对新数据的适应性较差 ...

0 0 0 0 2024/04/08 arXiv:2403.08763v3 heiheihei