mlp的文档

mlp

个性签名 ...

Model Merging in Pre-training of Large Language Models

模型合并已成为增强大型语言模型的一种有希望的技术，尽管它在大规模的预训练中的应用仍然相对尚未探索。在本文中，我们对训练过程中的模型合并技术进行了全面研究。通过对量表和混合物（MOE）的广泛实验，范围从数百万到1000亿多个参数，我们证明，与持续学习率进行训练的检查点不仅可以实现显着的绩效提高，而且还可以准确预测退火行为 ...

0 0 0 0 2025/05/27 arXiv:2505.12082v3 mlp

1.4 Million Open-Source Distilled Reasoning Dataset to Empower Large Language Model Training

Am-Deepseek-R1启动是一个大规模数据集，具有一般推理任务的思维痕迹，由高质量和挑战性的推理问题组成。这些问题是从多种开源数据集中收集的，受到语义重复数据删除和细致的清洁，以消除测试集污染。数据集中的所有响应都从推理模型（主要是DeepSeek-R1）中提取，并具有严格的验证程序 ...

0 0 0 0 2025/03/26 arXiv:2503.19633v1 mlp

Hephaestus: Improving Fundamental Agent Capabilities of Large Language Models through Continual Pre-Training

由于面向代理的预训练数据缺乏，基于LLM的自主剂通常依赖于复杂的提示或广泛的微调，这通常无法引入新的功能，同时保持强大的可推广性。我们介绍了Hephaestus-Forge，这是第一个旨在增强LLM代理在API函数调用，内在推理和计划中以及适应环境反馈的大规模训练之前的大规模训练前语料库。 Hephaestus-Forge包括103B特定于特定于代理的数据，其中包括76,537个API，包括既有工具文档，都可以介绍API功能的知识和功能呼叫轨迹以增强内在推理 ...

0 0 0 0 2025/02/12 arXiv:2502.06589v1 mlp

Metadata Conditioning Accelerates Language Model Pre-training

语言模型预培训语料库中存在的样式，域和质量水平的大量多样性对于发展通用模型功能至关重要，但是在这些异构数据源中，有效地学习和部署正确的行为是具有挑战性的。为了解决这个问题，我们提出了一种新方法，称为元数据调节，然后冷却（MECO），以在预训练期间结合其他学习提示。 Meco首先提供元数据（e ...

0 0 0 0 2025/02/07 arXiv:2501.01956v1 mlp

Chumor 2.0: Towards Benchmarking Chinese Humor Understanding

现有的幽默数据集和评估主要集中在英语上，在诸如中文等非英语语言中为文化细微差别的幽默留下了有限的资源。为了解决这一差距，我们构建了Chumor，这是第一个超过现有幽默数据集大小的中国幽默解释数据集。 Chumor源自Ruo Zhi Ba，这是一个类似于中国Reddit的平台，以分享具有智力挑战性和文化特定的笑话而闻名 ...

0 0 0 0 2025/02/07 arXiv:2412.17729v1 mlp

Does your LLM truly unlearn? An embarrassingly simple approach to recover unlearned knowledge

得益于对大量文本语料库的广泛训练，大型语言模型（LLM）在生成文本方面表现出了非凡的能力。然而， LLM 也可能会从其培训数据的多样性和敏感性质中获得不需要的行为，其中可能包括受版权保护和私人内容。机器遗忘已被引入作为一种可行的解决方案，以消除此类有问题的内容的影响，而无需进行昂贵且耗时的再培训 ...

0 0 0 0 2024/11/19 arXiv:2410.16454v1 mlp

WildChat: 1M ChatGPT Interaction Logs in the Wild

GPT-4 和 ChatGPT 等聊天机器人现在正在为数百万用户提供服务。尽管它们被广泛使用，但仍然缺乏公共数据集来展示这些工具在实践中如何被用户群体使用。为了弥补这一差距，我们为在线用户提供了免费访问 ChatGPT 的机会，以换取他们肯定、同意的选择，以匿名方式收集他们的聊天记录和请求标头 ...

0 0 0 0 2024/11/13 arXiv:2405.01470v1 mlp

Recent Advancement of Emotion Cognition in Large Language Models

大语言模型 (LLM) 中的情感认知对于提高社交媒体、人机交互和心理健康评估等各种应用的性能至关重要。我们探索了当前的研究格局，主要围绕情感分类、情感丰富的响应生成和心理理论评估，同时承认对注释数据的依赖和情感处理的复杂性等挑战。在本文中，我们详细调查了 LLM 在情绪认知方面的最新进展 ...

0 0 0 0 2024/09/23 arXiv:2409.13354v1 mlp

EmoBench: Evaluating the Emotional Intelligence of Large Language Models

大型语言模型 (LLM) 的最新进展凸显了对稳健、全面且具有挑战性的基准的需求。然而，评估他们的情商（EI）的研究相当有限。现有的基准有两个主要缺点：首先，它们主要关注情绪识别，忽视了情绪调节和通过情绪理解促进思维等基本的 EI 能力；其次，它们主要是根据现有数据集构建的，其中包括频繁模式、显式信息和注释错误，导致评估不可靠 ...

0 0 0 0 2024/09/12 arXiv:2402.12071v3 mlp

Do Large Language Models Possess Sensitive to Sentiment?

大型语言模型（LLM）最近展示了其在语言理解方面的非凡能力。然而，如何全面评估LLM的情感能力仍然是一个挑战。本文研究了 LLM 检测文本模式中的情绪并对其做出反应的能力 ...

0 0 0 0 2024/09/10 arXiv:2409.02370v1 mlp