jingxi的文档

jingxi

个性签名 ...

arXiv论文
本地上传
翻译历史

Achieving Sparse Activation in Small Language Models

稀疏激活在推理中选择性地仅激活一组依赖于输入的神经元，是一种有用的技术，可以降低大型语言模型 (LLM) 的计算成本，而无需重新训练或适应工作。然而，它是否可以应用于最近出现的小语言模型（SLM）仍然值得怀疑，因为 SLM 通常比 LLM 更少过度参数化。在本文中，我们的目标是在 SLM 中实现稀疏激活 ...

0 0 1 1 2024/12/10 arXiv:2406.06562v1 jingxi

Achieving Sparse Activation in Small Language Models

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）