大规模网络爬取数据集是预训练视觉语言模型(例如 CLIP)成功的基础。然而,网络抓取的 AltText 固有的噪声和潜在的不相关性给实现精确的图像文本对齐带来了挑战。利用大型语言模型 (LLM) 进行字幕重写的现有方法已在 CC3M 和 CC12M 等小型精选数据集上显示出前景 ...

0 0 0 0 2024/03/17 arXiv:2310.07699v3 whyseu

大语言模型(LLM)和生成人工智能(GenAI)构成了网络安全的范式转变,带来了前所未有的挑战和机遇。在研究 GenAI 在网络安全中的最先进应用时,这项工作强调了 Google Gemini 和 ChatGPT-4 等模型如何潜在地增强安全协议、漏洞评估和威胁识别。我们的研究强调了利用 LLM 来识别和消除复杂网络威胁的新方法的重要性 ...

0 0 0 0 2024/03/14 arXiv:2403.08701v1 whyseu

我们研究了在给定计算预算下训练 Transformer 语言模型的最佳模型大小和标记数量。我们发现,当前的大型语言模型训练明显不足,这是最近关注扩展语言模型同时保持训练数据量恒定的结果。通过在 5 到 5000 亿个令牌上训练 400 多个语言模型,参数范围从 7000 万到超过 160 亿个参数,我们发现,对于计算最优的训练,模型大小和训练令牌的数量应该同等缩放:对于模型的每一次加倍size 训练令牌的数量也应该加倍 ...

0 0 0 0 2024/03/10 arXiv:2203.15556v1 whyseu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)