我们解决了使用 CoNaLa 数据集从自然语言描述生成代码片段的问题。我们使用基于自注意力的 Transformer 架构,并表明它比基于循环注意力的编码器解码器表现更好。此外,我们开发了一种修改形式的反向翻译,并使用循环一致损失以端到端的方式训练模型 ...

0 0 0 0 2024/04/17 arXiv:2202.00367v1 weituo2002

最近,人们对使用深度学习自动化软件工程任务的兴趣激增。本文解决了代码生成问题,其目标是在给定不同语言或自然语言描述的源代码的情况下生成目标代码。大多数最先进的代码生成深度学习模型都使用主要为自然语言设计的训练策略 ...

0 0 0 0 2024/04/17 arXiv:2206.05239v3 weituo2002

近年来,大型语言模型(LLM)迅速发展。尽管LLM在许多语言理解任务中具有很强的能力,但繁重的计算负担在很大程度上限制了LLM的应用,特别是当需要将它们部署到边缘设备上时。在本文中,我们提出了一种量化感知低秩自适应(QA-LoRA)算法 ...

0 0 0 0 2024/04/18 arXiv:2309.14717v2 weituo2002

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)