基于 Transformer 的大语言模型 (LLM) 在不同领域中都表现出了出色的性能,特别是在针对特定领域进行微调时。最近的研究表明,微调 LLM 所需的资源可以通过低阶适应 (LoRA) 等参数有效的方法来节省。虽然 LoRA 有效减少了计算负担和资源需求,但它目前仅支持单作业微调设置 ...

0 0 0 0 2024/04/18 arXiv:2312.02515v1 weituo2002

从自然语言生成 SQL 查询的能力对于非专业人员也可以访问数据具有重大意义。本文提出了一种微调开源大语言模型 (LLM) 的新颖方法,用于将自然语言转换为零售领域内的 SQL 查询。我们引入专门用于生成 SQL 查询的模型,并在针对 Snowflake SQL 和 GoogleSQL 方言定制的合成数据集上进行训练 ...

0 0 0 0 2024/04/18 arXiv:2312.02251v1 weituo2002

大型语言模型(LLM)在程序合成和理解任务的表示学习方面表现出了卓越的能力。学习表示的质量似乎由神经缩放定律决定,作为模型参数和观察数量的函数,同时通过可用数据和计算量对模型性能施加上限,这是昂贵的。 在本研究中,我们试图通过统一四个关键组成部分来提高 LLM 的程序综合训练效率:(1)模型架构,(2)学习方法,(3)填充采样,以及(4)数据分布 ...

0 0 0 0 2024/04/18 arXiv:2305.02309v2 weituo2002

大型语言模型 (LLM) 展示了令人印象深刻的能力,可以在零样本的情况下生成准确的代码片段,即无需进行特定的微调 ...

0 0 0 0 2024/04/18 arXiv:2308.10462v2 weituo2002

能够自动生成代码的工具有可能增强程序员的能力。虽然许多 IDE 中都集成了直接的代码检索,但显式代码生成是一个新兴领域。代码生成目前被视为机器翻译任务,使用基于循环神经网络 (RNN) 的编码器-解码器架构在代码-描述对上进行训练 ...

0 0 0 0 2024/04/18 arXiv:2007.02609v2 weituo2002

代码生成系统基于输入的自然语言描述生成编程语言代码。最先进的方法依赖于神经网络来生成代码。然而,这些代码生成器存在两个问题 ...

0 0 0 0 2024/04/18 arXiv:1911.09983v2 weituo2002

基于 Transformer 的预训练模型在自然语言生成任务中表现出了高性能。然而,新一波的兴趣已经兴起:自动编程语言生成。此任务包括将自然语言指令翻译为编程代码 ...

0 0 0 0 2024/04/18 arXiv:2303.12869v1 weituo2002

自然语言处理领域的最新进展 \cite{gpt2} \cite{BERT} 在多个自然语言任务中取得了接近人类的表现。在本文中,我们试图了解类似的技术是否可以应用于具有严格语法规则的高度结构化环境。具体来说,我们提出了一种端到端的机器学习模型,用于在预先训练的语言模型之上构建 Python 语言的代码生成 ...

0 0 0 0 2024/04/17 arXiv:2102.10535v1 weituo2002

自动化单元测试用例生成工具促进测试驱动开发,并通过建议旨在识别代码缺陷的测试来支持开发人员。现有方法通常以测试覆盖率标准为指导,生成开发人员通常难以阅读或理解的综合测试用例。在本文中,我们提出了 AthenaTest,一种旨在通过学习现实世界的焦点方法和开发人员编写的测试用例来生成单元测试用例的方法 ...

0 0 0 0 2024/04/17 arXiv:2009.05617v2 weituo2002

现有的基于大型语言模型的代码生成管道通常在解码过程中使用波束搜索或采样算法。尽管他们生成的程序获得了基于标记匹配的高分,但它们经常无法编译或生成不正确的输出。主要原因是传统的 Transformer 解码算法可能不是代码生成的最佳选择 ...

0 0 0 0 2024/04/17 arXiv:2303.05510v1 weituo2002

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)