- 名称
- Measuring Coding Challenge Competence With APPS
- 描述
虽然编程是现代社会最广泛应用的技能之一,但现代机器学习模型仍然无法编写基本问题的解决方案。尽管它很重要,但令人惊讶的是,评估代码生成的工作却很少,而且很难准确、严格地评估代码生成性能。为了应对这一挑战,我们引入了 APPS,这是代码生成的基准 ...
虽然编程是现代社会最广泛应用的技能之一,但现代机器学习模型仍然无法编写基本问题的解决方案。尽管它很重要,但令人惊讶的是,评估代码生成的工作却很少,而且很难准确、严格地评估代码生成性能。为了应对这一挑战,我们引入了 APPS,这是代码生成的基准 ...