自动生成代码提交的高质量提交消息可以实质上促进软件开发人员的作品和协调。但是,源代码和自然语言之间的语义差距对该任务构成了重大挑战。已经提出了几项研究以减轻挑战,但没有明确涉及在提交消息生成期间代码上下文信息 ...
评估对于推进跨领域的决策至关重要,但是现有的方法常常难以平衡理论严格和实际的可扩展性。为了降低实验评估的成本,我们引入了可参数受试者评估的计算理论。我们证明了广义评估误差和广义因果关系误差的上限 ...
自动评估指标的元评估(评估评估指标本身)对于准确基准基准基准自然语言处理系统至关重要,并且对科学探究,生产模型开发和政策执法具有影响。尽管现有的指标元评估方法将重点放在有关指标跨任意系统输出的绝对质量和相对质量的一般性陈述上,但实际上,指标在高度上下文的设置中应用,通常可以测量高度约束的系统输出集的性能。例如,我们可能只对评估特定模型或类别类别感兴趣 ...
关于3D对象检测的许多最新作品都集中在设计可以消耗点云数据的神经网络体系结构上。尽管这些方法表现出令人鼓舞的性能,但它们通常基于单个模式,并且无法利用其他模式(例如相机)的信息。尽管有几种方法融合了来自不同模式的数据,但这些方法要么使用复杂的管道来顺序处理模式,要么执行后期融合,并且无法在早期阶段学习不同模态之间的相互作用 ...
受益于扩散模型的快速发展,视频合成最近取得了显着的进步。然而,它在语义准确性、清晰度和时空连续性方面仍然遇到挑战。它们主要源于缺乏良好对齐的文本视频数据以及视频复杂的固有结构,使得模型很难同时确保语义和质量的卓越性 ...
软件工程(SE)的机器学习(ML)由于能够显着提高各种SE应用的性能而获得了突出性。这种进度在很大程度上归因于有效捕获代码的句法和语义特征的可推广源代码表示的开发。近年来,受自然语言处理(NLP)启发的预训练的基于 Transformer 的模型在SE任务中取得了显着的成功 ...
语法是编程语言和软件工程的基石,提供了框架来定义句法空间和程序结构。现有的研究表明,基于语法的代码表示在小型模型中的有效性,显示了它们减少语法错误并提高性能的能力。但是,随着语言模型的规模扩展到十亿或以上,语法级别的错误变得罕见,因此尚不清楚语法信息是否仍然提供性能优势 ...
弱监督的时间动作本地化旨在通过仅将视频级标签作为监督来定位行动区域并同时识别未修剪视频中的动作类别。伪标签生成是解决具有挑战性问题的有前途的策略,但是当前的方法忽略了视频的自然时间结构,可以提供丰富的信息来帮助这一生成过程。在本文中,我们提出了一种新型的弱监督的时间动作定位方法,通过推断出显着的摘要功能 ...