软件工程活动经常涉及现有代码的编辑。但是,当代代码语言模型(LMS)缺乏处理各种类型的代码编辑要求的能力。在这项工作中,我们试图通过(1)新型的合成数据生成管道和(2)强大的模型适应算法来克服这一缺点 ...
由于大型预训练语言模型(PLM)的出色生成能力,最近对数据集生成的兴趣越来越大。在本文中,我们研究了一种灵活,有效的零偏度学习方法,\ textsc {Zerogen}。给定一个零射击任务,我们首先以无监督的方式使用PLMS从头开始生成数据集 ...
在大多数接触式操纵任务中,人类对目标对象应用时间变化的力,从而弥补了视觉引导的手轨迹的不准确性。但是,当前的机器人学习算法主要集中于基于轨迹的政策,而对与学习力相关的技能的关注有限。为了解决这一限制,我们介绍了一种以力为中心的机器人学习系统的Forcimic,它提供了一种自然的,具有力量的和无机器人的机器人的机器人演示收集系统,以及用于强大的接触式操纵的混合力 - 动作模仿学习算法 ...
神经架构搜索(NAS)产生最先进的神经网络,其表现优于其最佳手动设计的对应物。但是,以前的NAS方法在一组训练超参数下搜索体系结构(即 ...
对于深层回归,保留目标对特征表示的法规性可改善各种任务的性能。但是,仍然缺乏对法规益处的理论解释。这项工作表明,保留法令减少了有条件的熵$ h(z | y)$的$ z $在目标$ y $上有条件 ...
大型语言模型(LLM)具有明显的高级正式定理,但缺乏高质量的培训数据限制了它们在复杂的数学领域中的能力。数学的基石组合提供了组合,为分析离散结构和解决优化问题提供了必不可少的工具。但是,它固有的复杂性使其对于组合身份的自动定理(ATP)特别具有挑战性 ...
随着大型语言模型(LLM)的发展,在人工智能系统的性能和安全性之间取得平衡变得前所未有的重要。然而,有益和无害的目标之间固有的紧张关系在 LLM 培训期间提出了重大挑战。为了解决这个问题,我们提出了基于人类反馈的安全强化学习(Safe RLHF),这是一种用于人类价值调整的新颖算法 ...
单程3D车道检测是自动驾驶中的一项基本任务。尽管稀疏点方法较低的计算负载并保持复杂的车道几何形状中的高精度,但当前方法无法完全利用泳道几何表示和模型设计中车道的几何结构。在车道几何表示中,我们提出了一个理论分析以及实验验证,以验证当前的稀疏车道表示方法是否包含固有的缺陷,从而导致潜在的误差高达20 m,从而引起了驾驶的重大安全问题 ...