软件工程活动经常涉及现有代码的编辑。但是,当代代码语言模型(LMS)缺乏处理各种类型的代码编辑要求的能力。在这项工作中,我们试图通过(1)新型的合成数据生成管道和(2)强大的模型适应算法来克服这一缺点 ...
0 0 0 2025/03/11 arXiv:2503.03656v1 15966829631
由于大型预训练语言模型(PLM)的出色生成能力,最近对数据集生成的兴趣越来越大。在本文中,我们研究了一种灵活,有效的零偏度学习方法,\ textsc {Zerogen}。给定一个零射击任务,我们首先以无监督的方式使用PLMS从头开始生成数据集 ...
0 0 0 2025/03/11 arXiv:2202.07922v2 yiyiyi
在大多数接触式操纵任务中,人类对目标对象应用时间变化的力,从而弥补了视觉引导的手轨迹的不准确性。但是,当前的机器人学习算法主要集中于基于轨迹的政策,而对与学习力相关的技能的关注有限。为了解决这一限制,我们介绍了一种以力为中心的机器人学习系统的Forcimic,它提供了一种自然的,具有力量的和无机器人的机器人的机器人演示收集系统,以及用于强大的接触式操纵的混合力 - 动作模仿学习算法 ...
0 0 0 2025/03/11 arXiv:2410.07554v3 mkn
神经架构搜索(NAS)产生最先进的神经网络,其表现优于其最佳手动设计的对应物。但是,以前的NAS方法在一组训练超参数下搜索体系结构(即 ...
0 0 0 2025/03/11 arXiv:2006.02049v3 edcyhn
对于深层回归,保留目标对特征表示的法规性可改善各种任务的性能。但是,仍然缺乏对法规益处的理论解释。这项工作表明,保留法令减少了有条件的熵$ h(z | y)$的$ z $在目标$ y $上有条件 ...
0 0 0 2025/03/11 arXiv:2502.09122v1 keqi
大型语言模型(LLM)具有明显的高级正式定理,但缺乏高质量的培训数据限制了它们在复杂的数学领域中的能力。数学的基石组合提供了组合,为分析离散结构和解决优化问题提供了必不可少的工具。但是,它固有的复杂性使其对于组合身份的自动定理(ATP)特别具有挑战性 ...
0 0 0 2025/03/11 arXiv:2502.17840v1 surenny233
随着大型语言模型(LLM)的发展,在人工智能系统的性能和安全性之间取得平衡变得前所未有的重要。然而,有益和无害的目标之间固有的紧张关系在 LLM 培训期间提出了重大挑战。为了解决这个问题,我们提出了基于人类反馈的安全强化学习(Safe RLHF),这是一种用于人类价值调整的新颖算法 ...
0 0 0 2025/03/11 arXiv:2310.12773v1 dm616703
单程3D车道检测是自动驾驶中的一项基本任务。尽管稀疏点方法较低的计算负载并保持复杂的车道几何形状中的高精度,但当前方法无法完全利用泳道几何表示和模型设计中车道的几何结构。在车道几何表示中,我们提出了一个理论分析以及实验验证,以验证当前的稀疏车道表示方法是否包含固有的缺陷,从而导致潜在的误差高达20 m,从而引起了驾驶的重大安全问题 ...
0 0 0 2025/03/11 arXiv:2503.06237v1 hulin01

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)