大型语言模型已成为有效的机器翻译系统。在本文中,我们探讨了如何使用相对较少产生的数据资源来改进通用指导调整的大语言模型。使用Slovene作为用例,我们使用直接偏好优化(DPO)培训在编程策划和增强的公共数据集子集上改进了GAMS-9B - 教学模型 ...
有效利用私人数据集在开发基础模型方面仍然是一个重大挑战。 Federated Learning(FL)最近成为了一个协作框架,使多个用户可以在减轻数据隐私风险的同时微调这些模型。同时,通过大大减少可训练参数的数量,低级适应(LORA)为微调基础模型提供了资源有效的替代方案 ...
事件提取(EE)通过微调从预训练的语言模型(PLM)中受益匪浅。但是,现有的训练方法不涉及建模事件特征,从而导致开发的EE模型无法充分利用大规模的无监督数据。为此,我们提出了Cleve,这是EE从大型无监督数据及其语义结构中更好地学习事件知识的对比前训练框架(e ...
本文提出了针对法律规范分析和理解的专门设计的图形检索效果生成(Graph rag)的改编。法律文本的特征是预定义的层次结构,广泛的参考网络以及通过多个时间版本的连续演变。这种时间动态对标准AI系统构成了重大挑战,要求在任何给定时间点对法律的确定性表示 ...
预训练的模型(PTM)正在彻底改变人工智能(AI)技术。但是,PTM培训的硬件需求非常高,使其成为一小部分人的游戏。因此,我们提出了Patrickstar系统,以降低PTM的硬件要求,并使所有人都可以使用 ...
该手稿从优化和控制的角度来调查强化学习,重点是连续控制应用。它调查了强化学习的一般配方,术语和典型的实验实现,并审查了竞争解决方案范式。为了比较各种技术的相对优点,本调查介绍了具有未知动力学的线性二次调节器(LQR)的案例研究,这可能是最佳控制中最简单,最良性的问题 ...
本文使用检索增强生成(RAG)框架提出了提出索问题(QA)系统的进步,以增强从PDF文件中提取信息。认识到PDF中数据的丰富性和多样性 - 包括文本,图像,矢量图,图形和表格 - 对主要用于文本内容设计的现有QA系统构成了独特的挑战。我们试图开发一个基于抹布的质量检查系统,该系统将有效地解决复杂的多模式问题,在查询中将几种数据类型组合在一起 ...
具有级联体系结构的推荐系统在在线推荐平台中起着越来越重要的作用,在线推荐平台处理负面反馈是一个至关重要的问题。例如,在简短的视频平台中,用户倾向于迅速溜走他们感到厌恶的候选人,并有望获得这些明确的负面反馈,并进行调整以避免这些建议。考虑到记忆中的新近度效应,我们提出了一个基于Ebbinghaus忘记曲线的遗忘模型,以应对负面的反馈 ...