创造力已经定期归因于专业计算创造力(CC)社区之外的AI系统。但是,对AI的创造力的评估通常缺乏创造力理论的基础,这可以促进不适当的归因并限制对创造行为的分析。尽管CC研究人员将心理理论转化为正式模型,但这些模型的价值受到对普通AI框架的差距的限制 ...
我们探索并增强神经语言模型的能力,以生成基于文献的新颖的科学方向。基于文献的假设生成工作传统上侧重于二元链接预测————严重限制了假设的表达能力。这一系列工作也不注重优化新颖性... ...
最近,来自环绕式图像的3D对象检测取得了显着的进步,其部署成本低。但是,大多数作品主要集中在近距离感知范围内,同时探索远程检测较少。直接扩展现有的方法以覆盖长距离构成挑战,例如繁重的计算成本和不稳定的融合 ...
这项工作介绍了FreeSVC,这是一种有希望的多语言唱歌语音转换方法,它利用扬声器不变的聚类(SPIN)来利用增强的VITS模型(SPIN),以获得更好的内容表示和最先进的ART(SOTA)扬声器Encoder Ecapa2。 FreeSVC结合了可训练的语言嵌入来处理多种语言,并采用高级扬声器编码器,以将扬声器的特征与语言内容删除。 FREESVC专为零射击学习而设计,可实现跨语性的歌声转换,而 ...
作为计算机视觉领域的一种常见方法,由于其出色的长距离依赖性建模能力,空间注意机制已被广泛用于遥感图像的语义分割。但是,遥感图像通常以复杂的背景和较大的类内差异为特征,这些方差会降低其分析性能。尽管香草空间注意机制基于密集的仿射操作,但它们倾向于引入大量背景上下文信息,并且缺乏对固有空间相关性的考虑 ...
除了模仿有限的人类经验之外,最近的研究表明,初步证据表明,与人类一样,大型语言模型(LLM)能够纯粹通过自我纠正来提高其能力,即在某些情况下通过自我检查来纠正以前的反应 ...
深层多任务网络在其中一个神经网络产生多个预测性输出,可以比单件任务同行提供更好的速度和性能,但要挑战训练。我们提出了一种梯度归一化(GradNorm)算法,该算法通过动态调整梯度大小来自动平衡深度多任务模型的训练。我们表明,对于各种网络体系结构,用于回归和分类任务,以及在合成和真实数据集上,GradNorm提高了准确性,并且与单任务网络,静态基准和其他自适应多任务损失平衡技术相比,多个任务的准确性 ...
批评是评估模型生成内容质量的自然语言描述,在LLM的培训,评估和完善中发挥了至关重要的作用。但是,缺乏评估批评质量的系统方法。在本文中,我们先驱对批评的批评,称为Metacritique,该批评构建了特定的定量标准 ...