由于创意写作任务没有单数正确的答案,因此训练执行这些任务的大型语言模型(LLM)应该能够产生多样化的有效输出。但是,LLM训练后通常着重于提高发电质量,但忽略了以促进产出多样性。因此,在创意写作中,我们研究了培训后的方法,以促进产出多样性和质量 ...
图形相似性搜索是最重要的基于图的应用程序之一,例如找到与查询化合物最相似的化合物 ...
图神经网络(GNN)已成为从图形结构数据中学习的重要方法。但是,当图形结构次优时,它们的有效性可能会受到显着损害。为了解决这个问题,图形结构学习(GSL)已成为一种有前途的技术,可以适应节点连接 ...
在ASR模型的整个训练过程中,基于预设参数以调节的方式应用数据增强的强度和计算训练损失的方法。例如,Specaughment采用预定义的增强强度来掩盖时间频域频谱的一部分。同样,在基于CTC的多层模型中,通常根据训练过程中编码器的最终层的输出来确定损耗 ...
在本文中,我们介绍了一种新颖的方法,以使用相对的对比学习来学习视觉和语义一致性。我们的方法以对比方式最大化区域和对象标签之间的兼容性。为了建立一个适当的对比度学习目标,对于每个图像,我们通过利用从基础模型(例如剪辑)获得的正面和负面对的相对性质来增强标签 ...
新颖的对象字幕旨在描述训练数据中缺少的对象,关键要素是为模型提供对象词汇。尽管现有方法在很大程度上依赖于对象检测模型,但我们将检测步骤视为词汇检测,从外部知识中以嵌入形式从Wiktionary的任何对象定义的嵌入形式中获取,我们在检索图像区域中使用从变形金刚模型中学到的特征。我们提出了一个端到端的小说对象,并从外部知识方法(NOC-REK)中检索了词汇,该对象同时学习了词汇检索和标题生成,并成功地 ...
随着隐私问题在自然语言处理(NLP)社区中受到越来越多的关注,已经提出了许多方法来消毒受到差异隐私的文本。但是,基于公制的当地差异隐私(MLDP)的最先进的文本消毒机制不适用于非金属的语义相似性措施,并且无法在隐私和效用之间实现良好的权衡。为了解决上述限制,我们根据原始的$ \ epsilon $ -Differential Privacy(DP)定义提出了一种新颖的自定义文本(Custext)消 ...
众所周知,诸如咳嗽和呼吸之类的健康声音会包含有用的健康信号,具有监测健康和疾病的重要潜力,但在医疗机器学习社区中却没有忽视。现有的用于健康声学的深度学习系统通常受到狭义的培训和评估,并在一项任务上受到数据的限制,并可能阻碍对其他任务的概括。为了减轻这些差距,我们开发了一种可扩展的自我监督的基于学习的深度学习系统,该系统使用掩盖的自动编码器,该系统在大型数据集中训练有3.13亿个两秒长的音频剪辑 . ...