情感语音转换(EVC)旨在改变话语的情绪状态,同时保留语言内容和说话者的身份。在本文中,我们提出了一种新颖的2阶段训练策略,以使用有限的情感语音数据来进行序列到序列的情感语音转换。我们注意到,所提出的EVC框架利用文本到语音(TTS)共享一个共同的目标,即产生高质量的表达语音 ...
在半监督的语义细分中,采用平均教师和共同训练的方法来减轻确认偏见和耦合问题。但是,尽管它们具有高性能,但这些方法经常涉及复杂的训练管道和实质性的计算负担,从而限制了这些方法的可伸缩性和兼容性。在本文中,我们提出了一个普遍的框架,该框架通过最大程度地利用了训练过程中获得的时间知识,从而有效地减轻了上述限制 ...
我们研究了利用先前收集的离线数据的在线营销活动中的预算分配问题。我们首先讨论在离线环境中优化营销预算分配决策的长期效果。为了克服挑战,我们提出了一种新型的游戏理论离线基于价值的强化学习方法,使用混合政策 ...
Question-Answer Extraction from Scientific Articles Using Knowledge Graphs and Large Language Models
当决定阅读文章或将其纳入他们的研究中时,学者们经常寻求快速识别和理解其主要思想。在本文中,我们旨在以问题和答案的形式(QA)对从科学文章中提取这些关键概念和贡献。我们提出了两种产生QA的不同方法 ...
情感语音转换(EVC)旨在将源语音信号的情感风格转换为目标风格,同时保留其内容和说话者的身份信息。以前的情感转换研究并没有将情感信息与应保留的情绪无关的信息删除,从而以单片的方式改变了所有这些信息,并通过语言扭曲产生低质量的音频。为了解决这个失真问题,我们提出了一个新颖的Stargan框架以及一个两阶段的训练过程,该过程将情感特征与那些独立于情感的人分开,通过将自动编码器与两个编码器一起用作生成对 ...
精确地对用户超长序列进行建模对于工业推荐系统至关重要。当前的方法主要集中于在排名阶段利用超长序列,而对候选阶段的研究仍然不足。本文介绍了Longretriever,这是将超长序列纳入推荐人的检索阶段的实用框架 ...
图自监督学习现在是预训练图基础模型的首选方法,包括图神经网络、图转换器和最新的基于大语言模型(LLM)的图模型。图的结构和属性中嵌入了多种可用于预训练的知识模式,但我们缺乏从图知识的角度对自监督预训练任务的系统概述。本文从基于知识的角度全面考察和分析图基础模型的预训练任务,包括微观知识(节点、链接等)和宏观知识(集群、全局结构等) ...
由大型语言模型提供动力的代理商取得了令人印象深刻的结果,但是有效地处理互动过程中产生的大量历史数据仍然是一个挑战。当前的方法是设计一个存储模块,以便代理处理这些数据。但是,现有的方法(例如内存库和A-MEM)的存储内存含量质量较差,这会影响回忆性能和响应质量 ...