我们提出了Voxlect,这是一种使用语音基础模型在全球范围内建模方言和区域语言建模的新颖基准。具体而言,我们报告了有关英语,阿拉伯语,普通话和广东话,藏语,指示语言,泰语,西班牙语,法语,德语,德语,巴西葡萄牙语和意大利语的方言和区域语言品种的全面基准评估。我们的研究使用了来自30个公开语音语料库的200万多个培训话语,并提供了方言信息 ...
情感语音转换(EVC)旨在改变话语的情绪状态,同时保留语言内容和说话者的身份。在本文中,我们提出了一种新颖的2阶段训练策略,以使用有限的情感语音数据来进行序列到序列的情感语音转换。我们注意到,所提出的EVC框架利用文本到语音(TTS)共享一个共同的目标,即产生高质量的表达语音 ...
在半监督的语义细分中,采用平均教师和共同训练的方法来减轻确认偏见和耦合问题。但是,尽管它们具有高性能,但这些方法经常涉及复杂的训练管道和实质性的计算负担,从而限制了这些方法的可伸缩性和兼容性。在本文中,我们提出了一个普遍的框架,该框架通过最大程度地利用了训练过程中获得的时间知识,从而有效地减轻了上述限制 ...
我们研究了利用先前收集的离线数据的在线营销活动中的预算分配问题。我们首先讨论在离线环境中优化营销预算分配决策的长期效果。为了克服挑战,我们提出了一种新型的游戏理论离线基于价值的强化学习方法,使用混合政策 ...
Question-Answer Extraction from Scientific Articles Using Knowledge Graphs and Large Language Models
当决定阅读文章或将其纳入他们的研究中时,学者们经常寻求快速识别和理解其主要思想。在本文中,我们旨在以问题和答案的形式(QA)对从科学文章中提取这些关键概念和贡献。我们提出了两种产生QA的不同方法 ...