arxiv FlashSpeech: Efficient Zero-Shot Speech Synthesis

名称
FlashSpeech: Efficient Zero-Shot Speech Synthesis
首页
https://yiyibooks.cn/arxiv/2404.14700v3/index.html
原始地址
https://arxiv.org/pdf/2404.14700
描述
语言模型和扩散模型极大地推进了大规模零样本语音合成的最新进展。然而,这两种方法的生成过程都很慢并且计算量大。使用较低的计算预算实现高效的语音合成以达到与以前的工作相当的质量仍然是一个重大挑战 ...