- 名称
- FlashSpeech: Efficient Zero-Shot Speech Synthesis
- 描述
语言模型和扩散模型极大地推进了大规模零样本语音合成的最新进展。然而,这两种方法的生成过程都很慢并且计算量大。使用较低的计算预算实现高效的语音合成以达到与以前的工作相当的质量仍然是一个重大挑战 ...
语言模型和扩散模型极大地推进了大规模零样本语音合成的最新进展。然而,这两种方法的生成过程都很慢并且计算量大。使用较低的计算预算实现高效的语音合成以达到与以前的工作相当的质量仍然是一个重大挑战 ...