文本的机器理解是自然语言处理中的一个重要问题。最近发布的数据集斯坦福问答数据集(SQuAD)提供了大量由人类通过众包创建的真实问题及其答案。 SQuAD 为评估机器理解算法提供了一个具有挑战性的测试平台,部分原因是与以前的数据集相比,SQuAD 中的答案不是来自一小部分候选答案,而且它们的长度是可变的 ...
文本到语音合成系统通常由多个阶段组成,例如文本分析前端、声学模型和音频合成模块。构建这些组件通常需要广泛的领域专业知识,并且可能包含脆弱的设计选择。在本文中,我们提出了 Tacotron,这是一种直接从字符合成语音的端到端生成文本到语音模型 ...