arxiv WavLM: Large-Scale Self-Supervised Pre-Training for Full Stack Speech Processing

名称
WavLM: Large-Scale Self-Supervised Pre-Training for Full Stack Speech Processing
首页
https://yiyibooks.cn/arxiv/2110.13900v5/index.html
原始地址
https://arxiv.org/abs/2110.13900
描述
自我监督学习(SSL)在语音识别方面取得了巨大成功,但在其他语音处理任务方面的探索还很有限。 由于语音信号包含说话人身份、副语言学、说话内容等多方面信息,因此学习适用于所有语音任务的通用表征具有挑战性。...