arxiv Semantic VAD: Low-Latency Voice Activity Detection for Speech Interaction

名称
Semantic VAD: Low-Latency Voice Activity Detection for Speech Interaction
首页
https://yiyibooks.cn/arxiv/2305.12450v1/index.html
原始地址
https://arxiv.org/pdf/2305.12450
描述
对于语音相互作用,语音活动检测(VAD)通常用作前端。但是,传统的VAD算法通常需要等待连续的尾部沉默才能在细分之前达到预设的最大持续时间,从而产生了影响用户体验的较大延迟。在本文中,我们提出了一种新型的语义VAD,以进行低延迟分割 ...