语音端点检测的方法
本文档由 yanmeng198510 分享于2009-12-25 19:03
语音端点检测技术(Voice Activity Detection, 简称VAD)技术,也称有音/无音检测或者语音活动检测,指从带噪语音中准确定位出语音的起始点和结束点的技术,是语音信号处理领域的关键技术之一。语音端点检测技术的应用非常广泛。例如,作为语音识别系统预处理阶段遇到的第一个关键技术,端点检测对于语音识别系统的性能至关重要。当今的语音识别系统源于实验室,是一种基于训练的系统,对形成系统的训练环境非常敏感;在识别时通常存在实际语音因背景噪声的干扰而与训练失配的情况,从而导致识别错误,性能下降,系统鲁棒性变差。一般两段内容相同的语音可能时间的长短不同,音节间的间隙也不一致。而语音信号属于时变非平稳信号,语音特征会随着时间的变化而变化。在进行语音识别时,待识别的语音和参考语音不可能在时间上处处吻合,除非对语音在时间上进行某种校准,而这种校准的精度在很多..
下载文档
收藏
打印
分享:
君,已阅读到文档的结尾了呢~~