语音端点检测的方法

本文档由 yanmeng198510 分享于2009-12-25 19:03

语音端点检测技术(Voice Activity Detection, 简称VAD)技术,也称有音/无音检测或者语音活动检测,指从带噪语音中准确定位出语音的起始点和结束点的技术,是语音信号处理领域的关键技术之一。语音端点检测技术的应用非常广泛。例如,作为语音识别系统预处理阶段遇到的第一个关键技术,端点检测对于语音识别系统的性能至关重要。当今的语音识别系统源于实验室,是一种基于训练的系统,对形成系统的训练环境非常敏感;在识别时通常存在实际语音因背景噪声的干扰而与训练失配的情况,从而导致识别错误,性能下降,系统鲁棒性变差。一般两段内容相同的语音可能时间的长短不同,音节间的间隙也不一致。而语音信号属于时变非平稳信号,语音特征会随着时间的变化而变化。在进行语音识别时,待识别的语音和参考语音不可能在时间上处处吻合,除非对语音在时间上进行某种校准,而这种校准的精度在很多..
文档格式:
.ppt
文档大小:
1.12M
文档页数:
36
顶 /踩数:
10 0
收藏人数:
15
评论次数:
1
文档热度:
文档分类:
IT计算机  —  网络与通信
添加到豆单
文档标签:
语音识别 端点检测 基本方法 短时能量 过零率 倒谱特征 复杂度 KC复杂度 C0复杂度
系统标签:
语音 端点检测 vad 识别 活动检测 段内容
下载文档
收藏
打印

扫扫二维码,随身浏览文档

手机或平板扫扫即可继续访问

推荐豆丁书房APP  

获取二维码

分享文档

将文档分享至:
分享完整地址
文档地址: 复制
粘贴到BBS或博客
flash地址: 复制

支持嵌入FLASH地址的网站使用

html代码: 复制

默认尺寸450px*300px480px*400px650px*490px

支持嵌入HTML代码的网站使用

分享到