|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.
4 I0 C4 m6 v7 B7 Y
2 c$ R( H) X: w; a9 q$ |, q7 J
关键词:话音激活检测;长时信息;听觉滤波器;自适应% q1 G t8 O* \! q
) o" A( \% j; M1 S1 R' [2 P; C
. h1 `; F i' \1 P
0 L! H! U( L! b6 f# W0 h 话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能." C4 _+ ~& E0 X* S2 }5 ^
* L- w) z+ O- ~
9 \$ K9 P7 M4 j. `5 }8 C( R6 h$ V; A/ V) J) O9 N$ R
$ L" ?, [$ {& A/ p
7 ?( V7 V! s$ F% a
- {4 [( d$ {& {" p/ p8 @" ~9 p* n8 l% m$ n' I
. T" }( Z1 w' X! S |
|