|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.' K% c6 S4 F& Y% p! @
- i, o5 f9 D G }. \- N
z- K; L) \' e# x! s' @2 c关键词:话音激活检测;长时信息;听觉滤波器;自适应
! O4 W$ O2 T& {4 f/ f7 i! k5 H* N _# b2 _0 v7 {
1 S4 L8 m5 K$ Q1 Z; v
; x5 v% b4 p. u+ i$ V
话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.7 Y& G$ ~3 l4 F; r& X1 `. e
5 L% c' r$ ~3 \2 K& r! {
& ]% k" i0 ]' H& u7 B. x7 p1 r3 J: u- x, E2 S3 t8 Z
# [& f( t+ ?' a( A/ F+ C5 d/ }. w+ C U0 c8 f- f$ ^! v7 A
' x: j) n) n" c
3 }3 J: g6 t% g; [. D# z7 A
9 L, @% f" N( I" h' }- X7 V |
|