|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.
# S0 S5 j: ]3 G9 b) Q3 M% G
# ~0 w, q9 K1 ]$ g9 Y
! n' Q7 N& `" V关键词:话音激活检测;长时信息;听觉滤波器;自适应& ^2 J1 a/ n% ]6 v" C+ h2 P) q
3 s5 b5 C6 \/ b5 ^
( G1 ]4 h& a4 _- R3 [! h; N/ Y1 `; n7 h
话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.
1 z% a* |6 f2 T) h
/ V R3 d: f+ l, L0 I3 i2 h: _# p- ?1 K5 G$ v
$ E3 E5 ~6 d1 j: w4 B4 S
) q5 k' K) [: F) _
& F2 A9 @5 m) S
6 i2 |* v9 n& B& E( L5 n/ k2 ?
2 o& M1 Z3 H4 ?5 x$ {% e3 F: D
0 ?7 u5 u& a, v6 @+ t
|
|