找回密码
 注册
关于网站域名变更的通知
查看: 1130|回复: 1
打印 上一主题 下一主题

[毕业设计] 基于长时信息的自适应话音激活检测

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-6-18 10:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
摘要:语音信号的长时信息应用于话音激活检测中表现优越.利用三种听觉滤波器组,对语音信号进行非线性的谱分解,本文提出了六种基于听觉滤波器组的长时信息,并提出了基于长时信息的自适应话音激活检测算法.该算法无需训练数据,根据多种长时信息,直接在待测信号中挑选出类别明确的信号,然后利用这些信号训练分类模型,对待测信号按帧进行语音-非语音分类.在'TIMT'语音库和NOISEX-92 噪声库上的实验表明,该算法在极低信噪比环境下,仍表现出更高的准确性和更强的稳健性.同时,在线实验表明,算法在实时处理中仍能取得优异的性能.
# S0 S5 j: ]3 G9 b) Q3 M% G
# ~0 w, q9 K1 ]$ g9 Y

! n' Q7 N& `" V关键词:话音激活检测;长时信息;听觉滤波器;自适应& ^2 J1 a/ n% ]6 v" C+ h2 P) q
3 s5 b5 C6 \/ b5 ^

( G1 ]4 h& a4 _- R3 [! h; N/ Y1 `; n7 h
       话音激活检测(Voice Activity Detection, VAD)是语音信号处理相关应用必不可少的前端处理技术,如语音编码,语音增强,语音识别等.VAD的目的是检测当前音频信号中是否包含语音信号,即以帧为单位对输入信号进行分类,将其中语音信号标注出来.通过VAD可以有效地提升后端相应处理系统的效率和性能.
1 z% a* |6 f2 T) h
/ V  R3 d: f+ l, L0 I
3 i2 h: _# p- ?1 K5 G$ v
$ E3 E5 ~6 d1 j: w4 B4 S
) q5 k' K) [: F) _
游客,如果您要查看本帖隐藏内容请回复
& F2 A9 @5 m) S
6 i2 |* v9 n& B& E( L5 n/ k2 ?
2 o& M1 Z3 H4 ?5 x$ {% e3 F: D
0 ?7 u5 u& a, v6 @+ t
  • TA的每日心情
    慵懒
    2022-12-26 15:28
  • 签到天数: 1 天

    [LV.1]初来乍到

    2#
    发表于 2021-6-18 13:10 | 只看该作者
    话音激活检测是语音信号处理相关应用必不可少的前端处理技术
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-6-15 13:25 , Processed in 0.078125 second(s), 26 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表