|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将 Fisher Z% k: v! I- v7 P- ^3 \ s
准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同
* K2 x+ @. p2 x6 z8 e类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在 NIST SRE 5 }. S( H4 q& v, r7 j) {* w/ D
2003 数据库上,实验结果表明该算法得到的等错误率是 7.62%,基于余弦距离打分的 i-vector 的等错误率是 6.7%。
% r: _# c1 d* `) G# n! @7 d# d当两个系统融合后,得到的等错误率是 5.07%。2 k5 |$ @; n z
关键词:说话人识别;字典学习;稀疏表示;Fisher 判别
# i2 f- p* I( b7 l* s' q8 h1 引言9 O+ K+ C/ W5 r7 H0 q, p% S
说话人识别是语音识别领域的一个重要组成部
/ l" |: a) y* R$ N2 S分,其目的是从说话人的语音中提取出说话人的个/ i: V6 e8 A6 H+ u/ y& n% ~8 X3 _
性特征,对说话人进行辨别的过程。该技术广泛应& N( r3 |) w% O# K! u
用于司法取证、声控门锁、银行、电子商务和国防
6 E2 T' N' X7 v- ^0 ]等领域。$ h @8 W8 r, b2 a
在过去的几年里,稀疏信号表示已广泛应用于
5 U; H+ D" b, e数字信号处理领域[1 5],例如:压缩感知和图像恢
: |/ Y9 ]6 A+ z复。近年来,人们发现基于分类的稀疏表示的实验2 H6 a4 g+ @6 @: p/ K
结果比较好,因此被广泛使用。稀疏编码是通过构3 r. X5 a/ V& O T0 u# S; K ^
建过完备字典[6]对任意一个信号进行最紧凑的线性
2 l7 R* E0 V3 g- K0 I3 t8 V9 G1 G: P/ j表示。构建稀疏编码字典的方法有两种,分别是标
& [3 d, M* y* H1 b8 X7 I& J, j1 V- I% E- F7 T
- c' I0 M+ Z/ b6 b* O2 C8 N8 H, C" ~" \. }# K
5 p$ |9 `7 X' e& t
" H; L% ?" D: D5 R3 C5 X附件下载:2 C" T7 f0 N" d* W' e6 d* {
5 X# Q1 U z3 i s, y8 J% V* H/ i |
|