|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将 Fisher( Q0 W' l. C- h2 E
准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同5 F j# f+ s0 w7 i& X( T
类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在 NIST SRE
8 X- G% {+ `* }/ ]% g$ |2003 数据库上,实验结果表明该算法得到的等错误率是 7.62%,基于余弦距离打分的 i-vector 的等错误率是 6.7%。$ K/ K% t! ^" I7 R5 q l
当两个系统融合后,得到的等错误率是 5.07%。
3 F5 v7 w* A: C关键词:说话人识别;字典学习;稀疏表示;Fisher 判别
' h2 O' q) N. ^ A# F u1 引言' K5 V2 \8 R: D
说话人识别是语音识别领域的一个重要组成部
z' F9 _! J/ e! W2 h' @5 J分,其目的是从说话人的语音中提取出说话人的个
8 t- A+ f- |8 f# ^* K性特征,对说话人进行辨别的过程。该技术广泛应
4 C1 I3 J; F$ Q& T* ~1 D, s用于司法取证、声控门锁、银行、电子商务和国防
& f6 r' c7 U0 v) B. J* z/ c等领域。* D x( a8 V5 e7 x
在过去的几年里,稀疏信号表示已广泛应用于2 V- e1 d# V6 D
数字信号处理领域[1 5],例如:压缩感知和图像恢
3 K8 s5 z/ v2 r3 z: ^2 i9 C, l复。近年来,人们发现基于分类的稀疏表示的实验2 g1 J" d, ^) C! |( `( o
结果比较好,因此被广泛使用。稀疏编码是通过构0 O, }1 D0 |' I- D
建过完备字典[6]对任意一个信号进行最紧凑的线性 q9 v( u; X- T G- }( f6 U2 T# {' T* Q
表示。构建稀疏编码字典的方法有两种,分别是标
' s- N$ T+ u. }: R6 F
/ u' R+ K$ t8 C9 ]- L K, Q3 ?3 E$ t) X( d7 t- W( I- k5 u
' l" b$ m( S; G4 O
) @5 i1 j) b a3 a4 r, O& ?' ^ g8 H& j$ m9 @' U- @. D
附件下载:
# l9 e0 i# e( k7 m% k" S+ ~7 M
6 p1 F0 n3 ]: w$ v# V# y8 ?# Q |
|