|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将 Fisher" C' P: Q# N; ^5 H! w
准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同1 k9 L$ R( H. ~1 @' g) Q$ s
类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在 NIST SRE 6 C' X3 f% Z# Y
2003 数据库上,实验结果表明该算法得到的等错误率是 7.62%,基于余弦距离打分的 i-vector 的等错误率是 6.7%。+ L; H! ?+ a9 g$ z+ Q
当两个系统融合后,得到的等错误率是 5.07%。
$ t `8 L4 n) I5 `3 ~$ N2 ^关键词:说话人识别;字典学习;稀疏表示;Fisher 判别
8 `; X( `% v, ?% \, ~1 引言- y# M, q- t: q
说话人识别是语音识别领域的一个重要组成部
+ f" T) d- `& o分,其目的是从说话人的语音中提取出说话人的个
1 ^- e( g' { R4 N5 X A性特征,对说话人进行辨别的过程。该技术广泛应# b8 ?& Q. W- Z6 F
用于司法取证、声控门锁、银行、电子商务和国防6 h! H( [, O/ f# i0 m* V
等领域。5 G0 R% C" A. L3 w3 [
在过去的几年里,稀疏信号表示已广泛应用于+ E* C1 R% e: A. d _ P& ~
数字信号处理领域[1 5],例如:压缩感知和图像恢
2 d/ h, K) I/ i& Z% S" z复。近年来,人们发现基于分类的稀疏表示的实验5 r3 G1 Z W# ^* O* P' K% V& P$ x7 |
结果比较好,因此被广泛使用。稀疏编码是通过构
. \7 G6 w. K u2 _建过完备字典[6]对任意一个信号进行最紧凑的线性
* h$ B3 q. I+ ~! ~6 d' F2 f* _表示。构建稀疏编码字典的方法有两种,分别是标: J; i: l* ]+ Q+ I% N2 T: n. x
4 L- C% K2 ]. u; S7 c+ Z
/ d: v% L0 M" J7 r/ s2 Y9 \+ b" T# e w5 Z. I& J+ g$ p+ n
附件下载:
* c* C( ~) l% F6 ^# C2 q6 |
* ^3 w5 W' t- ` |
|