|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:针对等距映射(ISOMAP)算法无监督,不能生成显式映射函数等局限性,该文提出一种正则化的半监督等+ _" \# u2 G5 P0 g9 [% Q! Z: y
距映射(Reg-SS-ISOMAP)算法。该算法首先利用训练样本的标签样本构建 K 联通图(K-CG),得到近似样本间测地
5 A% ~, R/ X5 ?- K$ Z9 P线距离,并作为矢量特征代替原始数据点;然后通过测地线距离计算核矩阵,用半监督正则化方法代替多维尺度分% `+ e3 } A ]) d
析(MDS)算法处理矢量特征;最后利用正则化回归模型构建目标函数,得到低维表示的显式映射。算法在多个数
) N4 E/ C, K9 ?0 f& W据集上进行了比较实验,结果表明,文中提出的算法降维效果稳定,识别率高,显示了算法的有效性。
$ g5 Q0 N1 J3 @5 U. b! R' X& k1 O关键词:数据降维;流形学习;半监督学习;正则化
' C8 M1 G! \; j6 T- B, E1 _8 ?( D1 前言2 K9 E% P( N! `$ Q! Z, t) N/ y" g
数据降维方法可以分为线性降维和非线性降
* [; }, F5 A3 j) C& }维,线性降维主要有主成分分析 (Principal 4 `' o6 M3 f3 i6 n' e
Component Analysis, PCA) ,线性判别分析
* V2 R3 Z& h+ P4 Y7 o/ r(Linear Discriminant Analysis, LDA),多维尺度分
: A5 A. i, o1 M3 U" K5 n析(MultiDimensional Scaling, MDS)等。但在大多
9 f& b. K8 F2 o8 o7 K数的应用中,数据一般分布在非线性几何结构上。
: f+ w& E5 E [3 j# F: `6 Q6 y! ^非线性降维主要有等距映射 (ISOmetric
+ A, n. f+ {* A+ z4 v( ^MAPping, ISOMAP),局部线性嵌入(Local Linear + Y* `8 u. l, |1 m9 H
Embeedding, LLE)[1] ,拉普拉斯特征映射
7 p$ n$ B: l! p ~- Q# u+ g(Laplacian Eigenmap, LE)[2], 局部切空间排列! r' Y* O; x V% s" s' _4 G* X
(Local Tangent Space Alignment, LTSA)[3]等。非
0 r5 g& N4 x9 r
0 q; o {& ]& Z2 l* b. A
9 e% J6 @0 l* V. e- @' C3 \
* L: p6 d( m0 l6 m( J
1 A' h# I5 n3 `& u; V: t) S
4 C* M% D G% ^! z8 B" m, I8 q9 V% [8 H( r% \5 R9 P3 e
* N2 V1 b0 d; n& U T: A附件下载: O3 r# T- D4 T9 Z/ M! y
: a, P# U9 k0 x5 ~, m |
|