|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:针对等距映射(ISOMAP)算法无监督,不能生成显式映射函数等局限性,该文提出一种正则化的半监督等
1 {2 X. J# w2 w) S7 U) X5 z `3 z; a, `9 ]距映射(Reg-SS-ISOMAP)算法。该算法首先利用训练样本的标签样本构建 K 联通图(K-CG),得到近似样本间测地
" z: Z+ u- M& G! G' g3 w+ Q线距离,并作为矢量特征代替原始数据点;然后通过测地线距离计算核矩阵,用半监督正则化方法代替多维尺度分0 s( T7 ]2 b+ f
析(MDS)算法处理矢量特征;最后利用正则化回归模型构建目标函数,得到低维表示的显式映射。算法在多个数
0 F3 Z$ D. O$ ]: w$ N! ~' F据集上进行了比较实验,结果表明,文中提出的算法降维效果稳定,识别率高,显示了算法的有效性。8 b" D! g* G0 ^0 {+ {( i' d
关键词:数据降维;流形学习;半监督学习;正则化 z# R% t$ G0 ~, c% `7 F
1 前言
1 v- x6 ^2 ~- M( }; j数据降维方法可以分为线性降维和非线性降' z0 N2 j2 y5 A7 H" A$ b+ [: F
维,线性降维主要有主成分分析 (Principal
$ c0 z+ l9 D* T7 H# QComponent Analysis, PCA) ,线性判别分析
; ~. S- I9 \1 b( {; y# R% @(Linear Discriminant Analysis, LDA),多维尺度分
$ g- @! f8 ^2 N* Q6 S析(MultiDimensional Scaling, MDS)等。但在大多
( E) [$ H* {+ I7 y/ h" i( u# [数的应用中,数据一般分布在非线性几何结构上。) s* Z0 N4 h3 f9 k) A, H
非线性降维主要有等距映射 (ISOmetric ; C" `# ?% R$ w0 i
MAPping, ISOMAP),局部线性嵌入(Local Linear 1 X; S. J; x) {3 x: S& q5 ^ O
Embeedding, LLE)[1] ,拉普拉斯特征映射
! b* R+ s' M9 l) ](Laplacian Eigenmap, LE)[2], 局部切空间排列
3 u3 e' ]6 j3 C7 x$ b4 \6 N6 K% c(Local Tangent Space Alignment, LTSA)[3]等。非
0 W5 d4 Z0 g$ {1 l& O4 X: c4 p) H( r( M
/ l, o1 R l! y) s; G1 @
$ @2 s1 i1 O' o- p0 Z) P' I5 w0 h
% `: t# [& ?7 B a6 |5 U
* V+ f. x! {% Q( g# H6 s
) ~9 v$ P( }$ J( |( M" x j- D8 Z
) X/ }. g* R; i% \$ G% t附件下载:5 s2 T1 e# W8 S9 M: K2 a7 e
3 Q8 L9 g6 P- ]8 N& P, x
|
|