|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:支持向量机分类算法引入惩罚因子来调节过拟合和线性不可分时无解的问题,优点是可以通过调节参数取
+ |* _0 _ f' K4 C得最优解,但带来的问题是允许一部分样本错分。错分的样本在分类间隔之间失去了约束,导致两类交界处样本杂
* q" {( m* y/ N6 P0 y乱分布,并且增加了训练的负担。为了解决上述问题,该文根据大间隔分类思想,基于类内紧密类间松散的原则,
2 a4 @; M7 O, Y& `0 W, N" {$ ?( E提出一种新的分类算法,称之为最小化类内距离和(Intraclass-Distance-Sum-Minimization, IDSM)分类算法。该算
" M: p7 A! H, g8 [法根据最小化类内距离和准则构造训练模型,通过解析法求解得到最佳的映射法则,进而利用该最佳映射法则对样
9 k S( n# W1 h/ n( z" }& x' r本进行投影变换以达到类内间隔小类间间隔大的效果。相应地,为解决高维样本分类问题,进一步提出了该文算法
# {3 z% b" T! v4 w$ j+ |的核化版本。在大量 UCI 数据集和 Yale 大学人脸数据库上的实验结果表明了该文算法的优越性。' S# u$ A$ ~, ~5 ]/ o
关键词:支持向量机;惩罚因子;大间隔分类思想;类内距离和;映射法则3 D' t. r0 N7 m* K1 C# M
1 引言
2 [# j2 I) E/ p" D' y分类一直是人工智能和模式识别等领域研究的8 a" L4 D: a4 [6 u
热点,分类算法广泛应用于数据挖掘、图像处理、
* S9 @' l6 U" [. j% Y; W1 h$ ^* U" ?1 M视频跟踪与检测、智能收索、推荐系统、识别系统
/ `& a# A( Z3 V3 x$ \( l; m+ X, H2 |0 a3 G0 b$ V5 n# Z
等领域,所以分类算法的发展与进步改变着人们的
6 [$ ~ g$ S: N9 [7 c: v, v d生产和生活方式。 目前常用的分类算法有决策树算* p: S& N( f( D
法、贝叶斯分类器、K 近邻算法、fisher 判别分析法,
3 M3 w. u7 E. G8 ^7 t% g神经网络算法和 SVM 等分类算法。决策树[1,2]是通, g2 Z% A( |- K$ S0 h
过一定的规则对样本已知属性进行选择达到分类目
/ d& z0 S" m6 B* y. f6 G. ]的的算法。主要的决策树算法有 ID3, C4.5 等。ID3$ r8 f; K/ b3 a
算法的目的在于减少树的深度,但不能处理具有连# Q4 A0 \" i) S& H. N1 e
续值和具有缺失的数据属性。C4.5 算法在 ID3 算法
' U- r9 J& M) L! n, s的基础上对于预测变量的缺值等方面作了较大的改% v' n) T* \ v" L$ x
: r4 U: U$ O, _5 |8 g: H4 y, V
3 \" x M7 B! k0 d8 Y M& j4 F+ i* ~0 f
/ m& S8 G8 n+ Z9 w$ ?+ l* ]; f
# \3 y6 a0 Z" t5 @附件下载:: t( z! s7 N0 k) i$ |
% t1 q; i& C" \* J, L: t$ D1 S
|
|