|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
. V! R4 P5 ^* |# ?5 `
摘要:现有的面向大规模数据分类的支持向量机( support vector machine,SVM)对噪声样本敏感,针对这一问题,通过定义软性核凸包和引入pinmball损失函数,提出了一种新的软性核凸包支持向量机( softkernel convex_hull sup-port vector machine for large scale noisy datasets ,SCH-SVM).SCH-SVM首先定义了软性核凸包的概念,然后选择出能代表样本在核空间几何轮廓的软性核凸包向量,再将其对应的原始空间样本作为训练样本并基于pinmball损失函数来寻找两类软性核凸包之间的最大分位数距离.相关理论和实验结果亦证明了所提分类器在训练时间,抗噪能力和支持向量数上的有效性.
5 J3 X" g% h6 }, l% R' G' I1 x
" o& t3 v1 G8 y2 r2 v关键词:大规模数据;噪声;软性核凸包;pinball损失函数﹔分类
( K4 d$ X: S) M4 c
+ M4 I9 F; S" h- h: ]8 n0 N 支持向量机(Support Vector Machine ,SVM)使用统计学习理论和最优化方法解决机器学习问题,凭借其优秀的泛化性能成为模式识别领域一个非常重要的分支.其最优化问题常描述成二次规划问题.对于样本数为ⅣN的数据集来说,训练SVM分类器的时间复杂度为o(N).为降低SVM的计算复杂度,常用的方法有:逼近替代二次规划问题中的核矩阵计算,如贪婪逼近,矩阵分解法和矩阵变换法等;减少训练样本数或限制支持向量数,如核心集向量机,快速核密度估计,近似极值点支持向量机和采样SVM等.& n. f1 s0 t. e' X/ B* A" j
' Y9 x" ^6 Z) s" J8 J* J* S& @
+ U/ Y& \0 P- d
1 P5 H5 S9 F- y! L5 m2 z, ]
% H! Y* s9 l% }; w$ b( e. k
. \( z# d6 d9 h# X; u$ d( H
& y3 S! s( C: ~3 b# |- n |
|