|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘 要:传统聚类算法在数据量不足或数据被污染的场景下聚类效果较差,针对此问题,在经典模糊 C 均值(FCM)
% e5 P2 D0 `6 q, @! b; ?技术的基础上,该文提出融合历史类中心和历史隶属度两类知识迁移机制的聚类算法。该算法通过有效利用历史数4 V4 p: i4 E9 }! x& {
据中总结得到的辅助知识来指导当前由于数据不足或数据污染带来的聚类困难问题,从而提高聚类效果。同时,由
5 \7 E% y' [8 [5 _5 t" h0 K \9 Q于该算法仅利用历史数据的类中心和隶属度,对历史数据具有隐私保护的优点。通过在模拟数据集和真实数据集上
: U2 d4 e2 ^% k的仿真实验,证明了该算法的有效性。
* u5 {7 I2 w' y/ {0 T- f关键词:知识迁移;隐私保护;聚类算法;模糊 C 均值. h s1 F2 ?1 t) g- S) v+ o
1 引言
0 ]: P* o3 F5 }聚类分析是将一组未知类标签的数据样本按照3 f2 p5 R% j, j" b+ ]$ f; y2 }) @
它们在性质上的亲疏程度划分到由类似性质数据组5 t; `$ l; i+ I8 s+ T0 o* K
成的多个类的过程[1 4] 。聚类分析作为一种无监督( z2 G1 E! Q- ?1 s# _
的数据处理技术,是目前机器学习、数据挖掘和人4 v$ g% w6 v. l- Q/ G: `% k
工智能等领域的研究热点之一。目前,聚类分析已8 {' n2 i, M9 ~2 _3 v2 I7 @& O
被广泛地应用于文本聚类、视频处理、图像分割以
7 U6 F2 o3 _7 k5 H/ H/ C* J: K, O及入侵检测等方面。传统的聚类分析算法如基于层6 o/ C9 Q5 {: \: ?4 ]; D: X
次的 BIRCH 算法[5,6]、基于划分的 FCM 算法[7 11] % {: I4 e1 G- h3 h( k' N
、基于密度的 DBSCAN 算法[12]和基于网格的 WAVE-) ^( M4 F8 y5 n5 f+ t" [
. n1 k" j. [: o0 V3 J8 F3 O$ m
3 X4 s7 C5 l0 i( m) U5 P3 m
, H6 J1 F# _, i6 d) ?& l- C" j# ]% }! ?( k. @
. F; ^7 D/ n! F. s* @4 h' S+ |+ [9 G
# B! f* K, e [$ Y# @附件下载:
+ s) R( V, k0 h) ^2 N' W3 s
9 V7 Z3 j/ O$ ` |
|