|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
摘要:挖掘隐藏在网络中不同于正常数据对象的离群点是数据挖掘的重要任务之一.目前,针对双类型异质信息网络离群点检测的研究工作相对较少,原本适用于同质网络的离群点检测方法将很难适用于双类型异质网络.为此,提出了异质信息网络中基于排序和聚类的离群点检测方法(RKBOutlier).从异质信息网络中抽取两种类型的对象以及链接两种对象的语义信息,将待检测的数据作为属性对象,将另一类型数据作为目你对家,对日你戏家过们求尖来检测属性对象在各个聚类中的分布情况,数据分布异常的对象即为离群点.将排序和聚类相结合来显著提高聚类的准确度.实验结果表明,RKBOutlier可以在双类型异质信息网络中有效地检测出离群点.
) e e; o% `7 a" k
4 _& P) }. w( P; ?* @+ O8 Y5 s, H关键词:离群点检测;排序;聚类;目标对象;属性对象
9 U% _& s; b$ u, q H
7 J" o7 Y+ w5 e; x! j 异质信息网络挖掘是数据挖掘的一类重要问题.识别和分析网络中有趣而稀少的模式具有很重要的现实意义.离群点检测旨在发现大量数据集合中一部分离群的数据,其分布的规律不同于正常的数据.离群点不同于噪声,离群数据本身携带着重要的信息,可以用于数据分析.离群点检测在日常生活中有着广泛的应用,如网络入侵、医疗诊断、金融诈骗等等.; y& a/ Y4 J: b5 w/ p
* n5 m% x* J! N3 S, m. q0 g: [
7 n+ z8 W% p: [7 j7 H; i+ R6 T& G% p0 [) h5 I
$ z$ V1 `. F8 F/ Y' S) ?* }8 X% e. l9 N/ X- b
, B3 @, U$ |, f+ f, f2 } W3 \- s# Z3 i$ V, B
|
|