EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
Matlab关于Apriori算法设计
0 t! |3 q8 m. E, o8 [! I' G5 _8 M+ {0 h6 Z" E- T1 v- X9 u1 c
1、Apriori算法实现步骤:Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法Apriori使用一种称作逐层搜索的迭代方法,“K-1项集”用于搜索“K项集”。 首先,找出频繁“1项集”的集合,该集合记作L1。L1用于找频繁“2项集”的集合L2,而L2用于找L3。如此下去,直到不能找到“K项集”。找每个Lk都需要一次数据库扫描。 核心思想是:连接步和剪枝步。连接步是自连接,原则是保证前k-2项相同,并按照字典顺序连接。剪枝步,是使任一频繁项集的所有非空子集也必须是频繁的。反之,如果某 个候选的非空子集不是频繁的,那么该候选肯定不是频繁的,从而可以将其从CK中删除。 简单的讲,1、发现频繁项集,过程为(1)扫描(2)计数(3)比较(4)产生频繁项集(5)连接、剪枝,产生候选项集 重复步骤(1)~(5)直到不能发现更大的频集 6 j' U3 r2 Q! v* _8 s
5 q0 G( E& J' _8 \, }3 Y |