
Apriori算法是一种挖来自掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。而且算法已经被广泛的应用到商业、网络安全等各个领域。
- 中文名 关联规则算法
- 外文名 Apriori
- 释义 一种挖掘关联规则的频繁项集算法
- 适用范围 广泛的应用到商业等各个领域
算法简介
Apriori算法 是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大来自于最小支持度的项集称为频繁项集,简称频集。
算法革油夫思想
该算法的基本思想 衣元款示啊值金吸末父吃是:首先找出所有的频集,这些项集出现的频繁性至误和依械少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第360百科1步找到的频集产生期望的规则,产生只包含集合的项的所据马磁想电独课有规则,其中每一条规则的右部只造有职去带岁先道假快有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
(1) L1 = find_frequent_1-itemsets(D)弦曲;
(2) for (k=2;Lk-1 ≠Φ ;k++) {
(3) Ck = ap效衡它独美今班担掉riori_gen(Lk-1 ,min_sup看毫难注杨已和);
(4) for each 杆transaction t ∈ D {//scan D for counts
(5) Ct = subset(Ck,t);//get the subsets of t that are candi边企米岁均卫兰司dates
(6) 假渐西察起维目兰了for each candidate c ∈ Ct
(7) c.count+六刚云用早百那普翻响只+;
(8) }
白杀议跑某乱 (9) Lk ={c ∈ Ck|c.count≥min_sup}
(10) }
(11) return L= ∪ k Lk;
可能产生大量常头剂亚责掌为得假导协的候选集,以及可于能需要重复扫描数据库,是Apriori算法的两大缺点。
流程图如下:
算法应用
经来自典的关联规则数据挖掘算法Apriori 算法广泛应用于各种领域,通过对数据的关联性进行了分析和挖掘360百科,挖掘出的这些信息在决策制定过程中具有重要的参考价值。
Apriori算法广泛应用于商业中,应用于消费市场价格分析中,它能够很快的求出各种产品之间的价格关系和它们之间的影响。通过数据挖掘,市场商人可以瞄准目标客户,采用个人股票行市、最新信息、特殊的市场推广活动或其他一些特殊的信息手段,从而极大地减少广告预算和增加收入。百货商场、超市和一些老字型大小的零售店也在进行数据挖掘,以便猜测这些年来顾客的消费习惯。
Apriori算法应用长及药迅双于网络安全领域,比贵旧如网络入侵检测技术中。早期中大型的电脑系统中都收集审计信息来建立跟踪档,这些审计跟踪的目的多是为了性能测试未练逐饭善怕武七诗升收或计费,因此对攻击检测提供的有用信息比较少。它通过模式的学习和训练可以发现网络用户的异常行为模式。采用作用口凯边起皇刑日换统度的Apriori算法削弱了Apriori算法的挖掘结果规则,是网络入侵检测系统可以快速振办细宜激的发现用户的行为模式,能够快速的锁定攻击者,提高了基于关联规则的入侵检测系统的检测性。
Apriori算法应用于高校管理中。随着高校贫困生人数的不断增加,学校管理部门资助工作难度也越加增大。针对这一现象,提出一种基于数据挖掘算法的解决方法。将关联规则的Apriori算法应用到贫困助学体系中,并且针对经典Apriori挖掘算法存在的不足进行改进,先将今终滑她安色官状选事务数据库映射为一个布践致础与世立之写核草尔矩阵,用一种逐层递增的思想来动态的分配内存进行存储,们高粮际再利用向量求"与"运算,寻找秋费减章频繁项集。实验结果表明,改进后的Apriori算法在运行效率上有了很大的提升,挖掘出的规则也可以有效地辅助学校管理部门有针对性的开展贫困助学工作。
Apr础iori算法被广泛应用于移动通信领域。移动增值业务逐渐成为移动通信市场上最有活负输验的力、最具潜力、最受瞩目的业道液错已诗纸攻界到务。随着产业的复苏,越来越多的增值业务表现出强劲的发展势头,呈现出应用多元化、营销品牌化、管理集中化、合作纵深化的特点。针对这种趋势,在关联规则数据挖掘中广泛应用的Apriori算法被很多公司应用。依托某电信运营弱古供盐武长调商正在建设的增值业异背担该带丰静大口务Web数据仓库平台,对来自移动增值业务方面的饭左同死尼周著转依养调查数据进行了相关的挖掘处理,从而获得了关于用户行为特征和需求的间接反映市场动态的有用信息,这些信息在指导门织给都台说图配的运营商的业务运营和辅助业务提供商的决策言后制定等方面具有十分政亚何居重要的参考价值。