如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
频繁模式及关联规则(guīzé)挖掘技术内容(nèiróng)提纲关联(guānlián)规则简介什么是关联规则(guīzé)挖掘频繁(pínfán)模式挖掘的重要性关联规则(guīzé)基本模型关联规则基本(jīběn)模型关联规则(guīzé)基本模型(续)关联(guānlián)规则基本模型(续)规则(guīzé)度量:支持度与可信度关联(guānlián)规则基本模型(续)Letmin_support=50%,min_conf=50%:AC(50%,66.7%)CA(50%,100%)ForruleAC:support=support({A}{C})=50%confidence=support({A}{C})/support({A})=66.6%Apriori算法(suànfǎ)的步骤频繁(pínfán)项集关联规则(guīzé)的性质:Apriori算法(suànfǎ)实例(shílì)VisualizationofAssociationRules:PaneGraphVisualizationofAssociationRules:RuleGraph提高(tígāo)Apriori算法的方法关联(guānlián)规则挖掘算法用Frequent-Patterntree(FP-tree)结构压缩数据库,高度浓缩,同时对频繁集的挖掘又完备的避免代价较高的数据库扫描开发一种高效的基于FP-tree的频繁集挖掘算法(suànfǎ)采用分而治之的方法学:分解数据挖掘任务为小任务避免生成关联规则:只使用部分数据库!{}完备:不会打破交易中的任何模式包含了频繁模式挖掘所需的全部信息紧密去除不相关信息—不包含非频繁项支持度降序排列:支持度高的项在FP-tree中共享的机会也高决不会比原数据库大(如果不计算树节点(jiédiǎn)的额外开销)基本思想(分而治之)用FP-tree递归增长频繁集方法对每个项,生成它的条件模式库,然后是它的条件FP-tree对每个新生成的条件FP-tree,重复这个步骤直到结果FP-tree为空,或只含唯一(wéiyī)的一个路径(此路径的每个子路径对应的项集都是频繁集)为FP-tree中的每个节点生成条件模式库用条件模式库构造对应的条件FP-tree递归构造条件FP-trees同时增长其包含的频繁集如果条件FP-tree只包含一个路径(lùjìng),则直接生成所包含的频繁集。如果条件FP-tree包含多个路径(lùjìng),则采用混合的方法从FP-tree的头表开始按照每个频繁项的连接遍历FP-tree列出能够到达此项的所有前缀路径,得到条件(tiáojiàn)模式库Node-linkpropertyForanyfrequentitemai,allthepossiblepatternscontainingonlyfrequentitemsandaicanbeobtainedbyfollowingai’snode-links,startingfromai’sheadinthefp-treeheader.PrefixpathpropertyTocalculatethefrequentpatternswithsuffixai,onlytheprefixsubpathesofnodeslabeledaiintheFP-treeneedtobeaccumulated,andthefrequencycountofeverynodeintheprefixpathshouldcarrythesamecountasthatinthecorrespondingnodeaiinthepath.对每个模式库计算库中每个项的支持度用模式库中的频繁(pínfán)项建立FP-treeEmpty{}关联规则价值(jiàzhí)衡量与发展规则(guīzé)价值衡量系统(xìtǒng)客观层面用户(yònghù)主观层面关联(guānlián)规则新进展关联(guānlián)规则新进展(续)关联(guānlián)规则新进展(续)关联(guānlián)规则新进展(续)关联(guānlián)规则新进展(续)关联(guānlián)规则新进展(续)参考文献内容(nèiróng)总结