您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 15数据仓库与数据挖掘技术 第五章 关联规则
第5章关联规则方法5.1关联规则的概念和分类5.1.1关联规则的概念5.1.2关联规则的分类1.基于规则中处理的变量类别分类2.基于规则中数据的抽象层次分类3.基于规则中涉及的数据维数分类4.基于模式与规则之间的相互关系分类5.2Apriori算法5.2.1产生频繁项集1.求频繁1项集L12.求频繁k+1项集Lk+1(即执行apriori-gen(Lk))图5-1示例数据库数据仓库与数据挖掘技术5.2.2产生频繁项集的实例1.第1次迭代,产生频繁1-项集3.第3次迭代,产生频繁3-项集数据仓库与数据挖掘技术5.2.3从频繁项集产生关联规则数据仓库与数据挖掘技术5.3FP-Growth算法5.3.1FP-Growth算法计算过程图5-2示例数据库图5-3FP-tree5.3.2FP-Growth算法示例图5-4I5的条件模式树数据仓库与数据挖掘技术5.4利用SQLServer2005进行关联规则挖掘1.数据准备图5-5客户基本情况表图5-6贷款余额表图5-7合并表数据数据仓库与数据挖掘技术图5-8合并产生的表2.实现挖掘任务图5-9启动MicrosoftVisualStudio图5-10新建AnalysisServices项目数据仓库与数据挖掘技术图5-11AnalysisServices项目信息图5-12新建数据源视图图5-13数据源视图向导数据仓库与数据挖掘技术图5-14选择数据源图5-15选择表和视图数据仓库与数据挖掘技术图5-16命名数据源视图图5-17数据源视图具体信息图5-18新建挖掘结构数据仓库与数据挖掘技术图5-19数据挖掘向导欢迎界面图5-20选择创建挖掘结构所用的方法数据仓库与数据挖掘技术图5-21选择挖掘结构所用的数据挖掘技术图5-22选择数据源视图图5-23指定表类型数据仓库与数据挖掘技术图5-24指定列图5-25指定列内容和数据类型数据仓库与数据挖掘技术图5-26为挖掘结构命名图5-27挖掘模型数据仓库与数据挖掘技术图5-28设置算法参数图5-29参数设置数据仓库与数据挖掘技术图5-30启动部署图5-31显示部署进度数据仓库与数据挖掘技术图5-32处理挖掘结构和所有模型图5-33选择挖掘结构数据仓库与数据挖掘技术图5-34处理成功3.查看挖掘结果图5-35加载挖掘模型进度图5-36查看项集数据仓库与数据挖掘技术图5-37设定支持度和项集尺寸图5-38查看规则数据仓库与数据挖掘技术图5-39显示依赖关系图5-40查找感兴趣的结点数据仓库与数据挖掘技术图5-41“房地产开发”的关系网络图5-42选择事例表数据仓库与数据挖掘技术图5-43选择可预测列图5-44显示提升图数据仓库与数据挖掘技术图5-45显示分类矩阵习题51.说明关联规则挖掘的目的和作用。2.简要说明在频繁模式发现技术中,产生候选项集和不产生候选项集两种技术各自的特点和优缺点。3.图5-1所示的数据库,如果分别设定最小支持度s=10%和s=40%,置信度c=70%,计算该示例数据库中的频繁项集和规则。4.根据图5-3所示的FP-tree,找出以I4,I3,I1,I2为后缀的频繁模式。5.根据图5-3所示的FP-tree,找出其中所有的关联规则及他们的置信度。6.练习使用SQLServer2005的关联规则挖掘模型。
本文标题:15数据仓库与数据挖掘技术 第五章 关联规则
链接地址:https://www.777doc.com/doc-5860596 .html