您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 数据仓库与数据挖掘实验报告-
《数据挖掘》大作业院(系)名称:信息技术学院专业年级:11级网络工程(物联网方向)学号:111124092学生姓名:朱玉I目录目录.....................................................................................................................................I第1章数据仓库和数据挖掘简介......................................................................................11.1数据简介.............................................................................................................................................11.2数据挖掘技术.....................................................................................................................................1第2章创建数据仓库..........................................................................................................22.1数据....................................................................................................................................................22.1.1数据属性结构........................................................................................................................................22.1.2数据库的相关处理................................................................................................................................32.1.3实验的开发平台....................................................................................................................................32.2数据库的结构模块简介....................................................................................................................3第3章数据挖掘过程..........................................................................................................33.1关联规则............................................................................................................................................33.1.1关联规则挖掘过程图解.........................................................................................................................33.1.2决策树挖掘过程图解...........................................................................................................................243.1.3聚类分析挖掘过程图解.......................................................................................................................263.2数据集挖掘结果..............................................................................................................................283.2.1超市交易关联规则的挖掘结果...........................................................................................................283.2.2影响小学生自控能力调查数据集决策树的挖掘结果.......................................................................313.2.3影响小学生自控能力因素调查数据集聚类分析的挖掘结果............................................................33第四章数据仓库和数据挖掘总结....................................................................................384.1关联规则总结...................................................................................................................................384.2决策树总结.......................................................................................................................................384.3聚类分析总结...................................................................................................................................401第1章数据仓库和数据挖掘简介1.1数据简介我的数据集是由两个不同的数据库组成,因为做关联规则的时候,影响小学生自控能力的因素分析调查分析数据库,不具备关联规则一对多的条件,因此,我用了课本上的的超市交易数据集。所以做关联规则的超市数据集,在这里我就不多介绍了。做决策树,聚类分析所用的数据集影响小学生自控能力的因素分析调查分析数据库主要父母文化程度,家庭经济状况,教师要求,民族,年纪,年龄,师生关系,是否单亲,是否是独生子女,兴趣,性别,姓名,学号,性格,自控能力属性组成。此表是用来调查影响小学生自控能力的因素有哪些。此数据集做决策树的目的是,可以根据小学生的基本情况大致了解他的自控能力。此数据集做聚类分析,可以从中挖掘出小学生基本情况的分类。1.2数据挖掘技术关联规则、决策树、聚类分析。2第2章创建数据仓库2.1数据2.1.1数据属性结构如表2-1、2-2所示。表2-1超市数据交易表表2-2影响小学生自控能力的因素分析调查表32.1.2数据库的相关处理1.创建数据库2.数据集导入3.设置主键4.创建数据库关系图2.1.3实验的开发平台1.实验设备:PC2.主要开发软件:SQLSever20053.辅助软件:Office2.2数据库的结构模块简介本数据库有两个数据集组成,超市交易数据集和影响小学生自控能力的因素分析调查表两个数据集。超市交易中有ID和Items两个属性;影响小学生自控能力的因素分析调查表数据集中有年级、学号、姓名、年龄、性别、民族、是否单亲、是否独生子女、父母文化程度、家庭经济状况、是否为班委、教师要求、师生关系、兴趣、性格、自控能力等属性。第3章数据挖掘过程3.1关联规则3.1.1关联规则挖掘过程图解1.商业智能项目创建过程图解42.数据源的创建过程图解567893.数据源视图创建过程图解101112134.数据集挖掘结构创建过程图解1415161718192021225.设置算法参数6.处理挖掘结构过程图解23243.1.2决策树挖掘过程图解决策树的挖掘过程与关联规则基本上相同,但有些是不同的,因此,我把不同过程的图解在下面给出。1.创建挖掘结构过程中挖掘数据所用的列的选项252.算法参数设置263.1.3聚类分析挖掘过程图解聚类分析的挖掘过成与决策树、关联规则也基本上相同,因此,我把不同过程的图解和决策树一样也在下面给出。1.挖掘数据集时所用到的属性272.算法参数设置283.2数据集挖掘结果3.2.1超市交易关联规则的挖掘结果1.项集292.钻取3.规则304.依赖关系网络313.2.2影响小学生自控能力调查数据集决策树的挖掘结果1.决策树2.依赖关系网络32333.2.3影响小学生自控能力因素调查数据集聚类分析的挖掘结果341.分类关系图2.分类剖面图353.分类特征364.分类对比3738第四章数据仓库和数据挖掘总结4.1关联规则总结从超市交易数据集中能挖掘到:能够推测到顾客买商品的时候,大概会买那些商品。比如根据下图:从此挖掘结果中能够看到,顾客买cream也可能会买bread。4.2决策树总结从影响小学生自控能力因素调查表数据集中能够挖掘出:小学生的自控能力与哪些因素有关联,关联是否很强,或者根据小学生的基本情况大概能判断出小学生的自控能力的倾向。比如一下几个图:39从以上几个图片可以看出,影响小学生的自控能力的因素有兴趣、父母文化程度、年级、家庭经济情况、性别、是否是独生子女、教师要求、是否为班委,影响小学生自控能力的最强因素40是兴趣因素,最弱的是性别。4.3聚类分析总结从影响小学生自控能力因素调查表数据集中能够挖掘出:影响小学生自控能力的调查对象中的基本分类,还有分类中的倾向。
本文标题:数据仓库与数据挖掘实验报告-
链接地址:https://www.777doc.com/doc-26934 .html