您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 3115001492..张思明数据挖掘实验报告6-11
《数据挖掘与应用》实验报告6到11章学院自动化专业物联网工程年级班别2015物联网4班学号3115001492学生姓名张思明指导教师董延峰实验6数据挖掘的基本数据分析一、实验目的(1)熟悉基本数据分析的处理流程(2)进一步熟练掌握SPSSModeler工具的操作二、实验环境(1)相关智能算法的基本原理(2)IBMSPSSModeler软件三、实验内容及步骤1、数据的质量探索(1)建立数据流a、创建“Statistics”节点,读入telco.sav数据。b、创建“类型”节点,说明各变量角色,其中“流失”为目标变量。c、创建“数据审核”节点并连接在适当的位置,进入编辑界面,在“质量”选项卡下,选择检测方法为平均值的标准差。(2)结果输出2、基本描述分析(1)建立数据流,创建“统计量”节点。(2)设置相关参数a、设置“统计量”节点,在“检查”中添加开通月数、基本费用、免费部分和无线费用。b、在“相关”中添加年龄、收入和家庭人数。c、在“相关选择”中选择“按重要性定义相关强度”。(3)结果3、绘制散点图(1)构建数据流,创建“图”节点。(2)设置参数a、编辑“图”节点b、在“X字段”和“Y字段”中分别选择“基本费用”和“年龄”。将“交叉字段”中的“颜色”设置为“流失”,不同颜色表示流失变量不同取值的样本点。(3)结果输出4、两分类变量相关性的研究(1)设置相关参数。创建“网络”节点,在“字段”中选择“套餐类型”和“流失”,设置线值为“绝对值”。(2)结果输出5、变量重要性分析(1)窗口设置。创建“特征选择”节点,编辑,将“流失”添加到目标选项中,其他的全部作为输入。(2)结果输出总的图:实验7统计分析:逻辑回归一、实验目的SPSSModeler的Logistic回归的方法。(1)了解和熟悉SPSSModeler及其相关知识。(2)掌握SPSSModeler工具建立多项Logistic回归的方法。(3)学会运用SPSSModeler进行多项Logistic回归的内容。二、实验环境一台装有SPSSModeler软件系统的计算机。三、实验内容及步骤1、构建多项Logistic回归数据流(1)通过“Statistics文件”节点读入Brand.sav。(2)数据流中添加“类型”节点。(3)在“建模”模块下选择“Logistic”节点连接在数据流中恰当的位置。(4)运行结果:2、设置相关参数(1)右击“类型”节点,将x3设置为目标,其他保持不变。(2)设置“Logistic”节点,在模型下,将使用分区数据勾选为“无”,采用的过程选择“多项式”,“多项式过程”中“方法”采用“进入法”,其他保持不变。3、结果运行总的图:实验8关联分析:关联规则一、实验目的(1)了解和熟悉SPSSModeler及其相关知识。(2)掌握SPSSModeler工具建立Apriori关联规则的方法。(3)学会运用SPSSModeler关联规则进行相关的内容分析。二、实验环境一台装有SPSSModeler软件系统的计算机。三、实验内容及步骤1、创建Apriori算法数据流(1)创建“可变文件”节点读入BASKETS.txt文件。(2)在数据流的适当位置创建“Apriori”节点。(3)运行结果2、设置相关参数(1)在“字段”下,选择“使用定制设置”选项。在“后项”和“前项”中选择关联规则的后项和前项的变量。此例中后项和前项均为所有商品。(2)在“类型”下,指定当前前项最低条件支持度,默认值10%;最小规则置信度,默认值为80%;最大前项数,默认为5;勾选“仅包含标志变量的真值”。(3)在“专家”下,选择模式“专家”选项,并选择评价关联规则的度量指标,这里选择默认选项“规则置信度”。3、结果运行4、考察关联规律(1)将Apriori节点中的模型计算的结果添加到数据流编辑区域的恰当位置。(2)点击鼠标右键编辑。(3)“最大预测数”中输入数值。(4)勾选“忽略不匹配篮项目”和“检测不在篮中”。通过“表”观察具体的结果如图:总的图:实验9分类分析:决策树一、实验目的SPSSModeler的决策树(1)了解和熟悉SPSSModeler及其相关知识。(2)掌握SPSSModeler工具建立CHAID决策树的方法。(3)学会运用SPSSModeler决策树进行相关的内容分析。二、实验环境一台装有SPSSModeler软件系统的计算机。三、实验内容及步骤1、构建CHAID数据流(1)通过“Statistic文件”节点读入“telco.sav”文件。(2)数据流中添加“分区”节点,将样本集划分为训练集和测试集。(3)选择建模中的“CHAID”节点,连接到数据流的恰当位置。2、设置相关参数(1)在“构建选项”——“基本(B)”,选择树的生长算法为穷举CHAID。自定义最大树状图深度为5.(2)其他相关参数的设置默认。3、结果运行实验10聚类分析:K-Means一、实验目的SPSSModeler的聚类分析(1)了解和熟悉SPSSModeler及其相关知识。(2)掌握SPSSModeler工具建立Apriori关联规则的方法。(3)学会运用SPSSModeler关联规则进行相关的内容分析。二、实验环境一台装有SPSSModeler软件系统的计算机。三、实验内容及步骤1、创建K-Means聚类数据流(1)创建“Statistic文件”节点导入K-Means.sav。(2)在“字段选项”——“类型”节点中,设置“地区”角色为“无”。(3)创建“K-Means”节点,连接到恰当的位置。2、设置相关参数(1)进入编辑界面。(2)在“模型”模块下指定聚类数目为4,勾选“生成距离字段”和“数值”选项。(3)在“专家”模块下,勾选“模式”下的“专家”选项,其他默认。3、结果运行总的:实验11预测分析:人工神经网络一、实验目的SPSSModeler的聚类分析(1)了解和熟悉SPSSModeler及其相关知识。(2)掌握该工具建立B-P反向传播网络的方法。(3)学会运用B-P反向传播网络进行相关的内容分析。二、实验环境一台装有SPSSModeler软件系统的计算机。三、实验内容及步骤1、创建K-Means聚类数据流(1)通过“Statistic文件”节点读入telco.sav。(2)添加“分区”节点,将样本集划分为训练集和测试集体。(3)在“建模”下选择“神经网络”节点连接到数据流恰当的位置。2、设置相关参数(1)在“神经网络”节点的“选项”下,勾选“显示反馈图形”。(2)在“模型”下,勾选“使用分区数据”和“为每个分割构建模型”;选择“快速”方法;停止采用“默认值”。3、结果运行总的图:
本文标题:3115001492..张思明数据挖掘实验报告6-11
链接地址:https://www.777doc.com/doc-6756665 .html