您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 70数据仓库与数据挖掘
一、实验目的熟悉和掌握MicrosoftSQLServer2005AnalysisServices(SSAS)提供的数据挖掘算法、挖掘模型查看器以及数据挖掘工具。二、实验内容1.复习教材P259的数据挖掘应用案例——生成目标邮件方案。进一步掌握使用下列算法生成的挖掘模型创建预测:(1)Microsoft决策树(2)Microsoft聚类分析(3)MicrosoftNaiveBayes2.参照微软MSDN在线教程((v=SQL.90).aspx),完成其“第3课:生成预测方案”、“第4课:生成市场篮方案”以及“第5课:生成顺序分析和聚类分析方案”的案例实践。要求掌握通过Microsoft时序算法、Microsoft关联算法以及Microsoft顺序分析和聚类分析算法生成的挖掘模型的方法。3、将上述三个案例生产的挖掘模型、图表用可视化方案导出。三、实验步骤1.准备AnalysisServices数据库2.创建数据源,连接管理器3.创建数据源向导(1)选择数据源(2)新建数据源(3)完成向导4.创建数据挖掘模型(1)在“解决方案资源管理器”中,右键单击“挖掘结构”,在弹出的快捷菜单中选择“新建挖掘结构”项。系统将打开“数据挖掘向导”(2)在“选择定义方法”窗口中,确认以选中“从现有关系数据库或数据仓库”项,单击“下一步”按钮(3)选择数据挖掘技术(4)在“选择数据源视图”窗口中,已默认选中AdventureWorksDW。在数据源视图中,单击“浏览”按钮查看各表(5)指定表类型(6)指定定型数据(7)指定列的内容和数据类型(8)完成向导5.创建Microsoft聚类分析模型(1)新建挖掘模型(2)“挖掘模型”选项卡(3)处理数据挖掘模型处理进度生成预测方案6.创建预测挖掘模型结构(1)在BusinessIntelligenceDevelopmentStudio的解决方案资源管理器中,右键单击“挖掘结构”,再选择“新建挖掘结构”。此时,系统将打开数据挖掘向导。(2)在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”(3)在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术?”选择“Microsoft时序”“选择数据源视图”页随即显示。默认情况下,“可用数据源视图”下的AdventureWorksDW为选中状态。(4)指定表类型(5)指定定型数据(6)指定列的内容和数据类型(7)完成向导7.修改挖掘结构(1)将“金额”列添加到“预测”挖掘结构(2)定义“金额”列的使用方式a.在“挖掘模型”选项卡上网格的“预测”列中,单击与“金额”行对应的单元格。此时将显示一个包含“忽略”、“输入”、“预测”和“仅预测”的列表。b.选择“预测”。现在,“金额”列既是输入列,又是可预测列。(3)更改PERIODICITY_HINT参数a在“挖掘模型”选项卡中,右键单击“预测”,再选择“设置算法参数”。此时,将打开“算法参数”对话框。b.在“值”列中,将PERIODICITY_HINT设置为{12},再单击“确定”。(4)处理挖掘模型a.在BIDevelopmentStudio的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。此时将打开“处理挖掘结构-预测”对话框。b.单击“运行”。此时,将打开“处理进度”对话框,以显示有关模型处理的信息。模型处理可能需要一些时间,具体取决于您的计算机。处理进度8.浏览预测模型(1)查看决策树a.在查看器的“决策树”选项卡的“树”列表中,选择M200Pacific:Amount模型。(2)选择时序a.切换到“挖掘模型查看器”选项卡的“图表”选项卡。b.在图表视图右侧的下拉列表框中,选中下列时序的复选框:R750Europe:AmountR750NorthAmerica:AmountR750Pacific:Amountc.单击“确定”。生成市场篮方案9.创建市场篮挖掘模型结构(1)在BusinessIntelligenceDevelopmentStudio的解决方案资源管理器中,右键单击“挖掘结构”,再选择“新建挖掘结构”。此时,系统将打开数据挖掘向导。(2)选择定义方法(3)选择数据挖掘技术(4)选择数据源视图(5)指定表类型,选中vAssocSeqOrders表旁的“事例”复选框,选中vAssocSeqLineItems表旁边的“嵌套”复选框,再单击“下一步”。(6)指定定型数据a.依次清除CustomerKey旁边的“键”复选框和LineNumber旁边的“键”和“输入”复选框。默认情况下,CustomerKey、OrderNumber以及LineNumber被列为“键”类型。但在本教程中,您将只对Microsoft顺序分析和聚类分析模型使用LineNumber作为键;您必须更改关联模型的默认设置。b.选中Model列旁边的“键”和“可预测”复选框。然后,系统也将自动选中“输入”复选框。(7)指定列的内容和数据类型(8)完成向导a.“挖掘结构名称”中,键入Association,单击“完成”。系统将打开数据挖掘设计器,显示刚刚创建的Association挖掘结构。10.修改市场篮模型(1)调整关联模型的参数a.打开数据挖掘设计器的“挖掘模型”选项卡。b.右键单击设计器网格中的“关联”列,然后选择“设置算法参数”。系统将打开“算法参数”对话框。c.在“算法参数”对话框的“值”列中,设置以下参数:MINIMUM_PROBABILITY=0.1MINIMUM_SUPPORT=0.01(2)处理挖掘模型a.在BusinessIntelligenceDevelopmentStudio的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。系统将打开“处理挖掘结构-关联”对话框。b.单击“运行”。系统将打开“处理进度”对话框,以显示有关模型处理的信息。模型处理可能需要一些时间,具体时间取决于您的计算机。c.处理完成之后,在“处理进度”和“处理挖掘结构-关联”对话框中,单击“关闭”。11.浏览市场篮模型(1)“项集”选项卡(2)“规则”选项卡(3)“相关性网络”选项卡生成顺序分析和聚类分析方案12.创建顺序分析和聚类挖掘模型结构(1)在BusinessIntelligenceDevelopmentStudio的解决方案资源管理器中,右键单击“挖掘结构”,再选择“新建挖掘结构”。系统将打开数据挖掘向导。(2)在“选择定义方法”页中,选择“从现有关系数据库或数据仓库”(3)选择数据挖掘技术“您要使用何种数据挖掘技术?”下选择“Microsoft顺序分析和聚类分析”,再单击“下一步”。“选择数据源视图”页随即显示。默认情况下,“可用数据源视图”下的AdventureWorksDW为选中状态。(4)在“指定表类型”页上,选中vAssocSeqOrders表旁的“事例”复选框,选中vAssocSeqLineItems表旁的“嵌套”复选框。单击“下一步”。(5)指定定型数据(6)指定列的内容和数据类型(7)在“完成向导”页的“挖掘结构名称”中,键入SequenceClustering。在“挖掘模型名称”中,键入SequenceClustering,再单击“完成”。此时将打开数据挖掘设计器,显示刚创建的SequenceClustering挖掘结构。13..处理挖掘模型(1)在BusinessIntelligenceDevelopmentStudio的“挖掘模型”菜单上,选择“处理挖掘结构和所有模型”。此时将打开“处理挖掘结构-顺序分析和聚类分析”对话框。(2)单击“运行”。系统将打开“处理进度”对话框,以显示有关模型处理的信息。模型处理可能需要一些时间,具体取决于您的计算机。(3).处理完成之后,在“处理进度”和“处理挖掘结构-顺序分析和聚类分析”对话框中,单击“关闭”。14.浏览顺序分析和聚类分析模型(1)分类关系图选项卡(2)分类剖面图选项卡(3)分类特征选项卡(4)分类辨别选项卡(5)状态转换选项卡
本文标题:70数据仓库与数据挖掘
链接地址:https://www.777doc.com/doc-1909555 .html