您好,欢迎访问三七文档
SQLServer™2005:数据挖掘1内容列表SQLServer2005:数据挖掘3实验设置4练习1:创建维度树和NaïveBayes数据挖掘模型潜力6练习2:查看挖掘精度图表17练习3:创建一个预测查询212SQLServer2005:数据挖掘注意:此实验主要关注于本单元中概念的建立,因此其中使用的配置并不一定符合微软公司相关的安全建议注意:所有SQLServer2005的实验是基于其Beta版产品的。其主要目的是为了让你对于将会发布的SQLServer产品中一些已规划的特性建立一定感性认识。如同所有的软件开发项目一样,其最终版本和beta版本在特性和用户界面上都会有一定的差别。如要了解有关SQLServer2005的最新详细信息,请访问目标:在完成了此实验手册中的实验后,你将能够:创建决策树和NaïveBayes数据挖掘模型查看挖掘精度图表创建一个预测查询了解模型时间系列估计完成此实验所需要时间:75分钟3实验室设置在这一部份,你将创建一个在剩下的实验部份中将要使用的视图任务详细步骤1.登录1.使用Administrator帐户进行登录,密码是Pass@word12.创建视图2.从Windows任务栏上选择Start|AllPrograms|MicrosoftSQLServer2005|SQLServerManagementStudio.3.在ConnecttoServer对话框中,确保在Servertype下拉列表中,DatabaseEngine已被选中.在Servername文本框中输入localhost并且在Authentication下拉列表中选择WindowsAuthentication,如图表1所示.单击Connect.图表1:连接到服务对话框4.选择File|Open|File.5.浏览到C:\SQLLabs\LabProjects\DataMiningLab\DMSetup目录并且选中文件ViewCreation.sqlfile.单击Open.6.在ConnecttoServer对话框单击Connect.7.通过按下F5键或者通过在工具栏上点击Execute图标执行脚本,如图表2所示4图表2:执行脚本8.当脚本已经成功执行,选择File|Exit菜单项来关闭SQLServerManagementStudio.5练习1创建维度树和NaïveBayes数据挖掘模型AdventureWorks公司的管理层想使用统计学的方法对消费者的数据进行分析,并且基于分析结果进行采购。分析服务通过提供以下的数据挖掘技术已经提高了数据挖掘的功能:Microsoft关联规则Microsoft聚集Microsoft决策树MicrosoftNaïveBayesMicrosoft中枢网络MicrosoftSequenceClusteringMicrosoftTimeSeries在这个练习中,你将会使用微软商业智能开发工作室(BusinessIntelligenceDevelopmentStudio)环境开发一个分析服务解决方案。商业智能开发工作室是基于MicrosoftVisualStudio2005开发环境的环境商业智能开发工作室提供给你一个在设计,测试,编辑以及部署分析服务项目的过程中需要的集成开发环境。你将可以使用决策树和NaïveBayes数据挖掘模型等技术对AdventureWorksDW消费者数据进行数据挖掘结构的建立和查看为了创建和查看数据挖掘模型,你应当:在商业智能开发工作室环境中创建一个分析服务项目创建数据源和数据源视图使用挖掘模型向导创建数据挖掘结构和决策树数据挖掘模型在挖掘模型视图中创建一个关联挖掘模型(NaïveBayes)部署分析服务解决方案使用挖掘模型查看器浏览数据挖掘模型任务详细步骤1.创建一个分析服务项目1.从Windows任务栏,选择Start|AllPrograms|MicrosoftSQLServer2005CTP|BusinessIntelligenceDevelopmentStudio.2.单击File|New|Project.3.在NewProject对话框中,找到ProjectTypes窗格,单击BusinessIntelligenceProjects文件夹.4.在Templates窗格中,单击AnalysisServicesProject图标.5.在Name文本框中,输入“DMExercise1”.6.在Location文本框中,输入C:\SQLLabs\UserProjects7.取消对CreatedirectoryforSolution选项的选择.现在新建项目对话框应当和图表1相仿.图表1:商业智能开发工作室中的新建项目对话框8.在NewProject对话框,单击OK.现在你已经创建了一个新的分析服务项目,这个项目是在一个新的解决方案(solution)中创建的,Solution是商业智能开发工作室环境中最大的单位,一个solution可以包含一个或多个的项目.一个分析服务项目是一组相关的文件,其中包含了在分析服务数据库当中所有对象的XML代码.你可以通过在商业智能开发工作室右手位置的SolutionExplorer窗格查看Solution,如果SolutionExplorer没有显示出来,你可以通过从菜单栏上的View|SolutionExplorer(或者快捷键Ctrl+Alt+L)2.设置部署模式的属性1.在SolutionExplorer窗口中,右键单击DMExercise1项目,然后从上下文菜单中选择Properties.2.找到DMExercise1PropertyPages对话框,在ConfigurationProperties文件夹的下面,单元Deployment.3.找到右边的窗格,单击DeploymentMode属性.在DeploymentMode下拉列表中,单击DeployAll,然后单击OK.你可以配置一个分析服务项目的建立,调试以及部署的属性.3.创建新的数据源注意:如果数据连接窗格中已经已经包括(local).AdventureWorksDW,就跳到第11步.1.在SolutionExplorer窗格中,在DMExercise1的下面,右键单击DataSources文件夹,然后从上下文菜单中选中NewDataSource2.在DataSourceWizard对话框中,在WelcometotheDataSourceWizard页面,单击Next.3.在Selecthowtodefinetheconnection页,确保Createadatasourcebasedonanexistingornewconnection选项钮7被选中单击New.4.在ConnectionManager对话框中,找到页顶部的Provider下拉组合框在其中再找到.NetProviders文件夹从中选择SqlClientDataProvider.5.在Servername下拉列表中,输入“localhost”.6.在Logontotheserver框中,单击UseWindowsAuthentication.7.在Selectorenteradatabasename下拉列表中,单击AdventureWorksDW.8.单击TestConnection按钮.9.单击OK关闭掉消息对话框.10.在ConnectionManager对话框中,单击OK11.在DataSourceWizard对话框,在Selecthowtodefinetheconnection页上确认localhost.AdventureWorksDW已被选中,然后单击Next.12.在CompletingtheWizard页上,保持默认的数据源名称AdventureWorksDW不变,然后单击Finish.你已经对如何连接到想使用的数据库建立了描述的信息,下面就要定义你想在这个solution中使用的架构信息了。你将通过DataSourceView做到这一点4.创建数据源视图(DataSourceView)注意:在第3步,分析服务将花一点的时间去读取数据库架构.注意:你可能需要展开Name列,或者整个的对话框,以便看到并选择vDMLabCustomerTrain.注意:在第7步之后,分析服务需要花上一点时间去读取数据1.在SolutionExplorer窗格中,在DMExercise1数据库的下面,右键单击DataSourcesView文件夹,然后从上下文菜单中选中NewDataSourceView.2.在DataSourceViewWizard对话框中,在WelcometotheDataSourceViewWizard页上,单击Next.3.在SelectDataSource页上,找到Relationaldatasources窗格,确认AdventureWorksDW已被选中,然后单击Next.4.在这个项目中,你的数据源视图并不是基于一个表的;相对的,它是基于一个视图的.在SelectTablesandViews页上,双击vDMLabCustomerTrain来将这个表添加到被包含的对象列表中.5.单击Next.6.在CompletingtheWizard页上,找到Name文本框,输入Customers,然后单击Finish.此时DataSourceView设计器将会打开.DataSourceView设计器会将你已经定义的数据架构的以图形化的方式呈现出来.7.右键单击vDMLabCustomerTrain表然后单击ExploreData,如图表2所示.8图表2:浏览数据8.如此会打开一个新的属性页,你可以在其中看到这个表的数据.如果你愿意的话,也可以将这个新的属性页放置到一个可接入的浮动窗口中去.你可以通过右键单击属性页的头部然后选择Floating或Dockable来完成操作.9.找到ExplorevDMLabCustomerTrainTable窗口,拖动滚动条以查看数据,然后点击右上角的X,如图表3所示,然后关闭窗口.图表3:浏览表的窗口一个数据源视图包含了数据源架构信息.正如这里显示的,你不仅仅可以看到基于表的数据源视图,也有基于视图的.5.创建一个数据挖掘结构注意:CustomerKey,FirstName,和LastName列不应象Input或者Predictable列那样选取.1.在SolutionExplorer窗格中,在DMExercise1数据库下面,右键单击MiningStructures文件夹,然后从上下文菜单中选择NewMiningStructure.2.找到DataMiningWizard,在WelcometotheDataMiningWizard页上单击Next.挖掘模型向导是所有数据挖掘操作的开始点3.在SelecttheDefinitionMethod页上,单击Fromexistingrelationaldatabaseordatawarehouse然后单击Next.4.在SelecttheDataMiningTechnique页上,找到Whichdataminingtechniquedoyouwanttouse?下拉列表,确认MicrosoftDecisionTrees已被选中,然后单击Next.5.在SelectDataSourceView页上,找到Availabledatasourceviews窗格,确认Customers数据源视图已被选中,然后单击Next.6.在SpecifyTableTypes页上,找到Inputtables窗格,在vDMLabCustomerTrain行中,确认Case复选框已被选中,然后单击Next.7.在SpecifytheTrainingData页上,找到Miningmodelstructure窗格,如图表4所示,选择或取消对单元格的选择.9
本文标题:SQL数据挖掘
链接地址:https://www.777doc.com/doc-4942186 .html