您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 数据仓库与数据挖掘实验指导书
实验一、DTS的使用一、实验目的:1、了解MSSQLServer2000的安装,熟悉MSSQLServer2000数据库的使用环境2、理解数据库和数据仓库的关系,为数据仓库建立数据库3、熟练使用MSSQLServer2000的DTS,能够将各种数据源的数据按照数据仓库设计的要求导入到数据仓库二、实验内容:1、熟悉MSSQLServer2000数据库和表的基本操作。2、为数据仓库建立新的数据库Mynorthwind。3、使用DTS导入TXT文本文件到Mynorthwind。4、使用DTS导入Access数据库到Mynorthwind。5、使用DTS导入Excel文件到Mynorthwind。6、使用DTS从Northwind导出Products和Categories两个表到Mynorthwind。7、使用DTS查询导入,从Northwind导出Employees表到Mynorthwind,并将源表中firstname和lastname列合成一个列fullname。8、使用DTS的查询导入,从Northwind导出Orders表到Mynorthwind为Dates表,并将源表Orders表中OrderDate一列分成年、月、日、周、季五列,同时保留OrderDate一列。9、使用DTS的查询导入,从Northwind导出OrderDetails表到Mynorthwind为Facts表。首先用Select语句将产品类别编号和员工编号等从各自表中取出,其次计算合计列值,计算方法为单价*(1-折扣)*数量,然后将OrderDetails表的内容复制到Facts表各列。三、实验步骤:1、启动MicrosoftSQLServer2000“服务管理器”,打开“企业管理器”,在出现的“SQLServerEnterpriseManager”窗口中,单击加号找到数据库,右键选择“新建数据库…”,打开对话框如图1.1所示,输入数据库名:Mynorthwind,点击确定完成创建。2图1.1“新建数据库…”对话框2、在新建的Mynorthwind数据库上点击右键,选择“所有任务”—“导入数据”,打开“DTS导入/导出向导”对话框,如图1.2所示。3图1.2“DTS导入/导出向导”对话框3、点击图1.2对话框中“下一步”,打开新的对话框如图1.3所示。根据导入数据源的不同格式在对话框下拉菜单中选择不同的“数据源”,如:“文本文件”、“MicrosoftAccess”或“MicrosoftExcel97-2000”等。选定“数据源”后,点击“文件名”文本框后对应“...”按钮,选择需要导入的文件,点击“下一步”,保持默认设置不变直到最后完成导入。4图1.3“选择数据源”对话框4、在图1.3中选定“数据源”为“用于SQLServer的MicrosoftOLEDB提供程序”,在“数据库”下拉菜单中选择源数据库为“Northwind”,点击“下一步”,确定目的“数据库”为“Mynorthwind”,点击“下一步”。对于简单的表格导出/导入操作,选择“从源数据库复制表和视图”,并按提示完成导出/导入。对于查询导入选择“用一条查询指定要传输的数据”,打开新的对话框如图1.4所示,输入需要实现的查询命令。5图1.4查询导出/导入对话框四、注意事项:1、观察数据库中数据字典的形式。2、导入TXT文件时,中文输入法输入的符号不能作为分隔符使用。五、思考与练习:1、数据仓库与数据库的关系。2、向数据仓库导入数据的时候将日期分为年、月、日、季的作用是什么?6实验二、数据备份还原和OLAP数据源的建立一、实验目的:1、熟悉AnalysisService的使用环境2、掌握数据仓库的备份和还原操作,能够为AnalysisService的OLAP分析建立数据库和数据源二、实验内容:1、安装AnalysisService组件,熟悉AnalysisService包含的基本内容和操作环境2、还原实验用数据库insur,熟悉数据库的表结构和数据记录3、在AnalysisService中建立新的分析数据库——人寿保险实验,把insur设为数据源4、在AnalysisService中浏览人寿保险实验的元数据和多维数据5、在AnalysisService中备份人寿保险实验为d:\my\insur.cab6、删除现有人寿保险实验,还原备份数据库为人寿保险实验三、实验步骤:1、启动MicrosoftSQLServer2000“服务管理器”,打开“企业管理器”,在出现的“SQLServerEnterpriseManager”窗口中,单击加号找到数据库,右键选择“所有任务”—“还原数据库…”,打开对话框如图2.1所示,输入“还原为数据库”名称为“insur”,选择“从设备”还原。7图2.1“还原数据库”对话框2、点击“选择设备”在弹出的对话框中选择“添加…”,在弹出的对话框中查找对应的数据库备份文件“insur”,确定后返回到图2.1对话框,点击“选项”选项卡打开对话框如图2.2所示。选中“在现有数据库上强制还原”,修改“移至物理文件名”内容为本地计算机上的正确路径,点击确定完成还原,还原后浏览“insur”数据库中的表,理解表的用途和表之间的关系。8图2.2“还原数据库”对话框3、启动“AnalysisManager”,如图2.3所示。图2.3打开“AnalysisManager”4、在“服务管理器”图标上点击右键选择“新建数据库…”,打开对话框输入数据库名称为“人寿保险实验”,完成分析数据库的创建。点击打开新建的数据库,在“数据源”上点击右键选择“新数据源…”打开“数据链接属性”对话框,选择希望连接的数据为“MicrosoftOLEDBProviderforSQLServer”,点击9“下一步”打开对话框如图2.4所示,分别点击下拉菜单选择对应的服务器名称和服务器上的数据库的名称,点击确定完成数据源的连接。图2.4“连接数据源”对话框5、点击“数据源”对应的“元数据”选项卡,查看元数据的格式和内容。当前数据库意外丢失,或在公共环境下上机无法正常存档需要备份和还原分析数据库。在“人寿保险实验”上点击右键选择“将数据库存档…”,打开对话框如图2.5所示。设置本地计算机的合适的保存路径,生成备份文件为“人寿保险实验.CAB”,现有数据库删除后可以还原此数据库。10图2.5备份数据库对话框四、注意事项:1、备份数据库时要注意路径的选择。2、AnalysisService中无法浏览数据的话安装MicrosoftSQLServer补丁软件SP4。3、SqlServer2000中还原数据库时注意选择从设备还原,找到备份的路径,设定还原后的路径。五、思考与练习:1、SqlServer2000中的数据库与“设置聚合选项”对话框AnalysisService中数据库的区别。11实验三、维度的创建一、实验目的:1、理解维度的基本概念2、掌握时间维度、标准维度等维度的创建方法二、实验内容:1、选择数据库中的“保单”表中的“时间”属性,建立“时间”维度,分为:年、季度、月、日四个层次2、选择数据库中的“收付费类型明细”表,选择“收付费”,建立单一层次的标准维度“收付费类型”3、选择数据库中的“投保人类型险种分类”表,建立多层次标准维度“险种_投保人类型分类”,包括:投保人类型、险种名称两个层次(注意层次的先后关系)4、选择数据库中的“机构区域分类”、“机构细分”、“机构业务员”表,选择“区域分类”、“机构名称”、“业务员名称”,建立多重关系型标准维度“区域_机构_业务员”(注意:维度向导中选择的是雪花架构)5、编辑建立的维度,在“收付费类型”维度中添加两个层次:收付费归并类型、收付费明细类型表示三、实验步骤:1、创建“时间”维度(1)在“AnalysisManager”窗口中点击“人寿保险实验”左边的加号,在列表项中的“共享维度”上点击右键选择“新建维度”,选择“向导…”,点击“下一步”打开“选择维度的创建方式”对话框,如图3.1所示。12图3.1“选择维度的创建方式”对话框(2)选择默认的“星型架构”,点击“下一步”出现“选择维度表”对话框,在“可用的表”中选择“保单”,对应可以看到字段信息和“浏览数据”,如图3.2所示。13图3.2“选择维度表”对话框(3)点击“下一步”,打开“选择维度类型”对话框,选择“时间维度”,在下拉菜单中选择“时间列”为“时间”,如图3.3所示。14图3.3“选择维度类型”对话框(4)点击“下一步”,弹出“创建时间维度级别”对话框,选择时间级别为“年、季度、月、日”,如图3.4所示。15图3.4“创建时间维度级别”对话框(5)点击“下一步”保持“选择高级选项”默认设置,点击“下一步”,打开“完成”对话框,在“维度名称”中输入“时间”,可以同时看到“时间”维度的层次数据,如图3.5所示,点击“完成”创建。。16图3.5“完成”对话框2、建立“收付费类型”维度(1)与上面建立“时间”维度步骤类似,将3.2图中选择的表改为“收付费类型明细”,点击“下一步”,打开“选择维度的级别”对话框,选择“维度级别”为“收付费”,如图3.6所示。17图3.6“选择维度的级别”对话框(2)点击“下一步”保持“指定成员键列”默认设置,点击“下一步”保持“选择高级选项”默认设置,点击“下一步”打开“完成”对话框,在“维度名称”中输入“收付费类型”,点击“完成”创建。3、建立多层次标准维度“险种_投保人类型分类”(1)与上面建立“时间”维度步骤类似,将3.2图中选择的表改为“投保人类型险种分类”,点击“下一步”,打开“选择维度的级别”对话框,依次选择“维度级别”为“投保人类型”和“险种名称”两个层次,如图3.7所示。18图3.7“选择维度的级别”对话框(2)点击“下一步”保持“指定成员键列”默认设置,点击“下一步”保持“选择高级选项”默认设置,点击“下一步”打开“完成”对话框,在“维度名称”中输入“险种_投保人类型分类”,点击“完成”创建。4、建立多重关系型标准维度“区域_机构_业务员”(1)在图3.1中选择“雪花架构:多个相关维度表”,点击“下一步”,在图3.2中选择“机构区域分类”、“机构细分”、“业务员”三个表,点击“下一步”打开“创建和编辑联接”对话框,如图3.8所示。19图3.8“创建和编辑联接”对话框(2)点击“下一步”,打开“选择维度的级别”对话框,依次选择维度字段“区域分类”、“机构名称”、“业务员名称”,如图3.9所示。20图3.9“选择维度的级别”对话框(3)点击“下一步”保持“指定成员键列”默认设置,点击“下一步”保持“选择高级选项”默认设置,点击“下一步”打开“完成”对话框,在“维度名称”中输入“区域_机构_业务员”,点击“完成”创建。5、编辑建立的维度(1)在“收付费类型”维度上点击右键选择“编辑…”,打开“维度编辑器”,在“收付费”上点击右键选择“新建级别…”,如图3.10所示。21图3.10“维度编辑器”窗口(2)在弹出的“插入级别”对话框中依次选择“收付费归并类型”、“收付费明细类型表示”,点击确定完成编辑。四、注意事项:1、首先熟悉insur数据库中的表,了解各个表的用途和相互之间的联系。2、建立多重标准维度时注意维度的显示,可以拖动维度以便正确显示连接关系。五、思考与练习:1、观察维度数据,理解维度的原理和作用。2、维度是否可以随时添加。22实验四、多维数据集的创建一、实验目的:1、理解多维数据集的基本概念2、掌握基本多维数据集的建立和编辑过程二、实验内容:1、建立“保单数据分析”多维数据集2、加入“时间”、“收付费类型”、“险种_投保人类型分类”、“区域_机构_业务员”维度3、插入“中间表”,连接事实表和各维度表4、保存并处理多维数据集三、实验步骤:1、在“人寿保险实验”中右键点击“多维数据集”,选择“新建多维数据集”—“向导…”,打开“多维数据集向导”对话框,选择事实表为“保单”,如图4.1所示。图4.1“多维数据集向导”对话框232、点击“下一步”,打开度量值选
本文标题:数据仓库与数据挖掘实验指导书
链接地址:https://www.777doc.com/doc-26939 .html