您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 数据仓库期末考试重点
OLTP(On-LineTransactionProcessing联机事务处理)DSS(决策支持系统)数据处理:操作型处理分析型处理数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。3.2数据仓库中的关键名词ETLExtraction,Transformation,Loading数据抽取数据转换数据清洗数据装载数据仓库存储:多维数据库关系型数据库前两者结合元数据:描述数据的数据数据集市:面向企业某个部门(主题)而在逻辑上或物理上划分出来的数据仓库中的数据子集OLAP:在线分析处理4.2数据粒度与数据分割粒度:综合程度样本数据库分割:将数据分散到各自的物理单元中去一遍能分别处理,提高数据处理效率,数据分割后的数据单元成为分片8.1数据存储类型虚拟存储方式基于关系表的存储方式多维数据库存储方式简单堆积文件轮转综合文件简单直接文件连续文件第二章:数据仓库模型和建立过程2.数据仓库的三级模型概念模型:从客观世界到主观认识的映射。逻辑模型:物理模型:3.1概念模型的定义和主要工作界定系统的边界确定主要的主题域信息包图3.4维度的的层次结构层次结构:维度中成员的集合以及这些成员之间的相对位置3.6度量和度量值度量值:是一组值,基于事实数据表中的一列,而且通常为数字。3.7单元单元是多维数据集的原子元素。多维数据集:包含维度和度量值的多维结构4.1逻辑模型的定义和主要工作星型模型雪花模型4.6粒度选择单一粒度双重粒度4.8增加导出字段导出字段:在原始数据的基础上进行总结或计算而生成的数据5.数据仓库物理模型5.1存储结构分布存储方式集中式数据存储方式5.2索引策略B树索引位图索引广义索引连接索引5.6数据存储策略考虑因素:数据的重要程度粒度使用频率响应时间策略:合并表数据序列按列存储分割表存储6.数据仓库设计的步骤第三章操作数据存储和数据集市5.2数据集市的定义Datamark数据集市是一种小型的部门级的数据仓库,主要面向部门级业务,并且只面向某个特定的主题,只满足特定用户需求而建立的一种分析型环境8.1从属型数据集市从属型数据集市:数据来源于企业级数据仓库,是企业级数据仓库的子集。8.2独立型数据集市独立型数据集市:数据直接来源于各操作数据环境,当为各个部门建立相关数据集市之后,这些数据集市之间相互独立,可能具有不同的数据存储类型。9.1自上而下方法9.2自下而上方法9.3混合方法第四章联机分析处理1.4OLAP特性快速性可分析性共享性多维性信息性2.1两种OLAP多维数据结构超立方结构多立方结构3.OLAP主要分析方法3.1切片和切块切片:在多维数组的某一维上选取一个值,则多维数组就从N维降为N-1维,我们称多维数组的子集为多维数组在维度i上的切片。切块:将多维数组的某一维的取值设定为一个区间的维成员的动作,3.2钻取向下钻取是从汇总数据向细节数据进行观察向上钻取是从某一维上降低层次的数据概括到高层次的汇总数据3.3旋转4OLAP分类4.1按存储方式分类:ROLAPMOLAPHOLAP按分析动作处理地点分类:ServerOLAPClientOLAP5OLAP体系结构数据仓库OLAP服务器前端展现工具6.OLAP评价准则第五章元数据元数据的重要性:合适的元数据对于使用,管理,构建数据仓库是绝对必要的元数据是神经中枢元数据对IT人员和最终用户重要驱动数据仓库的处理过程建立信息上下文按功能区分的元数据类型数据获取数据存储信息传递商业元数据技术元数据如何提供元数据常见的元数据来源:源系统数据抽取数据转换和清洗数据装载数据存储信息传递第六章数据仓库部署部署的主要任务:完成用户认可执行初始装载准备好用户界面完成初始用户培训建立初始用户支持按阶段部署领航系统的类型:概念证明技术证明综合测试用户工具认定广泛业务可扩展种子第七章数据仓库升级与维护监视用的统计数据收集为升级而使用统计数据为优化使用统计数据用户培训和支持管理数据库
本文标题:数据仓库期末考试重点
链接地址:https://www.777doc.com/doc-4989832 .html