您好,欢迎访问三七文档
数据仓库概念汇总目录一、术语.......................................................................................................................................................................3二、数据仓库基础.......................................................................................................................................................42.1相关概念.........................................................................................................................................................42.1.1数据仓库..............................................................................................................................................42.1.2企业信息工厂......................................................................................................................................62.1.3数据集市..............................................................................................................................................62.1.4维..........................................................................................................................................................72.1.5事实表..................................................................................................................................................92.1.6操作数据存储ODS............................................................................................................................122.1.7元数据................................................................................................................................................132.1.8ETL.......................................................................................................................................................142.1.9OLAP....................................................................................................................................................172.1.10多维数据库......................................................................................................................................192.2数据仓库架构...............................................................................................................................................20一、术语BIBusinessIntelligence,即商业智能,也看到有些媒体里写作商务智能综合企业所有沉淀下来的信息,用科学的分析方法,为企业领导提供科学决策信息的过程。BOSS业务运营支撑系统:BusinessOperationsSupportSystems简称BOSSBPMBusinessPerformanceManagement(企业绩效管理),是以商业智能(BI)技术、平衡计分卡(BSC)和个人关键绩效指标(KPIs)等先进信息技术和管理理论为基础的战略管理的工具,在财务、客户、内部流程和学习与发展四个维度上进行综合绩效评测,帮助企业从整体上实现对战略实现过程的贯彻和控制。BPR业务流程重整(BusinessProcessReengineering),指利用数据仓库技术,发现并纠正企业业务流程中的弊端的一项工作。数据仓库的重要作用之一。CRMCustomerRelationshipManagement客户关系管理。CRM是选择和管理有价值客户及其关系的一种商业策略,CRM要求以客户为中心的商业哲学和企业文化来支持有效的市场营销、销售与服务流程。CUBE立方体DM(Datamart)即数据集市,或者叫做“小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。DM(DataMine)数据挖掘是一个从大型数据库中提取以前未知的,可理解的,可执行的信息并用它来进行关键的商业决策的过程。DSS决策支持系统(DecisionSupportSystem),相当于基于数据仓库的应用。决策支持就是在收集所有有关数据和信息,经过加工整理,来为企业决策管理层提供信息,为决策者的决策提供依据。DWDataWarehouse,本世纪80年代中期,“数据仓库之父”WilliamH。Inmon先生在其《建立数据仓库》一书中定义了数据仓库的概念,随后又给出了更为精确的定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。EDMEnterpriseDataModel企业数据模型ERPEnterpriseResourcePlanning企业资源规划。它是一个以管理会计为核心的信息系统,识别和规划企业资源,从而获取客户订单,完成加工和交付,最后得到客户付款。换言之,ERP将企业内部所有资源整合在一起,对采购、生产、成本、库存、分销、运输、财务、人力资源进行规划,从而达到最佳资源组合,取得最佳效益。ETL数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。KDDKDD(KnowledgeDiscoveryinDatabase)数据库中知识发现。是基于数据库的知识发现,指的是从大型数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在有用的、易被理解的模式。KPI企业关键业绩指标(KPI:KeyProcessIndication)是通过对组织内部流程的输入端、输出端的关键参数进行设置、取样、计算、分析,衡量流程绩效的一种目标式量化管理指标,是把企业的战略目标分解为可操作的工作目标的工具,是企业绩效管理的基础。LDM逻辑数据模型(LogicDataModel)MDD多维数据库(Multi-DimensionalDatabase,MDD)可以简单地理解为:将数据存放在一个n维数组中,而不是像关系数据库那样以记录的形式存放。因此它存在大量稀疏矩阵,人们可以通过多维视图来观察数据。多维数据库增加了一个时间维,与关系数据库相比,它的优势在于可以提高数据处理速度,加快反应时间,提高查询效率。MetadataMetadata(元数据),它是“关于数据的数据”在地理空间信息中用于描述地理数据集的内容、质量、表示方式、空间参考、管理方式以及数据集的其他特征,它是实现地理空间信息共享的核心标准之一。目前,国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC287)、美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC211)。MOLAP严格遵照Codd的定义,自行建立了多维数据库,来存放联机分析系统数据的ArborSoftware,开创了多维数据存储的先河,后来的很多家公司纷纷采用多维数据存储。被人们称为Multi-DimensionOLAP,简称MOLAP,代表产品有Hyperion(原ArborSoftware)Essbase、ShowcaseSTRATEGY等。ODS(OperationalDataStore)操作型数据存储,对于一些准实时的业务数据库当中的数据的暂时存储,支持一些同时关连到历史数据与实时数据分析的数据暂时存储区域。二、数据仓库基础2.1相关概念2.1.1数据仓库目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W。H。Inmon在其著作《BuildingtheDataWarehouse》一书中给予如下描述:数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。根据数据仓库概念的含义,数据仓库拥有以下四个特点:1)面向主题。传统数据库主要是为应用程序进行数据处理,未必按照同一主题存储数据;数据仓库侧重于数据分析工作,是按照主题存储的。这一点,类似于传统农贸市场与超市的区别—市场里面,白菜、萝卜、香菜会在一个摊位上,如果它们是一个小贩卖的;而超市里,白菜、萝卜、香菜则各自一块。也就是说,市场里的菜(数据)是按照小贩(应用程序)归堆(存储)的,超市里面则是按照菜的类型(同主题)归堆的。2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统
本文标题:数据仓库概念汇总
链接地址:https://www.777doc.com/doc-4845118 .html