您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 基于CWM的数据仓库体系结构设计
基于CWM的数据仓库体系结构设计我的工作提出了一个基于CWM的数据仓库体系结构基于该体系结构,参与设计和实现了一个电信综合业务信息服务平台提纲背景介绍数据仓库、元数据理论介绍CWM、MOF、UML、XMI规范介绍基于CWM的数据仓库体系结构设计电信综合业务信息服务平台设计背景介绍数据仓库的应用越来越广泛不同数据仓库工具之间无法进行数据交换企业的应用受到工具的限制利用元数据可以实现数据交换提纲背景介绍数据仓库、元数据理论介绍CWM、MOF、UML、XMI规范介绍基于CWM的数据仓库体系结构设计电信综合业务信息服务平台设计数据仓库理论数据仓库的定义数据仓库的建设数据仓库的应用国内数据仓库建设的问题元数据定义描述数据的数据研究元数据的原因管理、使用数据的需求系统分布和互通的要求元数据重用、共享的要求元数据的建模和标准化建模的两大方向元数据参考模型元数据模型标准化OMGMDC提纲背景介绍数据仓库、元数据理论介绍CWM、MOF、UML、XMI规范介绍基于CWM的数据仓库体系结构设计电信综合业务信息服务平台设计元数据的层次Student(“张东”,“男”,…)Student(“李芳”,“女”,…)……Record(“Student”,Field(“name”,String),(Field(“sex”,String)…)MetaClass(“Record”,[MetaAttr((“name”),String),MetaAttr((“fields”),listField)]MetaClass(“Field”,…)通用的元元模型信息,数据(M0)模型(M1)元模型(M2)元元模型(M3)OMG规范和元数据层次的关系元数据层次MOF术语示例M3元元模型MOF模型M2元模型,元元数据UML元模型,CWM元模型M1模型,元数据UML模型,CWM模型M0对象,数据数据仓库数据CWM和相关规范的关系CWM和MOF的关系CWM和UML的关系直接继承了UML核心元模型使用UML图形标记使用UML中的OCL(对象约束语言)CWM和XMI的关系CWM的组成CWM元模型基础包资源包分析包管理包CWMDTD和CWMXMLCWMIDL提纲背景介绍数据仓库、元数据理论介绍CWM、MOF、UML、XMI规范介绍基于CWM的数据仓库体系结构设计电信综合业务信息服务平台设计OLTP系统遗留系统办公系统外部数据DW管理系统抽取清洁转换装载数据模型本地元数据库本地元数据库元数据交换数据集市中央元数据库OLAP工具挖掘工具报表工具中央数据仓库ODS基于CWM的数据仓库体系结构数据源OLTP数据库遗留数据内部办公系统数据外部数据数据源多种类型:关系型、多维、记录、XML以及其它一些工具类型关系型:模式,物理表,视图,字段,索引,触发器,外关键字,主关键字,数据类型,字段值,数据记录,记录的集合Relational元模型ColumnSQLQueryColumnSetSQLDataTypeTableViewBaseTableCatalogProcedureIndexTriggerPackageRelational元模型(续1)AttributeLinkInstanceExtentRowSetColumnSetObjectDataValueColumnValueRowAttributeRelational元模型(续2)关系型数据源的主要接口BaseTable:查询和修改表的属性、触发器和结构Catalog:查询和修改包含的元素Column:查询和设置属性Row:查询和修改一条记录的内容RowSet:查询和修改包含的记录ETL读取数据清洁数据转换数据装载数据ETL组件的接口黑盒变换:Transformation,DataObjectSet,TransformationUse白盒变换:FeatureMap,ClassifierMap,ClassifierFeatureMap,TransformationMap变换的执行顺序控制:TransformationTask,TransformationStep,TransformationActivity,StepPrecedence,PrecedenceConstraint中央数据仓库数据粒度最细且多层次数据是历史的数据是时间相关的大数据量数据是整合的通用的、全局的操作数据存储ODS操作型系统ODS1/21/2企业数据仓库数据集市企业数据仓库最细粒度数据集市部门2粒度2数据集市部门1粒度1部门3粒度3外部数据源数据集市数据集市的特点面向部门应用规模小,投资少使用方便且成本低元数据库类型:中央元数据库本地元数据库内容:抽取过程:任务、执行顺序、映射关系、转换规则描述数据:方位图、数据之间的商业关系、商业规则、数据的改变数据仓库管理:安全性、运行状态、抽取过程的调度、I/O对象及其关系数据仓库管理访问控制和安全性管理数据增长管理抽取过程的管理性能管理故障恢复扩充和演变管理数据仓库管理接口抽取过程的调度(WarehouseProcess,WarehouseEvent,InternalEvent,ScheduleEvent,ExternalEvent)抽取过程的执行(TransformationExecution,StepExecution,ActivityExecution)数据元素的变化(Measurement,ChangeRequest)OLAP组件接口立方体的定义:Cube,CubeDimAssoc,CubeRegion,Dimension,Hierarchy,Level,Mearsure,LevelBasedHierarchy,HierarchyLevelAsso,ValueBasedHierarchy,MemberSelection,MemberSelGrp,立方体到物理数据源的映射StructureMap,LevelBasedHierarchy,ValueBasedHierarchy数据挖掘组件的主要类及接口MiningModel:模型属性和模型的输入MiningSettings:对象属性,输入参数的说明ApplicationInputSpecification,ApplicationAttribute:使用模型时的参数MiningModelResult:挖掘的结果SupervisedMiningModel:描述预言性算法产生的模型StatisticsSettings,AssociationRulesSettings,ClusteringSettings,ClassificationSettings,RegressionSettings:对应模型的设置基于CWM的数据仓库体系结构的特点及优点统一的数据集市和数据仓库中央元数据库驱动机制灵活高效的数据交换方式易于升级高度的可集成性高度的可扩展性基于CORBA的企业数据仓库扩展结构对象服务企业数据仓库平台CWM(IDL)通用数据仓库工具CWM(IDL)对象请求代理(ORB)提纲背景介绍数据仓库、元数据理论介绍CWM、MOF、UML、XMI规范介绍基于CWM的数据仓库体系结构设计电信综合业务信息服务平台设计系统体系结构设计管理系统抽取清洁转换装载数据建模元数据交换数据联机分析展示元数据库面向主题的企业数据仓库省分公司上报数据计费结算数据WEB服务器客户端系统部署图WEB浏览自动邮件工具客户端OLTP服务器数据仓库服务器OLAP服务器WWW服务器
本文标题:基于CWM的数据仓库体系结构设计
链接地址:https://www.777doc.com/doc-26476 .html