您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第四讲决策支持的新技术
西南民族大学计科学院第四讲决策支持的新技术决策支持系统——第四讲决策支持的新技术第一节数据仓库技术4.1.1数据仓库的基本知识4.1.2数据仓库系统的结构4.1.3数据仓库的运行结构4.1.4数据集市的结构决策支持系统——第四讲决策支持的新技术第二节数据挖掘技术4.2.1数据挖掘概述4.2.2数据挖掘基本过程与步骤4.2.3数据挖掘的任务与挖掘方法4.2.4数据挖掘与数据仓库的关系决策支持系统——第四讲决策支持的新技术第三节联机分析处理技术4.3.1基本概念4.3.2OLAP的数据组织4.3.3OLAP的多维数据分析方法4.3.4OLAP的发展决策支持系统——第四讲决策支持的新技术4.1.1数据仓库的基本知识一.从数据库到数据仓库事务处理环境不适宜决策应用的主要原因:1.事务处理环境和分析处理的性能、特性不同2.数据集成问题3.数据动态集成问题4.历史数据问题5.数据的综合问题6.不同的使用对象决策支持系统——第四讲决策支持的新技术4.1.1数据仓库的基本知识二.数据仓库的概念1.W.H.Inmon是面向主题的、集成的、稳定的、随时间变化的数据集合,用于支持经营管理中的决策制定过程。面向主题集成稳定随时间变化决策支持系统——第四讲决策支持的新技术2.SAS软件研究所的观点DB数据DW数据细节的在存取时准确的可更新的操作需求事先可知道事务驱动面向应用一次操作数据量小支持日常操作综合或提炼的代保过去的数据不更新操作需求事先不知道分析驱动面向分析一次操作数据量大支持决策需求决策支持系统——第四讲决策支持的新技术3.DW是作为DSS的基础的分析型DB,用来存放大容量的只读数据,为制定决策提供所需的信息。4.DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的,即与企业定义的时间段相关的、面向主题且不可更新的数据集合。5.……决策支持系统——第四讲决策支持的新技术三.数据仓库的特点1.数据仓库是面向主题的。2.数据仓库是集成的。3.数据仓库是稳定的。4.数据仓库是随时间变化的。5.数据仓库中的数据量很大。6.数据仓库软硬件要求较高。决策支持系统——第四讲决策支持的新技术四.数据库与数据仓库的区别1.数据库是面向业务的,使用者是企业的一般业务人员,进行企业日常数据处理和维护工作。2.数据仓库是面向决策的,使用者是企业的高层管理人员,它也是使用关系数据库,当数据仓库不负责处理业务。3.数据库注重的是企业运行的当前数据,任务是收集和记录企业的原始业务数据,而DW面对的是非即时性的历史数据,通过从业务数据中提取,加工处理后提供给决策人员。决策支持系统——第四讲决策支持的新技术4.1.2数据仓库系统的结构关系数据库数据文件其他数据数据仓库管理工具抽取转换转载元数据库数据建模工具综合数据当前数据历史数据用户查询工具C/S工具OLAP工具DM工具决策支持系统——第四讲决策支持的新技术一.数据仓库管理系统1.定义部件2.数据获取部件3.管理部件4.目录部件(元数据)5.DBMS部件决策支持系统——第四讲决策支持的新技术二.数据仓库的结构构成1.数据仓库的构成高度综合数据层轻度综合数据层当前基本数据层历史基本数据层决策支持系统——第四讲决策支持的新技术二.数据仓库的结构构成2.数据仓库的元数据(1)关于数据源的元数据①数据源中所有的物理数据结构,包括所有的数据项和数据类型;②所有数据项的业务定义;③每个数据项更新频率,以及由谁或哪个过程更新的说明;④每个数据项的有效值;⑤其他系统中具有相同业务含义的数据项的清单。决策支持系统——第四讲决策支持的新技术2.数据仓库的元数据(2)关于数据模型的元数据①I/O对象:支持数据仓库I/O操作的各种对象;②关系:两个I/O对象之间的关联;③关系成员:描述每个关系中两个I/O对象的具体角色、关系度以及约束条件;④关系关键字:描述两个I/O对象如何建立关联。决策支持系统——第四讲决策支持的新技术2.数据仓库的元数据(3)关于数据仓库映射的元数据用该类元数据反映数据仓库中的数据项是从哪个特定数据源填充的,经过哪些转换、变换和加载过程。这类数据可以用来生成程序,以完成数据的转换工作,即实现操作型数据转换为面向主体的数据仓库的数据。决策支持系统——第四讲决策支持的新技术2.数据仓库的元数据(4)关于数据仓库使用的元数据①元数据告诉数据仓库中有什么数据,它们是从哪儿来的,即如何按主题查看数据仓库的内容;②元数据提供已有的可重复利用的查询语言信息。决策支持系统——第四讲决策支持的新技术2.数据仓库的元数据(5)元数据的作用——DW的核心①定位数据仓库的目录作用;②数据从业务环境向数据仓库传送时数据的目录内容;③指导从当前基本数据到轻度综合数据、轻度综合数据到高度综合数据的综合算法的选择。决策支持系统——第四讲决策支持的新技术三.数据仓库的工具集1.分析工具(1)查询工具(2)可视化工具2.挖掘工具决策支持系统——第四讲决策支持的新技术四.数据进入DW的过程与建立DW的步骤1.数据进入DW的基本过程(教材p221)①提取:从操作型数据库中选择并提取所需要的字段;②变换:为来自数据源的数据指定常用的格式和名称;③净化:更正错误的数据;④加载:把净化过的数据载入到DW数据里;⑤汇总:提前计算出任何期待的DW数据的汇总供以后使用。决策支持系统——第四讲决策支持的新技术2.建立DW的步骤①收集和分析业务需求②建立数据模型和数据仓库的物理设计(包括划分粒度和数据分割两部分内容)③定义数据源④选择DW技术和平台⑤从操作型DB中提取、转换、净化并加载到DW中⑥选择访问和报表工具⑦选择DB连接软件⑧选择数据分析和数据展示软件⑨更新DW决策支持系统——第四讲决策支持的新技术4.1.3数据仓库的运行结构DW服务器客服端客服端DW服务器OLAP服务器两层C/S结构:三层C/S结构:决策支持系统——第四讲决策支持的新技术4.1.4数据集市的结构一.数据集市的概念数据集市是指具有特定应用的数据仓库,主要针对某个具体战略意义的应用或具体部门级的应用,支持用户利用已有的数据获得重要的竞争优势或找到进入新市场的具体解决方案。决策支持系统——第四讲决策支持的新技术二.数据集市的特点1.规模是小的;2.特定的应用;3.面向部门;4.由业务部门定义、设计、开发、管理和维护;5.快速实现;6.购买较便宜;7.投资快速回收;8.工具集的紧密集成;9.更详细的、预先存在的数据仓库的摘要子集;10.可升级到完整的数据仓库。决策支持系统——第四讲决策支持的新技术三.数据集市与数据仓库的关系1.数据集市不等于数据仓库,多个数据集市合并起来不能成为数据仓库。各个数据集市之间对详细数据和历史数据的存储存在大量冗余;同一个问题在不同的数据集市的查询结果可能不一致,甚至相互矛盾;各数据集市之间以及与源数据库系统之间难以管理。决策支持系统——第四讲决策支持的新技术2.数据仓库与数据集市的区别(1)DW是基于整个企业的数据模型建立的,它面向企业范围内的主题,而数据集市是按照某一特定部门的数据模型建立的,也称为部门级别DW。(2)数据仓库中存储整个企业内的详细数据,而数据集市中的数据的详细程度要低一些,包含的概要和累加数据要多一些。(3)数据集市的数据组织一般采用星形模型,而大型数据仓库的数据组织采用第三范式。决策支持系统——第四讲决策支持的新技术计算机计算机计算机数据源数据仓库数据分析四.数据集市的两种结构从属数据集市从属数据集市:数据来源于中央DW,一般为那些访问DW频繁的关键业务部门建立。决策支持系统——第四讲决策支持的新技术数据源计算机计算机计算机数据分析独立数据集市独立数据集市:数据直接来源与企业的业务功能系统,与企业DW在数据量和服务对象有所区别,逻辑结构无区别。决策支持系统——第四讲决策支持的新技术4.2.1数据挖掘概述一.案例——NBA通过数据挖掘取得飞跃决策支持系统——第四讲决策支持的新技术二.数据挖掘的概念DM也称为数据库中的知识发现(KDD),是从大量数据集中提取出隐含的、非平凡的、潜在有用的信息或模式的高级处理过程。数据挖掘是知识发现的核心步骤。DM的技术基础是AI、机器学习和统计学。被提取的知识的类型可以是总结性知识、关联性知识、分类模型知识、聚类模型知识,这些知识可表示为概念、规则、规律、模式等形式;知识的类型。决策支持系统——第四讲决策支持的新技术集成目标数据预处理数据模式数据知识源数据预处理数据挖掘评价与解释数据准备数据挖掘评价与解释数据选择决策支持系统——第四讲决策支持的新技术三.数据挖掘的优点与缺点1.优点(1)减少了用户的工作量。(2)使用户得到意外的信息。(3)对数据的迅速变化可作出快速响应,以提供决策支持信息。决策支持系统——第四讲决策支持的新技术三.数据挖掘的优点与缺点2.缺点(1)对计算机的性能要求高。(2)意外的信息不可靠。(3)即使发现一个潜在的可以利用的关系,其实际使用价值也可能不太明显。决策支持系统——第四讲决策支持的新技术4.2.2数据挖掘基本过程与步骤一.数据挖掘的基本过程1.数据准备(1)数据集成:从操作型环境中提取并集成数据,解决语义二义性问题。(2)数据选择:确定发现任务的操作对象;(3)数据预处理:消除噪音、推导计算缺值数据、完成数据类型的转换,削减数据维数或降维。决策支持系统——第四讲决策支持的新技术一.数据挖掘的基本过程2.数据挖掘(1)确定数据挖掘的任务或目的;(2)根据不同的数据的特点,用户和实际运行系统的要求决定要使用的数据挖掘的算法;(3)实施数据挖掘,获取有用的模式。决策支持系统——第四讲决策支持的新技术一.数据挖掘的基本过程3.数据表述与评价(1)将获取的信息以便于用户理解和观察的方式反映给用户;(2)用评价指标对获取的信息评价,发现不满足用户需求的模式,并返回到DM的前面阶段,重新实施DM。决策支持系统——第四讲决策支持的新技术二.进行数据挖掘的步骤1.问题定义2.发现信息3.制定计划4.采取行动5.检测结果决策支持系统——第四讲决策支持的新技术4.2.3数据挖掘的任务与挖掘方法一.数据抽取:对数据进行浓缩,给出它的紧凑描述。1.多维数据分析方法:是一种数据仓库技术,它把汇集操作结果预先计算并存贮起来,供DSS使用。2.面向对象的归纳方法:对用户感兴趣的数据视图进行泛化,从较高层次上总结了在低层次上的原始关系。决策支持系统——第四讲决策支持的新技术二.分类发现分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个。要构造分类器,需要有一个训练样本数据集作为输入。决策支持系统——第四讲决策支持的新技术三.聚类聚类是把一组个体按照相似性归成若干类别,即“物以类聚”。它的目的是使同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。决策支持系统——第四讲决策支持的新技术四.关联规则发现用于关联规则发现的主要对象是事务型数据库,其中针对的应用则是售货数据。事实上人们一般只对满足一定的支持度和可信度的关联规则感兴趣。为了发现出有意义的关联规则,需要给定两个阀值:最小支持度和最小可信度。决策支持系统——第四讲决策支持的新技术4.2.4数据挖掘与数据仓库的关系1.DM比DW的汇总型分析处理要详细和深入得多;2.DW的发展是促进DM发展的一个重要原因,DM经常被看成是DW的后期市场产品,DW中具有最丰富的资源可供挖掘;3.DW不是DM的必要条件,当DW可为DM的数据集成和数据准备提供一种好的方法;4.DM可能是DW的一个逻辑上的子集,而非一定得是物理上单独的数据库。决策支持系统——第四讲决策支持的新技术用户查询请求信息发布、查询分类、解释查询协同管理业务系统及其他系统异构数据源DM技术模型库管理方法库管理KMDW数据导入、转移与质量保障工具其他信息分析工具KB
本文标题:第四讲决策支持的新技术
链接地址:https://www.777doc.com/doc-621615 .html