您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > MIS-第6章-商务智能基础:数据库与信息管理
第六章商务智能基础:数据库与信息管理先回顾一下:什么是管理信息系统?组织中的一个人机交互系统。输入:原始数据。它将原始数据加工成有用的信息。输出:有用的信息。管理信息系统(加工或处理)输入输出组织Organization环境问题是:开篇案例:惠普能否从企业数据仓库中挖掘成功HP的CIO:RandyMott(兰迪莫特)惠普有大量的数据,存放在多个应用程序和数据库中,分布于全球各地的不同部门和不同领域。然而,众多的系统和应用程序却无法提供所需要的完整且前后一致的信息。惠普的CIO决定:建立数据仓库,即在全公司建立一个可共享的信息库,用于提供统一而且准确的商业信息。该数据仓库取代了17种不同的数据库技术,通过连接目前正在使用的1.4万个数据库,使不同地区和部门的员工都可以在第一时间获取所需数据。HP最终将这一数据仓库系统发展为独立产品:Neoview,并销售给其他企业本章内容6.1传统文件环境下的数据整理6.2使用数据库管理数据6.3利用数据库提升商业运作水平和决策能力6.4管理数据资源学习目标传统文件下,管理数据资源会遇到哪些问题?数据库管理系统将如何解决这些问题?数据库管理系统的主要功能是什么?为什么关系型数据库管理系统这么强大?数据库设计的重要原则有哪些?为了提高企业业绩和决策能力,获取数据库信息的主要工具和技术有哪些?为什么信息政策、数据管理和数据质量对公司数据资源管理至关重要?6.1传统文件环境下的数据整理•高效的信息系统为使用者提供准确、及时且相关信息。准确信息是指没有错误的信息;及时是指当决策者需要这些信息的时候随时就可以找到。6.1.1文件组织术语和概念相关记录组成文件一组字节成为一个字段一组位(8位),字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位计算机可处理的最小单位数据,位要么是0,要么是1文件记录字段字节位在ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。。一组相关的字段相关文件可整理成数据库数据库•计算机系统以层级系统管理数据,依次为位、字节、字段、记录、文件、数据库。•实体(Entity):客观存在并且可以相互区别的“事物”称为实体。实体可以是可触及的对象,如一个学生,一本书,一辆汽车;也可以是抽象的事件,如一堂课,一次比赛等。•属性(Attribute):属性为实体的某一方面特征的抽象表示。•记录(Record):数据表中的一行组成一个记录。6.1.1文件组织术语和概念学生成绩数据库文件(表)学生姓名学生编号专业经济学原理101成绩Linda468金融学A-Pinckus332市场营销B+Williams097经济学C+Laughlin765金融学AOrlando324统计学B在这里,实体=学生成绩;而这些都叫做属性(或称数据单元/域、字段)记录关键字段6.1.2传统文件环境的问题ConceptBECDA数据冗余与混乱程序--数据依赖欠缺弹性缺乏数据共享与实用性安全性低6.1.2传统文件环境的问题同样的这样一张表,如果在学校的学生处、教务处分别存储一份,可能会立即产生各种问题。6.2使用数据库管理数据数据库是以一定的组织方式存储在一起的相关数据的集合,它能以最佳的方式、最少的数据冗余为多种应用服务,程序与数据具有较高的独立性。6.2.1数据库管理系统数据库管理系统(DBMS):是单位或组织用来集中并有效管理数据、可由应用程序存取的软件。人力资源管理系统数据库员工数据姓名住址社会保障号码PositionMaritalStatus工资条数据工作时数工资率(元/小时)应付工资毛额联邦税州税工资净额福利数据寿险年金计划健康保健计划退休福利数据库管理系统(DBMS)人事应用程序工资条应用程序福利应用程序人事部薪酬部福利部一个人力资源管理信息系统:它的数据库和数据库管理系统6.2.1数据库管理系统有了DBMS,用户和程序员不需要直接和数据库打交道,只需要通过各种应用程序去调用数据库即可。这极大地简化了工作量。例如:在网上发布一条微博,用户完全不必关心这条微博存储在哪台网站服务器上的哪个存储区域,以何种格式存储……这一切均由DBMS完成。一、DBMS如何解决传统文件环境带来的问题3.把程序和数据分开,确保数据可以独立存在2.借助于DBMS,确保数据具有相同的值1.通过减少存放重复数据的单独文件HierarchicalDatabaseModel(层次模型/树状模型)NetworkDatabaseModel(网状模型)RelationalDatabaseModel(关系模型)EmployeeCompensationJobAssignmentsBebefitsPerformanceRatingsSalaryHistoryPensionLifeInsuranceHealthCourse1Course2Course3Student1Student2Student3Student4Student5StudentNameIDNo.MajorGradeinComputerLiteracy101Linda468FinanceA-Pinckus332MarketingB+Williams097EconomicsC+Laughlin765FinanceAOrlando324StatisticsB二、关系型数据库管理系统关系数据库模型关系模型是目前使用最为广泛的数据库模型.在这种模型中,一个数据库文件看上去就像是一张二维表格不同表格代表着不同的实体,每张表格中存放着相同类型实体的许多属性(实际上是属性的值).表格中的每一行代表某个具体的实体,也称为一条记录.一条记录被分成一个个字段或数据单元,代表某个具体实体的属性值.StudentNameIDNo.MajorGradeinComputerLiteracy101Linda468FinanceA-Pinckus332MarketingB+Williams097EconomicsC+Laughlin765FinanceAOrlando324StatisticsB关系式数据库的一个例子:采购数据库文件(表)订单号码订单日期交货日期零件号码零件数量总金额163402.02.9902.22.991522144.50163502.12.9902.29.99137379.70163602.13.9903.01.99145124.30零件号码零件描述单位价格供应商号码137Doorlatch26.254058145Doorhandle22.502038152Compressor70.001125供应商号码零件名称供应商地址137Doorlatch44Winslow,GaryIn44950145DoorhandleRte,101,EssexNJ07763152Compressor51Elm,RochesterNY11349实体:订单实体:零件实体:供应商主键、外键关系型数据库中的一条记录中有若干个属性.学生表(学号,姓名,性别,班级)课程表(课程编号,课程名,学分)成绩表(学号,课程号,成绩)成绩表中的学号不是成绩表的主键,但它和学生表中的学号相对应,并且学生表中的学号是学生表的主键,则称成绩表中的学号是学生表的外键主键是能确定一条记录的唯一标识.外键用于与另一张表的关联。是能确定另一张表记录的字段,用于保持数据的一致性。关键字(PrimaryKey)外关键字(ForeignKey)二、关系型数据库管理系统选择投影联接三、关系型DBMS操作四、面向对象数据库管理系统数据库管理系统(DMBMS)是使得组织能够有效管理数据,以及能够开发出存取这些数据的相关应用程序的软件系统。一个典型的关系式数据库管理系统具有三个逻辑部件:数据定义语言———用来定义数据库文件中数据单元(字段或属性)。数据操纵语言———用来操纵数据以便应用它们。如基于SQL(结构化查询语言)的数据操纵语言。数据字典———用来对数据库中所有变量(指字段)进行定义、记录和管理。6.2.2DBMS的优势当前流行的小型关系式DBMS有:FoxPro,MSAccess.当前流行的中大型关系式DBMS软件提供商有:Oracle,Sybase,Informix,IBM(DB2),Microsoft(SQLServer)等。6.2.2DBMS的优势6.2.2DBMS的优势VisualFoxpro中的数据定义Access中的数据定义SQLServer中的数据定义SQL语言是几乎所有关系型数据库的通用语言,要深入掌握SQL语言并不容易,为此,许多DBMS允许用户以可视化方式创建查询,然后为用户自动生成对应的SQL语言并执行。如图是在Access中完成一次交叉表查询,生成的SQL语句从功能上看属于数据操纵语言。三类世界1.现实世界人们头脑之外的客观世界,它包含客观事物及其相互联系。2.观念世界现实世界在人们头脑中的反映,又称信息世界。3.数据世界信息世界中信息的数据化。现实世界中的事物及其联系,在数据世界中用数据模型描述。6.2.3设计数据库根据模型应用的不同目的,数据模型分为两种类型:概念模型(也称信息模型):独立于计算机之外的模型,这种模型不涉及信息在计算机中如何表示,而是用来描述某一特定范围内人们所关心的信息结构,它是按用户的观点来对数据和信息建模,主要用于数据库设计。数据模型(如网状、层次及关系模型):它是直接面向计算机的,是按计算机系统的观点对数据进行建模,主要用于DBMS的实现。6.2.3设计数据库•下图显示了把现实世界中的具体事物抽象、组织为某一DBMS支持的数据模型的过程。•在概念上我们常常首先将现实世界抽象为信息模型(也称为概念模型),然后将信息模型(概念模型)转换为计算机实现的形式。6.2.3设计数据库指减少数据库文件中数据冗余的过程.订单号零件数量零件号零件名单价供应商号供应商名供应商地址订单日期交货日期订单数据库文件(未规范化的)订单号订单日期交货日期订单数据库文件订单号零件号零件数量已订购零件数据库文件供应商号供应商名供应商地址供应商数据库文件零件号零件名单价供应商名零件数据库文件规范化过程:一分为四!一、规范化和实体关系图(一)关系的规范化关系必须是规范化的关系,满足一定的约束条件。称为范式(NormalForm)1.第一范式2.第二范式3.第三范式将关系的模式从低级别向高级别转化,此过程称为关系的规范化。规范化过程中要注意:不能丢失原关系所包含的相关信息。关系应满足的基本条件就是元组中的每一个分量都必须是不可分割的数据项,简单的来讲,在同一表中没有重复项存在。工资属性有两个分量基本工资附加工资符合第一范式的关系1.第一范式依赖依赖关系不仅满足第一范式,而且所有的非主属性完全依赖(完全依赖是指不能存在仅依赖主关键字一部分的属性)于主码,称关系符合第二范式。依赖2.第二范式关系不仅满足第二范式,而且它的任何一个非主属性都不传递依赖于主码,称关系符合第三范式。依赖生产厂址依赖与生产厂名依赖生产厂名依赖与产品代码消除传递依赖关系的办法,是将原关系分解为如下关系:产品关系:产品代码、产品名、生产厂名;生产厂关系:生产厂名、生产厂地址。生产厂址传递依赖与产品代码3.第三范式(二)实体关系图实体--联系图,又称为E-R图E-R图中包括:实体、属性和联系三种基本图素。约定:“实体”用方框表示,“联系”用菱形框表示,“属性”用椭圆框表示,框内填入相应的实体、联系及属性的标识。•学生实体属性有:学号,姓名,班级,院系,出生日期,性别学生学号班级院系出生日期性别姓名(二)实体关系图•1)一对一联系(1:1)•2)一对多联系(1:n)•3)多对多联系(m:n)实体联系的类型班级班长任职11班级学生组成1n课程学生选修mn二、数据库的分布左图:集中式数据库右图:分布式数据库6.3利用数据库提升商业运作水平和决策能力大数据引领我们走向数据智能化时代参看视频:大数据6.3.1数据仓库数据仓库简介案例:美国国内税务署利用数据仓库揭露税务诈骗美国国内税务署(IRS)美国国内税务署(
本文标题:MIS-第6章-商务智能基础:数据库与信息管理
链接地址:https://www.777doc.com/doc-4205901 .html