您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 04_数据库和数据仓库(信息系统,上海财经大学刘鹏)
第四章数据库和数据仓库第一节数据管理第二节数据库与数据库管理系统环境第三节关系数据库模型第四节数据库的建立第五节数据仓库与数据挖掘第六节高级数据库技术和高级数据库应用第一节数据管理数据组织的层次实体、属性和关键字数据管理的传统方法数据管理的数据库方法数据组织的层次数据按照层次方式进行组织由位、字节、字段、记录、文件和数据库组成位(Bit)位是计算机中最小的数据单位,其值为0或1,是一个二进位,表示一个导通或未通的电路。字节(Byte)字节是由若干位组成的,代表一个字符。字符是信息的最基本构架。数据组织的层次字段(Field)。多个字符组成一个词或者一个完整的数字(如人名或年龄),字段是数据的最小单位,它不能再分成有意义的单位记录(Record)由与某个特殊对象或活动有关的所有字段组成。文件(File)同一类型的所有记录组成一个文件文件就是与某个特定主题相关的数据记录的集合。(字母J的ASCII码)数据的层次举例文件字节字段纪录01001010900811刘汉云2000-9-4位0,1数据库刘汉云项目数据库包含:职员编号、姓名、聘用日期学分及成绩的记录职员文件(名字字段)职员文件部门文件财务文件900811刘汉云2000-9-4900206李卓宇2002-7-2910810张昕阳2001-8-2实体、属性和关键字实体entity实体是所收集的数据相关的一类事物,可以是物,人,实际的东西,或者具体的东西员工库存客户订单教室实体、属性和关键字属性Attribute属性是试题的某一方面的特征学生的姓名、学号、年龄、性别成绩是学生的属性库存号、说明、现有数量、在仓库中的位置等是库存的属性实体、属性和关键字关键字PrimaryKey关键字是用来识别记录的一个或一组数据项,是识别记录和文件中查找记录的标志学生文件中的学号,产品文件中的产品号,订单文件中的订单号辅助关键字SecondaryKey不能唯一表示一个记录的字段数据管理的传统方法利用文件管理数据为每个应用程序分别创建和存储数据文件的数据管理方法都称为传统方法应用程序A文件A应用程序B文件B应用程序C文件C数据管理传统方法的不足数据冗余大冗余是指在多个数据文件中重复出现相同的数据。数据与程序独立性不高数据文件和维护它的相关程序之间过分依赖。数据管理的数据库方法数据库是逻辑相关的记录和文件的集合。把先前提及的所有存储在独立文件中的记录归并在一个数据库内,以便让不同的应用程序存取。储存在数据库中的数据既独立于使用它的计算机程序,也独立于存储它的外部存储器的类型。数据库管理系统DatabaseManagementSystem,DBMS在数据库管理系统中,应用程序不能直接从存储介质获得所需的数据。它必须先将请求提交给DBMS,由DBMS负责从存储介质检索数据并提供给应用程序使用应用程序A应用程序C应用程序B数据库数据库管理系统基于数据库方法的优点减少数据冗余,更有效利用存储空间并增强数据的完整性。也为组织提供了更大地利用数据的灵活性。两个文件中的数据放在了同一个数据库,可以多种方法定位数据并获得要处理的数据共享数据和信息资源第二节数据库与数据库管理系统环境数据库及其特征数据库管理系统数据库查询语言数据的逻辑视图和物理视图数据库及其特征数据库的定义数据库(Database)是一个信息的集合,在这个集合中可以按照信息的逻辑结构对其进行组织与存取。数据库由两部分组成信息本身信息的逻辑结构数据库特征信息的集合产品文件产品ID产品名称单价供应商ID137门锁26.254058145电钻212.502038152压缩机70.001125供应商文件供应商ID供应商名称城市地址邮政编码电话1125光明公司上海人民路44号201044555531252038先锋公司上海五四路32号200321846611543069方联公司西安金花南路5号71043232392704058智远公司厦门海滨路51号36132465894113数据库特征逻辑结构数据字典包含信息的逻辑结构数据库的特征信息中的逻辑联系建立信息间的联系或关系意味着找出文件之间的相互关系.主关键字数据库文件中的一个字段,唯一描述一个记录产品文件中的产品ID,供应商文件中的供应商编号外部关键字一个文件中的主关键字出现在另一个文件中就是外部关键字,比如产品文件中的供应商文件.数据库的特征内在的完整性约束完整性约束是保证信息质量的一种规则比如产品ID不能重复产品文件中的供应商ID不应该是供应商文件中没有的供应商ID数据库管理系统DatabaseManagementSystem是一组软件,允许组织集中并有效地管理数据以供应用程序访问相当与应用程序和物理数据文件之间的接口数据库管理系统的组成数据定义语言数据操作语言数据字典应用程序程序1程序2程序3数据定义语言数据操作语言数据字典物理数据库DBMS数据库管理系统组成数据定义语言描述数据库内容和结构的正式语言数据操作语言操作数据库中的数据,提供了一组提取数据的命令数据字典自动生成或者手工生成的文件,用来存储数据元素的定义和特性。如用途,物理表现,所属关系,授权和安全.被动的,主动的.数据库查询语言属于数据操作语言自然语言自然语言查询命令LISTTHENAMESANDADDRESSESOFALLSUPPLIERSWHOLIVEINSHANGHAIQBEQueryByExample通过拖曳数据项等方法来查询数据数据库查询语言SQLStructuredQueryLanguage结构化查询语言标准利用SQL可以查询不同数据库管理系统下的数据.基本形式SELECT…FROM…WHERE…数据视图和逻辑视图DBMS把数据的逻辑视图和物理视图分开逻辑视图以最终用户所使用的直观的方式来显示数据物理视图则显示了数据的实际组织形式以及它在物理存储介质上的结构一个物理视图可支持多个逻辑视图DBMS使用专门的数据库管理软件,使得物理数据库可用于不同应用程序所需的不同的逻辑视图。第三节关系数据库模型四种数据库模型层次型网状型关系型目前使用最为广泛面向对象关系数据库模型利用一系列的二维表或文件存储信息.在关系模型中,每个二维表都描述一种关系.关系是表的数学术语每一个表或关系所保存的信息都与一个特定的实体有关.二维表使描述信息间的关系十分便利,容易处理二维表所包含的信息.可以灵活地查询数据库和建立报表关系数据库模型可以灵活地查询数据库和建立报表查询单个表和多个表不必建立数据项之间的所有连接,随时可以建立.第四节关系数据库的建立确定实体和关键字确定实体之间联系利用E_R图得到关系为每个关系确定信息(字段)用数据定义语言创建数据库学生修课管理学生选修样本报表学号姓名专业编号专业名称课程编号课程名称学分成绩6117马晓然120202企业管理8301现代企业管理3868302营销管理2758402公司财务3904132谢以东030107经济法3101经济法基础理论3653116商法专题2841143陈晨020204金融学2401货币银行理论3782402金融工程学2867142沈俊120202企业管理8301现代企业管理3808311营销策划1.5758402公司财务388确定实体和关键字三个实体学生专业课程关键字学号专业号课程号确定实体之间的联系--画实体联系图实体联系图(Entity-RelationshipDiagram,E-R图)矩形表示实体菱形表示实体之间的联系直线表示连接1代表出现一次,M代表多次确定实体之间的联系--画实体联系图MM1学生课程专业选修分配M确定实体之间的联系--画实体联系图先画上矩形填上实体名判断是否有联系有联系画上菱形,判断联系是1还是M利用E-R图得到关系将每一个实体都转化为一个关系学生、课程、专业将每一个多对多的联系都转换为一个关系联系的名称为关系的名称选修将每一个一对多的联系都转换为一个关系分配合并具有相同关键字的关系:学生与分配合并为每个关系确定信息(字段)确保每个关系中所含的信息确实处于正确的关系之中这组信息只依赖于所属关系的主关键字专业名称信息不能从其他的信息中派生出来用数据定义语言创建数据库根据前面四步的结果来,运用数据定义语言来创建关系第五节数据仓库与数据挖掘数据往往放在不同的数据库系统中数据难以收集数据仓库是通过集成企业的关键运行数据,产生一致的、可靠的、易于访问的数据形式。数据仓库数据仓库(DataWarehouse)是信息的逻辑集合,这些信息来自于许多不同的业务数据库,并用于支持企业的分析活动和决策任务数据仓库数据仓库的特征数据仓库将来自于不同数据库的信息结合在一起数据仓库是多维的包含若干层的行列数据字典:信息的逻辑结构、信息的来源和处理方式数据仓库支持决策而不是事务处理联机分析处理(OLAP)联机事物处理(OLTP)数据挖掘工具DataMiningTools是用户对数据仓库进行信息生成的软件工具支持OLAP支持决策任务数据挖掘工具包括:查询与报表工具QBE,SQL,报表生成器智能代理应用各种像神经网络、模糊逻辑这样的人工智能工具形成OLAP信息发现的基础多维分析工具是一种横纵分割的技术,允许人们从不同的角度来观看多维信息第六节高级数据库技术和高级数据库应用面向对象的数据库对象-关系数据库空间数据库时间数据库和时间序列数据库文本数据库和时间序列数据库异种数据库和遗产数据库WWW
本文标题:04_数据库和数据仓库(信息系统,上海财经大学刘鹏)
链接地址:https://www.777doc.com/doc-25669 .html