您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 大学计算机基础 (4)西安交通大学
多媒体技术大学计算机基础顾刚计算机教学实验中心gugnag@mail.xjtu.edu.cnggu@ctec.xjtu.edu.cn029-82668634P.2第4章数据库技术基础银行管理系统中数据量分析假设全国个人和单位储户5亿个,每位储户10KB系统中数据总量为500000000×10KB=5TB中国银行营业网点2.4万;建行1.4万;工行1.7万这些海量信息数据如何组织、存储、处理、传输?P.3某省邮电管理信息系统第4章数据库技术基础钱学森图书馆管理系统中数据量分析图书、期刊5百万本每本图书或期刊数据信息1KB交大师生员工读者3万,每位读者信息200B数据总量5百万×1KB+3万×200B=50GB以上P.42006年底开户1个亿,每为股民信息约20KB深股数量:A股973,B股59沪股数量:A股910,B股55股票交易所:假设全国有上千股票交易所第4章数据库技术基础股票管理信息系统P.5如何组织、存储、查询海量的数据信息?需要应用数据库技术去解决上面问题!数据库技术研究的问题是:如何科学地组织和存储数据如何高效地获取和处理数据如何更广泛、更安全地共享数据问题和结论第4章数据库技术基础P.6大量数据以表格形式存储表格中的行和列都有逻辑含义表格中数据可进行下列操作:增、删、改分类、排序、统计查询所关心的数据第4章数据库技术基础P.7如何显示打印查询结果即数据输出格式界面如何设计数据信息的完整性规范性数据与数据之间的关系数据存储的冗余问题第4章数据库技术基础P.8第4章数据库技术基础数据库系统的概念数据库管理技术的发展数据模型ACCESS数据库系统的使用关系数据库语言SQL简介P.9今天的计算机被人们称为数据处理机数据处理的中心问题是数据管理数据管理是指对数据的定义、组织、分类、编码、存储、检索和维护随着计算机硬件和软件的发展,数据管理经历了三个发展阶段人工管理、文件系统和数据库系统第4章数据库管理技术发展P.10特点:(1)数据不独立保存——不能实现数据共享(2)数据与程序不可分割——数据变化程序亦变(3)各程序的数据彼此独立——数据冗余(4)50年代以前,应用主要是科学计算,数据少人工管理阶段第4章数据库管理技术发展P.11文件管理阶段程序1程序2文件1文件2文件3文件系统(1)程序和数据分开,有一定的独立性,数据和程序都看成文件(2)数据以文件的形式独立保存,由操作系统按名存取管理(3)实现一定程度的数据共享,多个程序可同时操作某个文件(4)数据文件之间缺乏联系,修改数据会造成不一致性(5)50年代中期到60年代中期第4章数据库管理技术发展P.1220世纪六十年代后期和七十年代,由于计算机要处理的数据量急剧膨胀,计算机硬件性能迅猛提高,磁盘容量增大,由此产生了数据库技术。进入数据库管理阶段(1)数据以数据库的形式保存,最大限度减少冗余(2)数据和程序之间彼此独立,实现了高度共享(3)专门数据库管理软件(DBMS),对数据进行安全性、完整性、并发性等控制管理应用程序1应用程序N应用程序2应用程序3DBMS数据库第4章数据库管理技术发展P.13第4章数据库技术基础数据库系统的概念数据库管理技术的发展数据模型ACCESS数据库系统的使用关系数据库语言SQL简介P.14数据(Data)是描述客观事物的信息符号的总称,这些信息符号能输入到计算机中存储起来,又能被处理数据处理(管理)(DataProcess)是指对数据进行收集、整理、组织、存储、加工、传输、检索的各个过程总称实体(Entity)指客观世界存在的某个事物西安交大、姚明、鸟巢、材料01、应物01、一只羊、手机每个实体有其特征(属性Attribute),例如:电视机的属性:平面尺寸、色彩、频道、液晶等学生的属性:??教室的属性:??手机的属性??属性值指属性的具体内容,例如:实体:课程属性(名):课程编号,课程名称,学分,学时属性值:“TS52001”,“Java技术与应用”,3,48第4章数据库系统的概念P.15文件的概念(1)文件(File)一般指数据序列保存在外部永久介质上的整体形式。与文件相关的概念主要有记录(Record)、字段(Field)和数据类型(DataType)(2)记录(Record)对应于每个实体的数据。如一个学生(20120061,‘李冰’,20,‘男’,‘计算机’)为一个记录(3)字段(Field)对应于实体的属性,也称为数据项。字段的命名往往和属性名相同。例如学生有学号、姓名、年龄、性别、系等字段。字段的值可以表示属性值,例如学号的值20120061,姓名的值‘李冰’等(4)数据类型(DataType)指数据的取值范围。例如年龄为小于100的整数;性别为字符,只能取值‘男’和‘女’等。数据类型决定了数据在存储空间的结构第4章数据库系统的概念P.16记录、字段和数据类型第4章数据库系统的概念P.171)数据库指长期存储在计算机内的有组织的可共享的数据集合2)数据库管理系统(DBMS)指对数据库进行管理的软件主要管理功能如下(1)定义:定义数据库的结构、数据完整性和其它的约束条件(2)操纵:实现数据插入、修改、删除和查询(3)控制:实现数据安全控制、完整性控制以及多用户环境下的并发控制(4)维护:提供对数据的装载、转储和恢复,数据库的性能分析和监测3)应用程序指为了完成某个目标,利用DBMS对大量数据进行处理的指令集合。4)用户指使用、设计、开发、维护和管理数据库的人员。主要有三类用户:普通用户(TU)、应用程序员(AP)、数据库管理员(DBA)。5)数据库系统是由硬件、操作系统、数据库、数据库管理系统、应用程序、数据库管理员等部分组成。第4章数据库系统的概念P.18•数据库系统的特点:–数据集成性:数据紧密联系在统一的数据结构中–数据共享程度高、冗余度底、易于扩充–数据独立性强:数据与程序相互独立–数据统一管理和控制第4章数据库系统的概念P.19第4章数据库技术基础数据库系统的概念数据库管理技术的发展数据模型ACCESS数据库系统的使用关系数据库语言SQL简介P.20三个世界的划分:现实世界:指客观存在的所有事物信息世界:是对现实世界的抽象,每个事物在信息世界中称为实体。实体是由属性来描述的。反映实体及其之间联系的模型称为(实体)概念模型。概念模型不依赖与某一计算机系统数据世界:信息的数据化。用记录和数据项分别描述信息世界中的实体及属性。实体概念模型数据化后称为数据模型第4章数据模型P.21由于计算机不能直接处理现实世界中的具体事物人们必需将现实世界中的具体事物转换成计算机能处理的数据计算机数据的格式概括如下:bit→byte→字段→记录→文件→数据库从客观存在的事物到最后在计算机内的数据表示,需要进行抽象,这中抽象过程被称为设计建立数据模型从现实世界抽象为数据世界往往不是一步到位,一般分为两级(层)抽象第4章数据模型P.22设计建立数据模型先由概念模型到逻辑模型,再由逻辑模型到物理模型三种模型定义如下:概念模型指用户对客观世界中的事物所建立的实体模型逻辑模型指在数据库系统中表示实体之间的联系模型物理模型指数据在存储介质上的存储结构从现实世界到数据世界的各术语对应关系如下表:现实世界信息世界数据世界事物总体实体集文件事物个体实体记录事物特征属性字段(实体)概念模型逻辑模型物理模型第4章数据模型P.23逻辑模型又分层次模型、网状模型和关系模型层次模型:每个实体有唯一的“父”实体,且有多个“子”实体网状模型:每个实体既有多个父实体,也有多个子实体关系模型:用二维表格来表示实体与实体之间的联系分别对应树型关系、图型关系、表格关系,如下图所示第4章数据模型P.24第4章数据模型P.25第4章数据模型P.26第4章数据模型P.27将客观存在并且可以相互区别的“事物”抽象为实体“教室”实体抽象成面积、座位数、地址、多媒体等属性“手机”实体抽象成型号、出厂字号、速度、容量、像数、价格、摄像等属性属性有“型”和“值”之分“型”即为属性名,如姓名、年龄、性别是属性的型“值”即为属性的具体内容取值,如(990001,‘张立’,20,‘男’,‘计算机’),这些属性值的集合描述了客观世界存在的一个学生实体这就是对客观世界的一层抽象,由于人的认识不同,抽象的结果有所不同第4章数据模型P.28候选码:指一组属性,其值唯一标识一个实体学生实体主码?教室实体主码?手机实体主码?主码(PrimaryKey):候选码一般有多个,选其中一个候选码外码:指某个实体存在一个非主码属性A,该属性A是另一个实体的主码,则A称为外码实体集(EntitySet):指具有相同属性实体的集合,例如,全体党员是一个实体集域(Domain):属性值的取值范围称为该属性的域。如学号的域为10位整数,姓名的域为字符串集合,年龄的域为小于200的整数,性别的域为(‘男’,‘女’)等§4数据模型-概念模型P.29实体集之间的联系在现实世界中,事物之间都是有联系的实体之间的联系通常是指不同实体集之间的联系两个实体集之间的联系有三种类型:1.一对一联系:实体集A中的一个实体至多与实体集B中一个实体相对应,反之亦然,则称实体集A与实体集B为一对一的联系例如:班级与班长:一个班只能有一位班长观众与座位:电影院是对号入座病人与床位:病床专用§4数据模型-逻辑模型P.30§4数据模型-逻辑模型2.一对多联系:实体集A中的一个实体与实体集B中的多个实体相对应,然而实体集B中的一个实体至多与实体集A中的一个实体相对应班级与学生:计算机11班有李立,樊为,张之和等同学公司与职员:SUN公司有BillJoy,GongLi和JamesGosling等职员省份与市县:陕西省包括西安市,延安市,渭南市等P.31§4数据模型-逻辑模型3.多对多联系:实体集A中的一个实体与实体集B中的多个实体相对应,反之,实体集B中的一个实体与实体集A中的多个实体相对应教师与学生:一位教师指导多名学生,一名学生由多位教师指导学生与课程:一名学生选多门课程,一门课程被多名学生所选工厂与产品:一个工厂生产多种产品,一种产品可由多个工厂生产P.32•使用E-R图来描述在现实世界中某个实体中的各个属性、各实体之间的联系•E-R图是由美籍华人PeterChen在1976年提出的•图形工具(语言)描述特点:形象、直观、简洁•E-R图只有三个基本图形元素:–用矩形表示实体–用圆角矩形或椭圆表示属性–用菱形表示实体间的联系。实体联系属性§4数据模型-ER图P.33§4数据模型-ER图一个实体的E-R图实体与实体之间联系的E-R图P.34学生与课程E-R图P.35供应商项目企业零件供应项目名负责人工期零件号零件名库存量企业名法人名地址电话产品名资产§4供应商与企业ER图P.36目前实际使用的数据库系统大多是关系数据库关系数据库的相关概念:域(Domain):相同类型数据元素值的集合比如自然数集合、小写字母集合笛卡尔积:一组域D1,D2,…,Dn,则笛卡尔乘积为D1×D2×…×Dn={(d1,d2,…,dn)|di∈Di,i=1,2,…,n}元组(Tuple):笛卡尔乘积中每一个元素(d1,d2,…,dn)称为一个元组§4数据模型-关系模型P.37笛卡尔积实例域D1=学生集合(Student)={张宁,李健,王鹏}域D2=计算机语言课程集合(Language)={C++,OP,JAVA}域D3=修课类别(Lesson)={必修课,选修课},笛卡尔积D1×D2×D3={(张宁,C++,必修课),(张宁,C++,选修课),(张宁,OP,必修课),(张宁,OP,选修课),(张宁,JAVA,必修课),(张宁,JAVA,选修课),(李健,C++,必修课),(李健,C++,选修课),(李健,OP,必修课),(李健,OP,选修课),(李健,JAVA,必修课),(李健,JAVA,选修课),(王鹏,C++,必修课),(王鹏,C++,选修课
本文标题:大学计算机基础 (4)西安交通大学
链接地址:https://www.777doc.com/doc-3812791 .html