您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 数据库原理笔记-(1)
数据库数据库原理数据库简介(理解)1.数据库的重要性:数据库无处不在:它们是电子商务和其他WEB应用程序的主要组成部分,是企业操作和决策支持应用程序的核心部分。2.数据库的目的:数据库的主要目的是帮助用户更好地管理数据。3.关于列表的问题:过于简单的列表可能会导致数据的不一致性和其他问题,如删除行会丢失过多的数据,改变行会导致不一致的数据,插入行会导致数据遗漏。通常情况下,如果一个列表含有的数据指示两个或两个以上的不同事情时,修改数据就会出现问题。4.可以用关系模型的方法解决列表所产生的问题。一个关系数据库含有一个独立表的集合。在很多情况下,每个表中的数据有且仅有一个主题。如果一个表含有两个或多个主题,我们就需要将其分割为两个或多个表。数据库系统的概念1.数据库系统的4个基本元素是:用户、数据库应用程序、数据库管理系统(DBMS)和数据库。2.数据库:在绝大多数情况下,数据库就是关联记录项的自描述集合。对于所有的关系数据库,该定义可以修改为:数据库就是关联表的自描述集合。自描述意味着数据库本身含有对数据库结构的描述。关于数据库结构的数据称为元数据。元数据的示例是表名、列名和列所属的表、表和列的属性等。应用元数据用于描述应用程序元素,如表单和报表。3.DBMS的目标是创建、处理和管理数据库。DBMS的功能包括:(1)创建数据库(2)创建表(3)创建支持结构(如索引等)(4)读取数据库数据(5)修改(插入、更新或删除)数据库数据(6)维护数据库结构(7)执行规则(8)并发控制(9)提供安全性(10)执行备份和恢复4.应用程序的功能包括:(1)创建并处理表单(2)处理用户调查(3)创建并处理报表(4)执行应用逻辑(5)控制应用关系模型一、关系●关系是具有如下特征的二维表:●表的每一行存储了某个实体某个属性的数据。●表的每类包含了用于表示实体某个属性的数据。●关系中的每个单元格的值必须单值。●任意一列中所有条目的类型必须为单值。●行与行之间顺序任意。●表中任意两行不能具有完全相同的数据值。EmployeeNumberFristNameLastNamePhoneEmail100JerryJohnson236-9987JJ@somewhere.com200MaryAbernathy444-8898MA@somewhere.com300LizSmathers777-5643LS@somewhere.com(每个单元格都只有唯一的值,每列中所有实体的类型都是一样的。列名都是唯一的,即使我们交换任意两行或两列的顺序,也不会丢失任何信息。表中,任意两行都不重复。所以,为关系)键的类型1.键(Key):是关系中用来标识行的一列或多列。可以是唯一的,也可以是不唯一的。2.复合键:包含两个或更多属性的键。3.候选键:是唯一标识关系中每一行的键。可以是一列,也可以是复合键。从候选键里选主键。4.代理键:是具有DBMS分配的唯一标识符的列,该标识符已经作为主键添加到表中。是短暂的数字,并且永远不变,他们是理想的主键。5.外键与参照完整性:Foreignkey:将关系CUSTOMER中的主键CustomerNumber放入关系ENROLLMENT中。在这种情况下,关系ENROLLMENT中的属性CustomerNumber就被称为外键。Referenceintergrity:关系ENROLLMENT的CustomerNumber的值必须在CUSTOMER的CustomerNumber中存在对应项。这样的规则被称为参照完整性。理解函数依赖如:A→B可以读作A决定B,B依赖于A,A为决定因子。(A,B)→C说明复合的(A,B)是C的决定因子。不可以说A→C或B→C。A→(B,C)也可以说A→B和A→C.规范化(考试重点:要把示例看懂,考试的要求和书本上是一致的。)规范化定义:将一个具有多个主题的表或关系分割为一组表,使得每一个表只有一个主题。规范化过程:(1)确认关系的所有候选键。(2)确认关系中所有函数依赖关系。(3)检查函数依赖关系的决定因子。(4)根据需要,多次重复步骤。(5)直至每个关系的决定因子都是候选键。步骤1:根据规范化的过程,首先确定所有的候选键。考虑一切可能性,从左至右,一个一个分析。先分析单独一列,再分析组合键。经过分析,得出PRESCRIPTION的唯一候选键为PrescriptionNumber.步骤2:根据规范化的过程,可以确定所有的函数依赖关系。Drug→DosageCustomerEmail→(CustomerName,CustomerPhone)步骤3:决定存在的决定因子是否为候选键。CustomerEmail是一个决定因子,不是候选键。CUSTOMER(CustomerEmail,CustomerPhone,CustomerName)PRESCRIPTION(PrescriptionNumber,Date,Drug,Dosage,CustomerName)PRESCRIPTION中的CustomerEmail必须在CUSTOMER的值中找到对应项。补充:1.第一范式(1NF)无重复的列在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。2.第二范式(2NF)属性完全依赖于主键,要求数据库表中的每个实例或行必须可以被唯一地区分。3.第三范式(3NF)属性不依赖于其它非主属性。简而言之,第三范式(3NF)要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。所有的高级范式要满足低级范式。怎么创建报表,要了解过程。结构化查询语言1.SQL并不是完整的编程语言,而更像是一种数据子语言。SQL是面向文本的。2.SQL命令可以划分为两个主要的类别:用于定义数据库结构的数据定义语言(DDL)以及用于查询和修改数据库的数据操作语言(DML)。3.外键不需要与它所引用的主键同名。(p106)4.业务规则(p109)(1)如果要删除表中的某一行,而该行又连接到另外一个表,则禁止对该表这一行进行删除操作。(1)如果删除了表中的某一行,则另一个表中连接到这个已经删除的表的行的所有行也将随之被删除。5.SQLDDL用于创建和改变数据库结构,并且用于插入、修改和删除表中的数据。SQLCREATTABLE语句用来创建表的结构,这个语句的基本结构参照(p110)列定义的3个部分为列名、列数据类型和对列值的约束.6.本书中讨论的列约束有PRIMARYKEY、NOTNULL、NULL、UNIOUE。除了这些列约束之外,还有CHECK列约束。而DEFAULT(不是列约束)可用于设置初始值。(p111)7.最基本的数据类型(具体参照p114)整数(Int)字符(Char)时间(DateTime)数字(Numeric)注意:Phone(Char)因为电话号码有分隔符其他的数据类型参见书上8.使用表约束定义主键(p115)利用表约束创建主键有3个优点:(1)这是定义复合键的要求,因为PRIMARYKEY(主键)列的约束不可以用于多个列。(2)其次开发人员可以使用表约束来命名定义主键的约束。(3)可以很方便的在一些DBMS产品中定义代理键。(p116)9.使用表约束定义外键(p117)在代理键永不变的情况下,ONUPDATE短语被设置为NOACTION(P118)(1)ONDELETECASCADE表示删除表中的某一行时,必须级联删除(2)ONDELETENOACTION是默认设置,表示A表连接到B表,则不允许删除A表的行。10.不同于SQLServer2005和MySQL,MSAccess不支持SQL脚本。可以使用CreateTable命令创建表,并且使用Insert命令插入数据,但一次只能执行一条SQL命令。11.SQL语句(1)SQLDML用于查询数据库以及修改表中的数据。(2)3种可能的数据修改操作:插入---更新----删除(3)可以使用SQLINSERT命令为关系添加数据。(p121)(4)SQL查询语句Select/from/where(p124)删除重复行DISTINCT。读取指定行用WHERE界定条件,指定列则不用WEHER界定。(p127)使用AND关键字在WHERE字句中放置更多的条件,意思是选择满足所有的条件。OR则是选择满足任一个条件的行。(p129)(5)关键字IN,指定列必须是值集中的某个值。(p130)查询表中值不是所列值的行,可以使用NOTIN。IN列值等于所列项的某一个值。NOTIN列值不等于所列值的任意一个值。这有点类似于AND和OR。(6)BETWEENAND指定值的范围LIKE查询部分匹配的值SQL通配字符是下划线_(一个未指定的字符)和%(一些列或者多个未指定的字符)具体例子参照(p132)(7)ISNULL查找含有NULL值的行(p133)(8)结果排序ORDERBYASC(升序)DESC(降序)(9)SQL的包括内置函数:COUNT、SUM、AVG、MAX、MIN。这些事针对SELECT语句结果进行操作的。1)COUNT用于任何数据类型,其他四个只能对整数、数值、其他数字类型执行操作。2)COUNT函数统计了结果集中行的数目,SUM一个数值列行的总和(p136)注意列的名称是不允许和内置函数一起混合使用的(p137)(10)GROUPBY语句分组HAVING字句应用某些条件,进一步限制所得结果(p138)GROUPBY和WHERE同时使用的时候,首先运用WHERE(11)用子查询处理多个表,一级查询内容来至一个表。具体例子p13912)使用连接查询多个表,查询内容包括多个表的内容。p141子查询只有在结果来自一个表的情况下才有用,要显示两个或者多个表中的数据就不能用只查询,要用到连接操作。连接的基本思想是:在连接原来两个或者多个关系的内容基础上再建立一个新关系。1)这里介绍了JOININ语法,连接一个表和连接两个表(p145)2)外连接,这样可以避免数据的丢失(p149)(13)修改删除表的数据(p150)用SOLUPDATESET修改表中已有的数据的值(14)删除数据DELETE语句DROPTABLE删除表的结构和所有表的数据(p153)ALTERTABLE用于添加、修改和删除列和约束。数据建模与实体—关系模型数据库系统开发的三个主要步骤:需求,设计,实现。1.需求分析阶段:设计者和系统用户进行交流,获得抽样表单、报表、查询和有关数据跟新活动的说明。2.设计阶段:数据库模型被转换成特定的数据库设计。包括数据库中各种表的设计、关联和约束的设计。3.实现阶段:构建数据库,并向其中填充数据;同时建立各种查询、表单和报表;此外还将编写程序。需求分析阶段1.数据库应用程序的需求分析来源:与用户交流、表单、报表、查询、用例、业务规则。2.需求分析阶段的工作:(1)与用户交流(2)从用户那里得到已有的示例表单、报表和查询等,询问用户是否需要修改现有表单以及是否需要添加新的表单、报表和查询。(3)用例描述用户将如何使用新信息系统的各个特征和功能。(4)系统开发人员确定限定数据库操作的业务规则。实体—关系数据模型1.数据需求转化为数据模型。2.创建数据模型的方法:实体—关系模型等。3.E—R模型中最重要的元素包括:实体、属性、标识符、关系。4.实体:用户希望跟踪的对象。给定类型的实体被分为实体集,实体集是实体的集合,由该集合中实体的结构来表示。实体集中有许多实体的实例。5.属性:实体都有属性,用来描述实体的特征。E—R模型中假定实体集的所有实例都具有相同的属性。6.标识符:实体都含有标识符,用于给不同的实体实例进行命名或标识的属性。实体实例的标识符可以由实体的一个或多个属性构成。标识符可以唯一或不唯一。但是关系模型中的主键或候选键必须具有唯一性,而标识符不一定。7.关系:实体之间通过关系进行关联。(1)关系中实体集的数目称为这个关系的度数。度数为2的关系叫做二元关系,度数为3的关系称为三元关系。(2)二元关系的三种类型:一对一1:1;一对多1:N;多对多N
本文标题:数据库原理笔记-(1)
链接地址:https://www.777doc.com/doc-5469417 .html