您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > Oracle库表设计的若干方法2
优化Oracle库表设计的若干方法1前言绝大多数的Oracle数据库性能问题都是由于数据库设计不合理造成的,只有少部分问题根植于DatabaseBuffer、SharePool、RedoLogBuffer等内存模块配置不合理,I/O争用,CPU争用等DBA职责范围上。所以除非是面对一个业已完成不可变更的系统,否则我们不应过多地将关注点投向内存、I/O、CPU等性能调整项目上,而应关注数据库表本身的设计是否合理,库表设计的合理性才是程序性能的真正执牛耳者。合理的数据库设计需要考虑以下的方面:·业务数据以何种方式表达。如一个员工有多个Email,你可以在T_EMPLOYEE表中建立多个Email字段如email_1、email_2、email_3,也可以创建一个T_EMAIL子表来存储,甚至可以用逗号分隔开多个Email地址存放在一个字段中。·数据以何种方式物理存储。如大表的分区,表空间的合理设计等。·如何建立合理的数据表索引。表索引几乎是提高数据表查询性能最有效的方法,Oracle拥有类型丰富的数据表索引类型,如何取舍选择显得特别重要。本文我们将目光主要聚焦于数据表的索引上,同时也将提及其他两点的内容。通过对一个简单的库表设计实例的分析引出设计中的不足,并逐一改正。考虑到手工编写库表的SQL脚本原始且低效,我们将用目前最流行的库表设计工具PowerDesigner10来讲述表设计的过程,所以在本文中你还会了解到一些相关的PowerDesigner的使用技巧。一个简单的例子某个开发人员着手设计一个订单的系统,这个系统中有两个主要的业务表,分别是订单基本信息表和订单条目表,这两张表具有主从关系的表,其中T_ORDER是订单主表,而T_ORDER_ITEM是订单条目表。数据库设计人员的设计成果如图1所示:图1订单主从表ORDER_ID是订单号,为T_ORDER的主键,通过名为SEQ_ORDER_ID的序列产生键值,而ITEM_ID是T_ORDER_ITEM表的主键,通过名为SEQ_ORDER_ITEM的序列产生键值,T_ORDER_ITEM通过ORDER_ID外键关联到T_ORDER表。需求文档指出订单记录将通过以下两种方式来查询数据:·CLIENT+ORDER_DATE+IS_SHPPED:根据客户+订货日期+是否发货条件查询订单及订单条目。·ORDER_DATE+IS_SHIPPED:根据订货日期+是否发货条件查询订单及订单条目。数据库设计人员根据这个要求,在T_ORDER表的CLIENT、ORDER_DATE及IS_SHPPED三字段上建立了一个复合索引IDX_ORDER_COMPOSITE;在T_ORDER_ITEM为外键ORDER_ID建立IDX_ORDER_ITEM_ORDER_ID索引。让我们看一下该份设计的最终SQL脚本:/*订单表*/createtableT_ORDER(ORDER_IDNUMBER(10)notnull,ADDRESSVARCHAR2(100),CLIENTVARCHAR2(60),ORDER_DATECHAR(8),IS_SHIPPEDCHAR(1),constraintPK_T_ORDERprimarykey(ORDER_ID));createindexIDX_CLIENTonT_ORDER(CLIENTASC,ORDER_DATEASC,IS_SHIPPEDASC);/*订单条目子表*/createtableT_ORDER_ITEM(ITEM_IDNUMBER(10)notnull,ORDER_IDNUMBER(10),ITEMVARCHAR2(20),COUNTNUMBER(10),constraintPK_T_ORDER_ITEMprimarykey(ITEM_ID));createindexIDX_ORDER_ITEM_ORDER_IDonT_ORDER_ITEM(ORDER_IDASC);altertableT_ORDER_ITEMaddconstraintFK_T_ORDER__REFERENCE_T_ORDERforeignkey(ORDER_ID)referencesT_ORDER(ORDER_ID);我们承认在ER关系上,这份设计并不存在的缺陷,但却存在以下有待优化的地方:·没有将表数据和索引数据存储到不同的表空间中,而不加区别地将它们存储到同一表空间里。这样,不但会造成I/O竞争,也为数据库的维护工作带来不便。·ORACLE会自动为表的主键列创建一个普通B-Tree索引,但由于这两张表的主键值都通过序列提供,具有严格的顺序性(升序或降序),此时手工为其指定一个反键索引(reversekeyindex)将更加合理。·在子表T_ORDER_ITEM外键列ORDER_ID上建立的IDX_ORDER_ITEM_ORDER_ID的普通B-Tree索引非常适合设置为压缩型索引,即建立一个压缩型的B-Tree索引。因为一份订单会对应多个订单条目,这就意味着T_ORDER_ITEM表存在许多同值的ORDER_ID列值,通过将其索引指定为压缩型的B-Tree索引,不但可以减少IDX_ORDER_ITEM_ORDER_ID所需的存储空间,还将提高表操作的性能。·企图仅通过建立一个包含3字段IDX_ORDER_COMPOSITE复合索引满足如前所述的两种查询条件方式的索引是有问题的,事实上使用ORDER_DATE+IS_SHIPPED复合条件的查询将利用不到IDX_ORDER_COMPOSITE索引。补充:外键列索引问题:外键列上缺少索引会带来两个问题,限制并发性、影响性能。而这两个问题中的任意一个都可能会造成严重性能问题。无论是Oracle的官方文档,还是在Tom的书中都说明了两种情况下可以忽略外键上的索引。其实不需要那么麻烦,与增加一个索引所带来的性能开销和磁盘空间开销相比,确实索引可能引发的问题要严重得多。因此,选择在所有的外键列上添加索引,虽然可能导致创建了部分多余的索引,但是这样消除了外键约束由于确实索引所带来的性能问题和并发性问题。外键未加索引是导致死锁的主要的原因;这是因为,无论是更新父表主键,或者删除一个父记录,都会在子表中加一个表锁(在这条语句完成前,不允许对子表做任何修改)。这就会不必要地锁定更多的行,而影响并发性。如果外键列上缺少索引,从主表关联子表的查询就只能对子表选择全表扫描的查询,这是显而易见的问题。优化Oracle库表设计的若干方法2优化设计1、将表数据和索引数据分开表空间存储1.1表数据和索引为何需要使用独立的表空间Oracle强烈建立,任何一个应用程序的库表至少需要创建两个表空间,其中之一用于存储表数据,而另一个用于存储表索引数据。因为如果将表数据和索引数据放在一起,表数据的I/O操作和索引的I/O操作将产生影响系统性能的I/O竞争,降低系统的响应效率。将表数据和索引数据存放在不同的表空间中(如一个为APP_DATA,另一个为APP_IDX),并在物理层面将这两个表空间的数据文件放在不同的物理磁盘上,就可以避免这种竞争了。拥有独立的表空间,就意味着可以独立地为表数据和索引数据提供独立的物理存储参数,而不会发生相互影响,毕竟表数据和索引数据拥有不同的特性,而这些特性又直接影响了物理存储参数的设定。此外,表数据和索引数据独立存储,还会带来数据管理和维护上的方便。如你在迁移一个业务数据库时,为了降低数据大小,可以只迁出表数据的表空间,在目标数据库中通过重建索引的方式就可以生成索引数据了。1.2表数据和索引使用不同表空间的SQL语法指定表数据及索引数据存储表空间语句最简单的形式如下。将表数据存储在APP_DATA表空间里:createtableT_ORDER(ORDER_IDNUMBER(10)notnull,…)tablespaceAPP_DATA;将索引数据存储在APP_IDX表空间里:createindexIDX_ORDER_ITEM_ORDER_IDonT_ORDER_ITEM(ORDER_IDASC)tablespaceAPP_IDX;1.3PowerDesigner中如何操作1)首先,必须创建两个表空间。通过Model-Tablespace...在ListofTablespaces中创建两个表空间:图2创建表空间2)为每张表指定表数据存储的表空间。在设计区中双击表,打开TableProperties设计窗口,切换到options页,按图3所示指定表数据的存储表空间。图3指定表数据的存储表空间3)为每个索引指定索引数据的存储表空间。在TableProperties中切换到Indexes页,在这里列出了表的所有索引,双击需设置表空间的索引,在弹出的IndexProperties窗口中切换到Options页,按如下方式指定索引的存储表空间。图4指定索引数据的存储表空间将表空间的问题延展一下:一个应用系统库表的表空间可以进行更精细的划分。首先,如果表中存在LOB类型的字段,有为其指定一个特定的表空间,因为LOB类型的数据在物理存储结构的管理上和一般数据的策略有很大的不同,将其放在一个独立的表空间中,就可方便地设置其物理存储参数了。其次,需要考虑库表数据的DML操作特性:根据DML(INSERT,UPDATE,DELETE)操作频繁程度,将几乎不发生任何DML操作的数据放在独立的表空间中,因为极少DML操作的表可设置符合其特性的物理参数:如PCTFREE可置为0,其BUFFER_POOL指定为KEEP,以便将数据缓存在KEEP数据缓存区中等等,不一而足。此外,还可以考虑按业务需要将不同的业务模块分开存放,这主要是考虑到备份问题。假设我们有一部分业务数据重要性很强,而其他的业务数据重要性相对较弱,这样就可以将两者分开存储,以便设置不同的备份策略。当然,无节制的细化表空间也将带来管理上和部署上的复杂,根据业务需求合理地规划表空间以达到管理和性能上的最佳往往需要更多的权衡。优化Oracle库表设计的若干方法32、显式为主键列建立反向键索引2.1反向键索引的原理和用途我们知道Oracle会自动为表的主键列建立索引,这个默认的索引是普通的B-Tree索引。对于主键值是按顺序(递增或递减)加入的情况,默认的B-Tree索引并不理想。这是因为如果索引列的值具有严格顺序时,随着数据行的插入,索引树的层级增长很快。搜索索引发生的I/O读写次数和索引树的层级数成正比,也就是说,一棵具有5个层级的B-Tree索引,在最终读取到索引数据时最多可能发生多达5次I/O操作。因而,减少索引的层级数是索引性能调整的一个重要方法。如果索引列的数据以严格的有序的方式插入,那么B-Tree索引树将变成一棵不对称的歪树,如图5所示:图5不对称的B-Tree索引而如果索引列的数据以随机值的方式插入,我们将得到一棵趋向对称的索引树,如图6所示:图6对称的B-Tree索引比较图5和图6,在图5中搜索到A块需要进行5次I/O操作,而图6仅需要3次I/O操作。既然索引列数据从序列中获取,其有序性无法规避,但在建立索引时,Oracle允许对索引列的值进行反向,即预先对列值进行比特位的反向,如1000,10001,10011,10111,1100经过反向后的值将是0001,1001,1101,0011。显然经过位反向处理的有序数据变得比较随机了,这样所得到的索引树就比较对称,从而提高表的查询性能。但反向键索引也有它局限性:如果在WHERE语句中,需要对索引列的值进行范围性的搜索,如BETWEEN、、等,其反向键索引无法使用,此时,Oracle将执行全表扫描;只有对反向键索引列进行??和=的比较操作时,其反向键索引才会得到使用。2.2反向键索引的SQL语句回到我们上面的例子,由于T_ORDER和T_ORDER_ITEM的主键值来源于序列,主键值是有严格顺序的,所以我们应该摒弃默认的Oracle所提供的索引,而采取显式为主键指定一个反向键索引的方式。ORDER_ID为T_ORDER表的主键,主键名为
本文标题:Oracle库表设计的若干方法2
链接地址:https://www.777doc.com/doc-11892 .html