您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 表空间及分区表的概念
1.表空间及分区表的概念表空间:是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表,所以称作表空间。分区表:当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个“表空间”(物理文件上),这样查询数据时,不至于每次都扫描整张表而只是从当前的分区查到所要的数据大大提高了数据查询的速度。2.表分区的具体作用ORACLE的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用SQLDML命令访问分区后的表时,无需任何修改。什么时候使用分区表:1.表的大小超过2GB。2.表中包含历史数据,新的数据被增加到新的分区中。3.表分区的优缺点表分区有以下优点:1)改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。2)增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;3)维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;4)均衡I/O:可以把不同的分区映射到不同磁盘以平衡I/O,改善整个系统性能。缺点:分区表相关:已经存在的表没有方法可以直接转化为分区表。不过ORACLE提供了在线重定义表的功能。4表分区的几种类型及操作方法4.1范围分区范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。当使用范围分区时,请考虑以下几个规则:1)每一个分区都必须有一个VALUESLESSTHAN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。2)所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。3)在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUELESSTHAN的值,同时包括空值。例一按行数划分假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:CREATETABLECUSTOMER(CUSTOMER_IDNUMBERNOTNULLPRIMARYKEY,FIRST_NAMEVARCHAR2(30)NOTNULL,LAST_NAMEVARCHAR2(30)NOTNULL,PHONEVARCHAR2(15)NOTNULL,EMAILVARCHAR2(80),STATUSCHAR(1))PARTITIONBYRANGE(CUSTOMER_ID)(PARTITIONCUS_PART1VALUESLESSTHAN(100000)TABLESPACECUS_TS01,PARTITIONCUS_PART2VALUESLESSTHAN(200000)TABLESPACECUS_TS02)例二按时间划分CREATETABLEORDER_ACTIVITIES(ORDER_IDNUMBER(7)NOTNULL,ORDER_DATEDATE,TOTAL_AMOUNTNUMBER,CUSTOTMER_IDNUMBER(7),PAIDCHAR(1))PARTITIONBYRANGE(ORDER_DATE)(PARTITIONORD_ACT_PART01VALUESLESSTHAN(TO_DATE('01-MAY-2003','DD-MON-YYYY'))TABLESPACEORD_TS01,PARTITIONORD_ACT_PART02VALUESLESSTHAN(TO_DATE('01-JUN-2003','DD-MON-YYYY'))TABLESPACEORD_TS02,PARTITIONORD_ACT_PART02VALUESLESSTHAN(TO_DATE('01-JUL-2003','DD-MON-YYYY'))TABLESPACEORD_TS03)例三MAXVALUECREATETABLERANGETABLE(IDDINTPRIMARYKEY,INAMEVARCHAR(10),GRADEINT)PARTITIONBYRANGE(GRADE)(PARTITIONPART1VALUESLESSTHAN(1000)TABLESPACEPART1_TB,PARTITIONPART2VALUESLESSTHAN(MAXVALUE)TABLESPACEPART2_TB);4.2列表分区该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。例一CREATETABLEPROBLEM_TICKETS(PROBLEM_IDNUMBER(7)NOTNULLPRIMARYKEY,DESCRIPTIONVARCHAR2(2000),CUSTOMER_IDNUMBER(7)NOTNULL,DATE_ENTEREDDATENOTNULL,STATUSVARCHAR2(20))PARTITIONBYLIST(STATUS)(PARTITIONPROB_ACTIVEVALUES('ACTIVE')TABLESPACEPROB_TS01,PARTITIONPROB_INACTIVEVALUES('INACTIVE')TABLESPACEPROB_TS02);例二CREATETABLELISTTABLE(IDINTPRIMARYKEY,NAMEVARCHAR(20),AREAVARCHAR(10))PARTITIONBYLIST(AREA)(PARTITIONPART1VALUES('GUANGDONG','BEIJING')TABLESPACEPART1_TB,PARTITIONPART2VALUES('SHANGHAI','NANJING')TABLESPACEPART2_TB);4.3散列分区这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。散列分区(也称HASH分区)为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。例一CREATETABLEHASH_TABLE(COLNUMBER(8),INFVARCHAR2(100))PARTITIONBYHASH(COL)(PARTITIONPART01TABLESPACEHASH_TS01,PARTITIONPART02TABLESPACEHASH_TS02,PARTITIONPART03TABLESPACEHASH_TS03)简写:CREATETABLEEMP(EMPNONUMBER(4),ENAMEVARCHAR2(30),SALNUMBER)PARTITIONBYHASH(EMPNO)PARTITIONS8STOREIN(TBS01,TBS02,TBS03,TBS04,TBS05,TBS06,TBS07,TBS08);HASH分区最主要的机制是根据HASH算法来计算具体某条纪录应该插入到哪个分区中,HASH算法中最重要的是HASH函数,ORACLE中如果你要使用HASH分区,只需指定分区的数量即可。建议分区的数量采用2的N次方,这样可以使得各个分区间数据分布更加均匀。4.4组合范围列表分区这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。CREATETABLESALES(PRODUCT_IDVARCHAR2(5),SALES_DATEDATE,SALES_COSTNUMBER(10),STATUSVARCHAR2(20))PARTITIONBYRANGE(SALES_DATE)SUBPARTITIONBYLIST(STATUS)(PARTITIONP1VALUESLESSTHAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACERPTFACT2009(SUBPARTITIONP1SUB1VALUES('ACTIVE')TABLESPACERPTFACT2009,SUBPARTITIONP1SUB2VALUES('INACTIVE')TABLESPACERPTFACT2009),PARTITIONP2VALUESLESSTHAN(TO_DATE('2003-03-01','YYYY-MM-DD'))TABLESPACERPTFACT2009(SUBPARTITIONP2SUB1VALUES('ACTIVE')TABLESPACERPTFACT2009,SUBPARTITIONP2SUB2VALUES('INACTIVE')TABLESPACERPTFACT2009))4.5复合范围散列分区这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。CREATETABLEDINYA_TEST(TRANSACTION_IDNUMBERPRIMARYKEY,ITEM_IDNUMBER(8)NOTNULL,ITEM_DESCRIPTIONVARCHAR2(300),TRANSACTION_DATEDATE)PARTITIONBYRANGE(TRANSACTION_DATE)SUBPARTITIONBYHASH(TRANSACTION_ID)SUBPARTITIONS3STOREIN(DINYA_SPACE01,DINYA_SPACE02,DINYA_SPACE03)(PARTITIONPART_01VALUESLESSTHAN(TO_DATE(‘2006-01-01’,’YYYY-MM-DD’)),PARTITIONPART_02VALUESLESSTHAN(TO_DATE(‘2010-01-01’,’YYYY-MM-DD’)),PARTITIONPART_03VALUESLESSTHAN(MAXVALUE));5有关表分区的一些维护性操作5.1添加分区以下代码给SALES表添加了一个P3分区ALTERTABLESALESADDPARTITIONP3VALUESLESSTHAN(TO_DATE('2003-06-01','YYYY-MM-DD'))TABLESPACESPACE_NAME;注意:增加一个分区的时候,增加的分区的条件必须大于现有分区的最大值,否则系统将提示ORA-14074PARTITIONBOUNDMUSTCOLLATEHIGHERTHANTHATOFTHELASTPARTITION错误。以下代码给SALES表的P3分区添加了一个P3SUB1子分区ALTERTABLESALESMODIFYPARTITIONP3ADDSUBPARTITIONP3SUB1VALUES('COMPLETE')TABLESPACESPACE_NAME;5.2删除分区以下代码删除了SALES表中名为P3的分区:ALTERTABLESALESDROPPARTITIONP3;在以下代码删除了P4SUB1子分区:ALTERTABLESALESDROPSUBPARTITIONP4SUB1;注意:如果删除
本文标题:表空间及分区表的概念
链接地址:https://www.777doc.com/doc-4589661 .html