Oracle--分区表(范围分区、Hash分区、等)

原文地址:http://keepwork.iteye.com/blog/1949489

一、使用分区的优点:

    1、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;

    2、维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;

    3、均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;

    4、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。

 

二、Oracle数据库提供对表或索引的分区方法有几种(收集到四种):

    1、范围分区

    2、列表分区

    3、Hash分区(散列分区)

    4、复合分区

 

三、详描述分区实例:

    1)下面将以实例的方式分别对这三种分区方法来说明分区表的使用。为了测试方便,我们先建三个表空间。

Java代码   收藏代码
  1. create tablespace dinya_space01 datafile 'C:\表空间\dinya01.dbf' SIZE 5M;   
  2. create tablespace dinya_space02 datafile 'C:\表空间\dinya02.dbf' SIZE 5M;   
  3. create tablespace dinya_space03 datafile 'C:\表空间\dinya03.dbf' SIZE 5M;  
  4.   
  5. select * from user_tablespaces  

 

 

 

 

------------------------------------------范围分区

    范围分区就是对数据表中的某个值的范围进行分区,根据某个值的范围,决定将该数据存储在哪个分区上。

   如根据序号分区,根据业务记录的创建日期进行分区等。

    需求描述:有一个物料交易表,表名:material_transactions。该表将来可能有千万级的数据记录数。要求在建该表的时候使用分区表。

   这时候我们可以使用序号分区三个区,每个区中预计存储三千万的数据,也可以使用日期分区,如每五年的数据存储在一个分区上。

   

   根据交易记录的序号分区建表:

Java代码   收藏代码
  1. create table dinya_test  
  2. (  
  3.        transaction_id number primary key,  
  4.        item_id number(8) not null,  
  5.        item_description varchar2(300),  
  6.        transaction_date date not null  
  7. )  
  8. partition by range (transaction_id)  
  9. (  
  10.        partition part_01 values less than(2) tablespace dinya_space01,-----2条以下的交易在此分区上:part_01  
  11.        partition part_02 values less than(3) tablespace dinya_space02,-----等于+大于2而小于3的交易在此分区:part_02  
  12.        partition part_03 values less than(maxvalue) tablespace dinya_space03----大于3的交易在此分区:part_03  
  13. )  

 

 

   根据交易日期分区建表:

Java代码   收藏代码
  1. create table dinya_test  
  2. (  
  3.        transaction_id number primary key,  
  4.        item_id number(8) not null,  
  5.        item_description varchar2(300),  
  6.        transaction_date date not null    
  7.  )  
  8. partition by range (transaction_date)  
  9. (  
  10.        partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dinya_space01,  
  11.        partition part_02 values less than(to_date('2010-01-01','yyyy-mm-dd')) tablespace dinya_space02,  
  12.        partition part_03 values less than(maxvalue) tablespace dinya_space03  
  13.  )  

 

 

  这样我们就分别建了以交易序号和交易日期来分区的分区表。

  每次插入数据的时候,系统将根据指定的字段的值来自动将记录存储到制定的分区(表空间)中。

 

  当然,我们还可以根据需求,使用两个字段的范围分布来分区,如partition by range ( transaction_id ,transaction_date),分区条件中的值也做相应的改变,请读者自行测试。

 

 

  向表添加测试数据:

insert into dinya_test values(1,12,'BOOKS',sysdate);

insert into dinya_test values(2,12, 'BOOKS',sysdate+30);

insert into dinya_test values(3,12, 'BOOKS',to_date('2006-05-30','yyyy-mm-dd'));

insert into dinya_test values(4,12, 'BOOKS',to_date('2007-06-23','yyyy-mm-dd'));

insert into dinya_test values(5,12, 'BOOKS',to_date('2011-02-26','yyyy-mm-dd'));

insert into dinya_test values(6,12, 'BOOKS',to_date('2011-04-30','yyyy-mm-dd'));

 

 

  查询全表数据

Java代码   收藏代码
  1. select * from dinya_test;  

 

  查询分区的数据

Java代码   收藏代码
  1. select * from dinya_test partition(part_01);  
  2. select * from dinya_test partition(part_02);  
  3. select * from dinya_test partition(part_03);  

 

  修改part_01分区的数据

Java代码   收藏代码
  1. update dinya_test partition(part_01) t set t.item_description='DESK' where t.transaction_id=1;  

 

  删除part_03分区的数据

Java代码   收藏代码
  1. delete from dinya_test partition(part_03) t where t.transaction_id=4;  

 

 

创建索引

 

1)局部本地分区索引的创建:

Java代码   收藏代码
  1. create index dinya_idx_t on dinya_test(item_id)  
  2.  local  
  3.  (  
  4.      partition idx_1 tablespace dinya_space01,---分区名为:idx_1  
  5.      partition idx_2 tablespace dinya_space02, ---分区名为:idx_2  
  6.      partition idx_3 tablespace dinya_space03---分区名为:idx_3  
  7.  );   

 

 注:

 

 

Java代码   收藏代码
  1. select *from ALL_TAB_PARTITIONS where table_name ='DINYA_TEST'  
  2. select *From dba_ind_partitions where partition_name='IDX_1'  
 

 

2)全局分区索引的创建:

全局索引建立时global 子句允许指定索引的范围值,这个范围值为索引字段的范围值:

Java代码   收藏代码
  1. create index dinya_idx_t on dinya_test(item_id)  
  2.    global partition by range(item_id)  
  3.  (  
  4.      partition idx_1 values less than (1000) tablespace dinya_space01,  
  5.      partition idx_2 values less than (10000) tablespace dinya_space02,  
  6.      partition idx_3 values less than (maxvalue) tablespace dinya_space03  
  7.  );  
 

 

3)整个表创建索引:

Java代码   收藏代码
  1. Create index dinya_idx_t on dinya_test(item_id);  
  2. 备注: select *from all_indexes(dba_indexes、all_ind_columns 、user_ind_columns 、 dba_ind_columns)  
 

 

 

 

 

 

 

 

 

 

 

 

 

 

------------------------------------------Hash分区(散列分区)

    散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。如将物料交易表的数据根据交易ID散列地存放在指定的三个表空间中:

Java代码   收藏代码
  1. create table dinya_test  
  2.     (  
  3.        transaction_id number primary key,  
  4.         item_id number(8) not null,  
  5.         item_description varchar2(300),  
  6.         transaction_date date  
  7.    )  
  8.    partition by hash(transaction_id)  
  9.    (  
  10.        partition part_01 tablespace dinya_space01,  
  11.        partition part_02 tablespace dinya_space02,  
  12.        partition part_03 tablespace dinya_space03  
  13.  );  

建表成功,此时插入数据,系统将按transaction_id将记录散列地插入三个分区中,这里也就是三个不同的表空间中。

 

 

 

 

 

 

 

------------------------------------------列表分区:

该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。

示例1:

Java代码   收藏代码
  1. CREATE TABLE PROBLEM_TICKETS  
  2. (  
  3.    PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY,  
  4.    DESCRIPTION VARCHAR2(2000),  
  5.    CUSTOMER_ID NUMBER(7) NOT NULL,  
  6.    DATE_ENTERED DATE NOT NULL,  
  7.    STATUS VARCHAR2(20)  
  8. )  
  9. PARTITION BY LIST (STATUS)  
  10. (  
  11.    PARTITION PROB_ACTIVE VALUES ('ACTIVE') TABLESPACE PROB_TS01,                  
  12.    PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02  
  13. )     

备注:active和inactive是列status的值!谨记与range和hash分区的区别;

 

 

 

测试如下:

Java代码   收藏代码
  1. insert into PROBLEM_TICKETS values(1,'BOOKS',1,sysdate,'ACTIVE');  
  2. insert into PROBLEM_TICKETS values(2,'son',2,sysdate+30,'INACTIVE');  
  3. insert into PROBLEM_TICKETS values(3,'son',3,to_date('2006-05-30','yyyy-mm-dd'),'INACTIVE');  
  4. insert into PROBLEM_TICKETS values(4,'BOOKS',4,to_date('2007-06-23','yyyy-mm-dd'),'INACTIVE');  
  5. insert into PROBLEM_TICKETS values(5,'old',5,to_date('2011-02-26','yyyy-mm-dd'),'ACTIVE');  
  6. insert intoPROBLEM_TICKETSvalues(6,'test',6,to_date('2011-04-30','yyyy-mm-dd'),'INACTIVE');  
  7. select * from PROBLEM_TICKETS  
 在测试中遇到这样的情况。如果表创建了分区,如果要删除数据文件(表空间文件),则要先删除分区,然后才能删除数据文件(但是在删除数据文件时,必须要保留一个分区才能最终删除数据文件>表空间文件,)

当然,也可以直接就删除表也行,刚所有的全删除,但是表空间文件还在!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

------------------------------------------复合分区

 有时候我们需要根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区内再使用散列分区的一种分区方法,如将物料交易的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:

Java代码   收藏代码
  1. create table dinya_test  
  2. (  
  3.        transaction_id number primary key,  
  4.        item_id number(8) not null,  
  5.       item_description varchar2(300),  
  6.       transaction_date date  
  7. )  
  8. partition by range(transaction_date)subpartition by hash(transaction_id)  
  9.        subpartitions 3 store in (dinya_space07,dinya_space08,dinya_space09)  
  10. (  
  11.        partition part_07 values less than(to_date('2006-01-01','yyyy-mm-dd')),  
  12.        partition part_08 values less than(to_date('2010-01-01','yyyy-mm-dd')),  
  13.        partition part_09 values less than(maxvalue)  
  14. );  

  测试如下:

Java代码   收藏代码
  1. select *From user_tab_partitions where table_name=upper('dinya_test')  
  2. selec *From user_tab_subpartitions where table_name=upper('dinya_test')  
 

 

插入如下数据:

Java代码   收藏代码
  1. insert into dinya_test values(1,12,'BOOKS',sysdate);  
  2. insert into dinya_test values(2,12'BOOKS',sysdate+30);  
  3. insert into dinya_test values(3,12'BOOKS',to_date('2006-05-30','yyyy-mm-dd'));  
  4. insert into dinya_test values(7,12'BOOKS',to_date('2005-05-30','yyyy-mm-dd'));  
  5. insert into dinya_test values(4,12'BOOKS',to_date('2007-06-23','yyyy-mm-dd'));  
  6. insert into dinya_test values(5,12'BOOKS',to_date('2011-02-26','yyyy-mm-dd'));  
  7. insert into dinya_test values(6,12'BOOKS',to_date('2011-04-30','yyyy-mm-dd'));  

select *From dinya_test

select *From dinya_test partition(part_07)

select *From dinya_test partition(part_09)

 

参照下图,按所显的子分区名,看能否查出数据:

select*Fromuser_tab_subpartitions where table_name=upper('dinya_test')

select *From dinya_test subpartition(SYS_SUBP62)

 备注:  该例中,先是根据交易日期进行范围分区,然后根据交易的ID将记录散列地存储在三个表空间中。

 

 

 

 

 

 

 

 

 

 

------------------------------------------复合范围列表分区

这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。

示例1:

Java代码   收藏代码
  1. Create table sales  
  2. (  
  3.    Product_id varchar2(5),  
  4.    Sales_date date,  
  5.    Sales_cost number(10),  
  6.    Status varchar2(20)  
  7. )  
  8. Partition by range(Sales_cost)  
  9. Subpartition by list(status)  
  10. (  
  11.    Partition p1 values less than (1) tablespace dinya_space01  
  12.    (  
  13.        Subpartition p1sub1 values('ACTIVE') tablespace   dinya_space03,  
  14.        Subpartition p1sub2 values('INACTIVE') tablespace dinya_space04  
  15.    ),  
  16.    Partition p2 values less than (3) tablespace dinya_space02  
  17.    (  
  18.        Subpartition p1sub3 values('ACTIVE') tablespace    dinya_space05,  
  19.        Subpartition p1sub4 values('INACTIVE') tablespace dinya_space06  
  20.    )  
  21. )  
 测试如下:
Java代码   收藏代码
  1. insert into sales values(1,sysdate,0.1,'ACTIVE');  
  2. insert into sales values(2,sysdate+30,1,'INACTIVE');  
  3. insert into sales values(3,to_date('2006-05-30','yyyy-mm-dd'),2,'INACTIVE');  
  4.   
  5. select * From sales:  
  6. Select * from sales partition(p2)  
  7. SELECT * FROM SALES SUBPARTITION(p1sub4)  
  8. SELECT * FROM SALES SUBPARTITION(p1sub3)  
  9. select * From dba_tab_subpartitions where table_name='SALES'  
 

 

 

 

 

 

 

 

 

 

 

 

有关表分区的一些维护性操作:

一、添加分区

Java代码   收藏代码
  1. 以下代码给SALES表添加了一个P3分区  
  2. ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));  
  3. 注意:以上添加的分区界限应该高于最后一个分区界限。  
  4. 以下代码给SALES表的P3分区添加了一个P3SUB1子分区  
  5. ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');  
 

 

 

二、删除分区

Java代码   收藏代码
  1. 以下代码删除了P3表分区:  
  2. ALTER TABLE SALES DROP PARTITION P3;  
  3.  在测试中遇到这样的情况。如果表创建了分区,如果要删除数据文件(表空间文件),则要先删除分区,然后才能删除数据文件(但是在删除数据文件时,必须要保留一个分区才能最终删除数据文件>表空间文件,)  
  4. 当然,也可以直接就删除表也行,刚所有的全删除,但是表空间文件还在!  
  5.    
  6. 在以下代码删除了P4SUB1子分区:  
  7. ALTER TABLE SALES DROP SUBPARTITION P4SUB1;  
  8. 注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。  
 

三、截断分区

Java代码   收藏代码
  1. 截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:  
  2. ALTER TABLE SALES TRUNCATE PARTITION P2;  
  3. 通过以下代码截断子分区:  
  4. ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;  
 

四、合并分区

Java代码   收藏代码
  1. 合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:  
  2. ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;  

 

五、拆分分区

Java代码   收藏代码
  1. 拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。  
  2. ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD'))  
  3. INTO (PARTITION P21,PARTITION P22);  

 

六、接合分区(coalesca)

Java代码   收藏代码
  1. 结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:  
  2. ALTER TABLE SALES COALESCA PARTITION;  

 

七、重命名表分区

Java代码   收藏代码
  1. 以下代码将P21更改为P2  
  2. ALTER TABLE SALES RENAME PARTITION P21 TO P2;  
 

九、跨分区查询

Java代码   收藏代码
  1. select sum( *) from (  
  2. (select count(*) cn from t_table_SS PARTITION (P200709_1)  
  3. union all  
  4. select count(*) cn from t_table_SS PARTITION (P200709_2));  
 

十、查询表上有多少分区

Java代码   收藏代码
  1. SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'  
 

 

 

Java代码   收藏代码
  1. --显示数据库所有分区表的信息:  
  2. select * from DBA_PART_TABLES where table_name=upper('dinya_test')  
  3.    
  4. --显示当前用户可访问的所有分区表信息:  
  5. select * from ALL_PART_TABLES  
  6.   
  7. --显示当前用户所有分区表的信息:  
  8. select * from USER_PART_TABLES  
  9.   
  10. --显示表分区信息 显示数据库所有分区表的详细分区信息:  
  11. select * from DBA_TAB_PARTITIONS  
  12.    
  13. --显示当前用户可访问的所有分区表的详细分区信息:  
  14. select * from ALL_TAB_PARTITIONS  
  15.    
  16. --显示当前用户所有分区表的详细分区信息:  
  17. select * from USER_TAB_PARTITIONS  
  18.    
  19. --显示子分区信息 显示数据库所有组合分区表的子分区信息:  
  20. select * from DBA_TAB_SUBPARTITIONS  
  21.    
  22. --显示当前用户可访问的所有组合分区表的子分区信息:  
  23. select * from ALL_TAB_SUBPARTITIONS  
  24.    
  25. --显示当前用户所有组合分区表的子分区信息:  
  26. select * from USER_TAB_SUBPARTITIONS  
  27.    
  28. --显示分区列 显示数据库所有分区表的分区列信息:  
  29. select * from DBA_PART_KEY_COLUMNS  
  30.    
  31. --显示当前用户可访问的所有分区表的分区列信息:  
  32. select * from ALL_PART_KEY_COLUMNS  
  33.    
  34. --显示当前用户所有分区表的分区列信息:  
  35. select * from USER_PART_KEY_COLUMNS  
  36.    
  37. --显示子分区列 显示数据库所有分区表的子分区列信息:  
  38. select * from DBA_SUBPART_KEY_COLUMNS  
  39.    
  40. --显示当前用户可访问的所有分区表的子分区列信息:  
  41. select * from ALL_SUBPART_KEY_COLUMNS  
  42.    
  43. --显示当前用户所有分区表的子分区列信息:  
  44. select * from USER_SUBPART_KEY_COLUMNS  
  45.    
  46. --怎样查询出oracle数据库中所有的的分区表  
  47. select * from user_tables a where a.partitioned='YES'  
  48.    
  49. --删除一个表的数据是  
  50. truncate table table_name;  
  51.    
  52. --删除分区表一个分区的数据是  
  53. alter table table_name truncate partition p5;  

 

 

注:分区根据具体情况选择。

 

表分区有以下优点:

1、数据查询:数据被存储到多个文件上,减少了I/O负载,查询速度提高。

2、数据修剪:保存历史数据非常的理想。

3、备份:将大表的数据分成多个文件,方便备份和恢复。

4、并行性:可以同时向表中进行DML操作,并行性性能提高。

================================================

 

 

 
 
 
 
 
 
 
 

索引:

1、一般索引:

Java代码   收藏代码
  1. create index index_name on table(col_name);  

 

2Oracle 分区索引详解

语法:Table Index

Java代码   收藏代码
  1. CREATE [UNIQUE|BITMAP] INDEX [schema.]index_name  
  2. ON [schema.]table_name [tbl_alias]  
  3. (col [ASC | DESC]) index_clause index_attribs  

 

index_clauses:

分以下两种情况

 

1. Local Index

就是索引信息的存放位置依赖于父表的Partition信息,换句话说创建这样的索引必须保证父表是Partition

1.1 索引信息存放在父表的分区所在的表空间。但是仅可以创建在父表为HashTable或者composite分区表的。

Java代码   收藏代码
  1. LOCAL STORE IN (tablespace)  

 

1.2 仅可以创建在父表为HashTable或者composite分区表的。并且指定的分区数目要与父表的分区数目要一致

Java代码   收藏代码
  1. LOCAL STORE IN (tablespace) (PARTITION [partition [LOGGING|NOLOGGING] [TABLESPACE {tablespace|DEFAULT}] [PCTFREE int] [PCTUSED int] [INITRANS int] [MAXTRANS int] [STORAGE storage_clause] [STORE IN {tablespace_name|DEFAULT] [SUBPARTITION [subpartition [TABLESPACE tablespace]]]])  

 

 

1.3 索引信息存放在父表的分区所在的表空间,这种语法最简单,也是最常用的分区索引创建方式。

Local

1.4 并且指定的Partition 数目要与父表的Partition要一致

Java代码   收藏代码
  1. LOCAL (PARTITION [partition  
  2. [LOGGING|NOLOGGING]  
  3. [TABLESPACE {tablespace|DEFAULT}]  
  4. [PCTFREE int]  
  5. [PCTUSED int]  
  6. [INITRANS int]  
  7. [MAXTRANS int]  
  8. [STORAGE storage_clause]  
  9. [STORE IN {tablespace_name|DEFAULT]  
  10. [SUBPARTITION [subpartition [TABLESPACE tablespace]]]])  

 

 

Global Index

索引信息的存放位置与父表的Partition信息完全不相干。甚至父表是不是分区表都无所谓的。

语法如下:

Java代码   收藏代码
  1. GLOBAL PARTITION BY RANGE (col_list)  
  2. ( PARTITION partition VALUES LESS THAN (value_list)  
  3. [LOGGING|NOLOGGING]  
  4. [TABLESPACE {tablespace|DEFAULT}]  
  5. [PCTFREE int]  
  6. [PCTUSED int]  
  7. [INITRANS int]  
  8. [MAXTRANS int]  
  9. [STORAGE storage_clause] )  
  10. 但是在这种情况下,如果父表是分区表,要删除父表的一个分区都必须要更新Global Index ,否则索引信息不正确  
  11. ALTER TABLE TableName DROP PARTITION PartitionName Update Global Indexes  

 

 

 

--查询索引

Java代码   收藏代码
  1. select object_name,object_type,tablespace_name,sum(value)  
  2. from v$segment_statistics  
  3. where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'  
  4. group by object_name,object_type,tablespace_name  
  5. order by 4 desc  

你可能感兴趣的:(分区表)