分区表

1.      表分区的概念

表空间:

  是一个或多个数据文件的集合,所有的数据对象都存放在表空间中,但主要存放的是表,所以称表空间。

分区表:

  当表中的数据量不断增大,查询速度就会变慢,应用程序的性能会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上仍是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件)中,这样查询数据时,就不必每次都扫描整张表。

2.表分区的作用

表分区的作用体现在三个方面:

a.      可管理性:简化常见的管理任务

b.      性能:使某些查询及维护操作的性能大大提高

c.      可用性:分区是构建千兆字节数据系统的或超高可用性系统的关键工具

 

分区表能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从dba的角度看,一个分区后的对象具有多个段,这些段既可集体管理,也可单独管理,就使得在管理分区后的对象时具有较大的灵活性。而从应用程序的角度看,分区后的表与非分区表完全相同,使用sql dml命令访问分区表示也无需做任何修改。


使用分区表的场景:

表中的数据超过2G

表中包含历史数据,新的数据都被增加到新的分区中

总结起来就是:当表中的数据量已经非常庞大,或者能够被预测到有大数据量时

3.      表分区的优缺点

优点:

a.      改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。

b.      增强可用性:如果表的某个分区出现故障,其他分区仍然可用

c.      维护方便:如果表的某个分区出现故障,需要修复数据时只需要修复该分区

d.      均衡I/O:可以把不同分区映射到不同磁盘,以平衡I/O

缺点:

已经存在的表没办法直接转换为分区表,不过可以使用oracle在线重定义表的方式来把普通表改为分区表。

4.      表分区的类型及及操作方法

1).范围分区

范围分区将数据基于范围映射到每一个分区,范围是在创建分区时由指定的分区键决定的。是最常用的分区方法,而且分区键常采用日期,如销售数据按照月份进行分区。

范围分区有以下规则

a.      每一个分区都必须由一个values less than字句,指定一个不包括在该分区的上限值。

b.      所有分区都有一个隐式的下限值,即前一个分区的上限值。

c.      在最高的分区中,maxvalue被定义。Maxvalue代表一个不确定的值,这个值高于其他任何分区的键值(values less than的值),同时包括控制。

CASE1:

CREATE TABLE C_CUST(

cust_IDNUMBER NOT NULL PRIMARYKEY,

first_nameVARCHAR2(30)NOT NULL,

last_nameVARCHAR2(30)NOT NULL,

phoneVARCHAR2(15)NOT NULL,

emailVARCHAR2(80),

statusCHAR(1)

)

PARTITION BY RANGE(cust_id)

(

PARTITION part_1 VALUES LESS THAN(1000)TABLESPACE USERS,

PARTITION part_2 VALUES LESS THAN(2000)TABLESPACE USERS

)

Case2(maxvalue):

CREATE TABLE ORDER_ACTIVITIES(

ORDER_DATEDATE,

TOTAL_MOUNTNUMBER,

CUST_IDNUMBER,

PAID CHAR(1))

PARTITION BY RANGE(ORDER_DATE)

(

PARTITION PART_1 VALUES LESS THAN(TO_DATE('2012/1/1','YYYY/MM/DD')),

PARTITION PART_2 VALUES LESS THAN(TO_DATE('2014/1/1','YYYY/MM/DD')),

PARTITION PART_3 VALUES LESS THAN(TO_DATE('2016/1/1','YYYY/MM/DD')),

PARTITION part_4 VALUES LESS THAN(MAXVALUE)

)

2).列表分区:常使用与某列的值只有几个,也常用于大数据量的流水表,以年月作为键值,如201401.

CASE1:

create TABLE A_RCVBL_GAS_FLOW_H

(

  rcvbl_gas_id    NUMBER(16)default 0 not null,

  mr_sect_no      VARCHAR2(32),

  mr_mode         VARCHAR2(8),

  cons_no         VARCHAR2(16)not null,

  gas_sort        VARCHAR2(8)not null,

  t_gq            NUMBER(16)default 0,

  rcvbl_ym        VARCHAR2(6)not null,

  rcvbl_amt       NUMBER(18,2)default 0 not null,

  rcved_amt       NUMBER(18,2)default 0,

  rcvbl_penalty   NUMBER(18,2)default 0,

  rcved_penalty   NUMBER(18,2)default 0,

  fee_stat        VARCHAR2(8)not null,

  penalty_date    DATE,

  deadline_date   DATE,

  settle_flag     VARCHAR2(8)not null,

  pay_mode        VARCHAR2(8),

  rele_app_no     VARCHAR2(16),

  calc_id         NUMBER(16)default 0 not null,

  calc_date       VARCHAR2(8),

  org_no          VARCHAR2(16)not null,

  this_read       NUMBER(18,6),

  last_read       NUMBER(18,6),

  mr_epm_no       VARCHAR2(32),

  discount_amt    NUMBER(18,2),

  meter_id        NUMBER(16),

  service_cust_no VARCHAR2(16),

  gas_narure      VARCHAR2(16)

)

PARTITION BY LIST(rcvbl_ym)

(

PARTITION p201401 VALUES('201401')TABLESPACE USERS,

PARTITION p201402 VALUES('201402')TABLESPACE USERS,

PARTITION pmax VALUES(DEFAULT)

)

3).散列分区

散列分区是在列值上进行散列运算,以确定将行放入哪个分区。当列的值没有合适的值时,可以使用散列分区。散列分区为通过指定分区编号来均匀分布数据的一种分区类型,通过在I/O设备上进行散列分区,使这些分区的大小基本一致。

Case1:

CREATE TABLE t_hash(

col NUMBER(8),

col2 VARCHAR2(32)

)

PARTITION BY HASH (col)

(

PARTITION part_1 TABLESPACE hash_tbs1,

PARTITION part_2 TABLESPACE hash_tbs2

)

Case2:简写

a.

CREATE TABLE t_hash1(

col NUMBER(8),

col2 VARCHAR2(32)

)

PARTITION BY HASH (col)PARTITIONS 4

;

b.

CREATE TABLE t_hash2(

col NUMBER(8),

col2 VARCHAR2(32)

)

PARTITION BY HASH (col)PARTITIONS 4 STORE IN(USERS,USERS,USERS,USERS)

;

Hash分区最主要的机制是根据hash算法来计算某条记录应该存放到哪个分区中,hash算法中最重要的是hash函数,oracle中使用散列分区只需要指定分区的个数即可,如case1,建议分区的个数为2的n次方,可以是各个分区间数据分布更加均匀。

4).组合范围列表分区

基于范围分区和列表分区,先按某列进行范围分区,再按某列进行列表分区,分区之中的分区成为子分区。

Case1:

-- Create table

create table SALES

(

  product_id VARCHAR2(5),

  sales_date DATE,

  sales_cost NUMBER(10),

  status    VARCHAR2(6)

)

partition by range (SALES_DATE)

subpartition by list (STATUS)

(

  partition DATE2014 values less than(TO_DATE(' 2014-01-01 00:00:00','SYYYY-MM-DD HH24:MI:SS','NLS_CALENDAR=GREGORIAN'))

    tablespace USERS

    pctfree 10

    initrans 1

    maxtrans 255

  (

    subpartition STATUS_20141 values ('1')tablespace USERS,

    subpartition STATUS_20142 values ('2')tablespace USERS

  ),

  partition DATE2015 values less than(TO_DATE(' 2015-01-01 00:00:00','SYYYY-MM-DD HH24:MI:SS','NLS_CALENDAR=GREGORIAN'))

    tablespace USERS

  (

    subpartition STATUS_20151 values ('1')tablespace USERS,

    subpartition STATUS_20152 values ('2')tablespace USERS

  ),

  partition DATEMAX values less than(MAXVALUE)

    tablespace USERS

    pctfree 10

    initrans 1

    maxtrans 255

  (

    subpartition STATUS_MAX1 values ('1')tablespace USERS,

    subpartition STATUS_MAX2 values ('2')tablespace USERS

  )

);           

4).复合范围散列分区

 CREATE TABLE dinya_test(
transaction_id NUMBER PRIMARY KEY,
item_id NUMBER(8) NOT NULL,
item_desc VARCHAR2(300) NOT NULL,
transation_date DATE
)
PARTITION BY RANGE(transation_date) SUBPARTITION BY HASH(transation_date) STORE IN(USERS,USERS,USERS)
(
PARTITION part_01 VALUES LESS THAN (to_date('2015/01/01','YYYY/MM/DD')),
PARTITION PART_02 VALUES LESS THAN (TO_DATE('2016/01/01','YYYY/MM/DD')),
PARTITION PART_MAX VALUES LESS THAN (MAXVALUE)
)


你可能感兴趣的:(分区表)