当oracle单表的数据量大于2000万行时,建议进行水平分拆。
当一个数据库被创建之后,随着时间的推移和业务量的增加,数据库中表以及表中的数据量就会越来越多,就有可能出现两种弊端:
(1)数据库的存储资源是有限的,其负载能力也是有限的,数据的大量积累肯定会导致其处理数据的能力下降;
(2)数据量越多,那么对数据的增删改查操作的开销也会越来越大,所以,当出现如上两种情况,分库分表势在必行。
(1)垂直切分
适用场景:如果是因为表的个数多而让数据多,可以按照功能划分,把联系密切的表切分出来放在同一个库中(分库);
如果表的字段太多,可以以列为出发点,将字段进行拆分(分表);
(2)水平切分
适用场景:如果是因为表中的数据量过于庞大,则可以采用水平切分,按照某种约定好的规则将数据切分到不同的数据库中;
必须要根据当前数据库的情况做出合适的选择,也可以将两种情况结合在一起。
分库分表的结果会使数据分散,不好查询,主要有两种查询方式
(1)分步查:先查找主表,然后得到关联表的id,再发起请求得到关联数据;
(2)联合查:同时发起多个查询请求,然后将所有的结果集合起来
创建分区表
查询表分区
SELECT * FROM USER_TAB_PARTITIONS u WHERE u.table_name = 'tableName';
查询某个分区的数据
SELECT * FROM tableName PARTITION(partName);
新增分区
ALTER TABLE tableName ADD PARTITION partName VALUES LESS THAN(maxvalue);
删除分区
ALTER TABLE tableName DROP PARTITION partName;
清除分区
ALTER TABLE tableName TRUNCATE PARTITION partName;
删除子分区
ALTER TABLE tableName DROP SUBPARTITION partName;
清除子分区
ALTER TABLE tableName TRUNCATE SUBPARTITION partName;
根据分区名查询:
select * from 表名 partition('分区名');
根据分区键查询:
select * from 表名 partition where ACTDATETIME>=to_date('2022-03-02','yyyy-mm-dd') and ACTDATETIME
插入数据平均散列,随机分布在n个分区内
引用分区:基于由外键引用的父表的分区的方法,它依赖已有的父表子表的关系,子表通过外键关联到父表,进而继承了父表的分区方式而不需自己创建,子表还继承了父表的维护操作。
1、主表是范围分区,子表是引用分区
2、主表是列表分区,子表是引用分区
3、主表是散列分区,子表是引用分区
查看分区
SELECT * FROM USER_TAB_PARTITIONS u WHERE u.table_name in (tableName1,tableName2);
这一列是通过计算获得的虚拟列