叽哩古哩

Oracle--分区表（范围分区、Hash分区、等）

原文地址：http://keepwork.iteye.com/blog/1949489

一、使用分区的优点：

1、增强可用性：如果表的某个分区出现故障，表在其他分区的数据仍然可用；

2、维护方便：如果表的某个分区出现故障，需要修复数据，只修复该分区即可；

3、均衡I/O：可以把不同的分区映射到磁盘以平衡I/O，改善整个系统性能；

4、改善查询性能：对分区对象的查询可以仅搜索自己关心的分区，提高检索速度。

二、Oracle数据库提供对表或索引的分区方法有几种（收集到四种）：

1、范围分区

2、列表分区

3、Hash分区（散列分区）

4、复合分区

三、详描述分区实例：

1）下面将以实例的方式分别对这三种分区方法来说明分区表的使用。为了测试方便，我们先建三个表空间。

       Java代码   
       
     
 create tablespace dinya_space01 datafile 'C:\表空间\dinya01.dbf' SIZE 5M;   
 create tablespace dinya_space02 datafile 'C:\表空间\dinya02.dbf' SIZE 5M;   
 create tablespace dinya_space03 datafile 'C:\表空间\dinya03.dbf' SIZE 5M;  
   
 select * from user_tablespaces  

------------------------------------------范围分区

范围分区就是对数据表中的某个值的范围进行分区，根据某个值的范围，决定将该数据存储在哪个分区上。

如根据序号分区，根据业务记录的创建日期进行分区等。

需求描述：有一个物料交易表，表名：material_transactions。该表将来可能有千万级的数据记录数。要求在建该表的时候使用分区表。

这时候我们可以使用序号分区三个区，每个区中预计存储三千万的数据，也可以使用日期分区，如每五年的数据存储在一个分区上。

根据交易记录的序号分区建表：

       Java代码   
       
     
 create table dinya_test  
 (  
        transaction_id number primary key,  
        item_id number(8) not null,  
        item_description varchar2(300),  
        transaction_date date not null  
 )  
 partition by range (transaction_id)  
 (  
        partition part_01 values less than(2) tablespace dinya_space01,-----2条以下的交易在此分区上：part_01  
        partition part_02 values less than(3) tablespace dinya_space02,-----等于+大于2而小于3的交易在此分区：part_02  
        partition part_03 values less than(maxvalue) tablespace dinya_space03----大于3的交易在此分区：part_03  
 )  

根据交易日期分区建表：

       Java代码   
       
     
 create table dinya_test  
 (  
        transaction_id number primary key,  
        item_id number(8) not null,  
        item_description varchar2(300),  
        transaction_date date not null    
  )  
 partition by range (transaction_date)  
 (  
        partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dinya_space01,  
        partition part_02 values less than(to_date('2010-01-01','yyyy-mm-dd')) tablespace dinya_space02,  
        partition part_03 values less than(maxvalue) tablespace dinya_space03  
  )  

这样我们就分别建了以交易序号和交易日期来分区的分区表。

每次插入数据的时候，系统将根据指定的字段的值来自动将记录存储到制定的分区（表空间）中。

当然，我们还可以根据需求，使用两个字段的范围分布来分区，如partition by range ( transaction_id ,transaction_date),分区条件中的值也做相应的改变，请读者自行测试。

向表添加测试数据：

insert into dinya_test values(1,12,'BOOKS',sysdate);

insert into dinya_test values(2,12, 'BOOKS',sysdate+30);

insert into dinya_test values(3,12, 'BOOKS',to_date('2006-05-30','yyyy-mm-dd'));

insert into dinya_test values(4,12, 'BOOKS',to_date('2007-06-23','yyyy-mm-dd'));

insert into dinya_test values(5,12, 'BOOKS',to_date('2011-02-26','yyyy-mm-dd'));

insert into dinya_test values(6,12, 'BOOKS',to_date('2011-04-30','yyyy-mm-dd'));

查询全表数据

       Java代码   
       
 select * from dinya_test;

查询分区的数据

       Java代码   
       
     
 select * from dinya_test partition(part_01);  
 select * from dinya_test partition(part_02);  
 select * from dinya_test partition(part_03);  

修改part_01分区的数据

       Java代码   
       
 update dinya_test partition(part_01) t set t.item_description='DESK' where t.transaction_id=1;

删除part_03分区的数据

       Java代码   
       
 delete from dinya_test partition(part_03) t where t.transaction_id=4;

创建索引

1)局部本地分区索引的创建：

       Java代码   
       
     
 create index dinya_idx_t on dinya_test(item_id)  
  local  
  (  
      partition idx_1 tablespace dinya_space01,---分区名为：idx_1  
      partition idx_2 tablespace dinya_space02, ---分区名为：idx_2  
      partition idx_3 tablespace dinya_space03---分区名为：idx_3  
  );　  

注：

       Java代码   
       
     
 select *from ALL_TAB_PARTITIONS where table_name ='DINYA_TEST'  
 select *From dba_ind_partitions where partition_name='IDX_1'  

2)全局分区索引的创建：

全局索引建立时global 子句允许指定索引的范围值，这个范围值为索引字段的范围值：

       Java代码   
       
     
 create index dinya_idx_t on dinya_test(item_id)  
    global partition by range(item_id)  
  (  
      partition idx_1 values less than (1000) tablespace dinya_space01,  
      partition idx_2 values less than (10000) tablespace dinya_space02,  
      partition idx_3 values less than (maxvalue) tablespace dinya_space03  
  );  

3)整个表创建索引：

       Java代码   
       
     
 Create index dinya_idx_t on dinya_test(item_id);  
 备注：　select *from all_indexes(dba_indexes、all_ind_columns 、user_ind_columns 、 dba_ind_columns)  

------------------------------------------Hash分区（散列分区）

散列分区为通过指定分区编号来均匀分布数据的一种分区类型，因为通过在I/O设备上进行散列分区，使得这些分区大小一致。如将物料交易表的数据根据交易ID散列地存放在指定的三个表空间中：

       Java代码   
       
     
 create table dinya_test  
     (  
        transaction_id number primary key,  
         item_id number(8) not null,  
         item_description varchar2(300),  
         transaction_date date  
    )  
    partition by hash(transaction_id)  
    (  
        partition part_01 tablespace dinya_space01,  
        partition part_02 tablespace dinya_space02,  
        partition part_03 tablespace dinya_space03  
  );  

建表成功，此时插入数据，系统将按transaction_id将记录散列地插入三个分区中，这里也就是三个不同的表空间中。

------------------------------------------列表分区：

该分区的特点是某列的值只有几个，基于这样的特点我们可以采用列表分区。

示例1：

       Java代码   
       
     
 CREATE TABLE PROBLEM_TICKETS  
 (  
    PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY,  
    DESCRIPTION VARCHAR2(2000),  
    CUSTOMER_ID NUMBER(7) NOT NULL,  
    DATE_ENTERED DATE NOT NULL,  
    STATUS VARCHAR2(20)  
 )  
 PARTITION BY LIST (STATUS)  
 (  
    PARTITION PROB_ACTIVE VALUES ('ACTIVE') TABLESPACE PROB_TS01,                  
    PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02  
 )     

备注：active和inactive是列status的值！谨记与range和hash分区的区别;

测试如下：

       Java代码   
       
     
 insert into PROBLEM_TICKETS values(1,'BOOKS',1,sysdate,'ACTIVE');  
 insert into PROBLEM_TICKETS values(2,'son',2,sysdate+30,'INACTIVE');  
 insert into PROBLEM_TICKETS values(3,'son',3,to_date('2006-05-30','yyyy-mm-dd'),'INACTIVE');  
 insert into PROBLEM_TICKETS values(4,'BOOKS',4,to_date('2007-06-23','yyyy-mm-dd'),'INACTIVE');  
 insert into PROBLEM_TICKETS values(5,'old',5,to_date('2011-02-26','yyyy-mm-dd'),'ACTIVE');  
 insert intoPROBLEM_TICKETSvalues(6,'test',6,to_date('2011-04-30','yyyy-mm-dd'),'INACTIVE');  
 select * from PROBLEM_TICKETS  

在测试中遇到这样的情况。如果表创建了分区，如果要删除数据文件（表空间文件），则要先删除分区，然后才能删除数据文件（但是在删除数据文件时，必须要保留一个分区才能最终删除数据文件>表空间文件，）

当然，也可以直接就删除表也行，刚所有的全删除，但是表空间文件还在！

------------------------------------------复合分区

有时候我们需要根据范围分区后，每个分区内的数据再散列地分布在几个表空间中，这样我们就要使用复合分区。复合分区是先使用范围分区，然后在每个分区内再使用散列分区的一种分区方法，如将物料交易的记录按时间分区，然后每个分区中的数据分三个子分区，将数据散列地存储在三个指定的表空间中：

       Java代码   
       
     
 create table dinya_test  
 (  
        transaction_id number primary key,  
        item_id number(8) not null,  
    　  item_description varchar2(300),  
  　    transaction_date date  
 )  
 partition by range(transaction_date)subpartition by hash(transaction_id)  
        subpartitions 3 store in (dinya_space07,dinya_space08,dinya_space09)  
 (  
        partition part_07 values less than(to_date('2006-01-01','yyyy-mm-dd')),  
        partition part_08 values less than(to_date('2010-01-01','yyyy-mm-dd')),  
        partition part_09 values less than(maxvalue)  
 );  

测试如下：

       Java代码   
       
     
 select *From user_tab_partitions where table_name=upper('dinya_test')  
 selec *From user_tab_subpartitions where table_name=upper('dinya_test')  

插入如下数据：

       Java代码   
       
     
 insert into dinya_test values(1,12,'BOOKS',sysdate);  
 insert into dinya_test values(2,12, 'BOOKS',sysdate+30);  
 insert into dinya_test values(3,12, 'BOOKS',to_date('2006-05-30','yyyy-mm-dd'));  
 insert into dinya_test values(7,12, 'BOOKS',to_date('2005-05-30','yyyy-mm-dd'));  
 insert into dinya_test values(4,12, 'BOOKS',to_date('2007-06-23','yyyy-mm-dd'));  
 insert into dinya_test values(5,12, 'BOOKS',to_date('2011-02-26','yyyy-mm-dd'));  
 insert into dinya_test values(6,12, 'BOOKS',to_date('2011-04-30','yyyy-mm-dd'));  

select *From dinya_test

select *From dinya_test partition(part_07)

select *From dinya_test partition(part_09)

参照下图，按所显的子分区名，看能否查出数据：

select*Fromuser_tab_subpartitions where table_name=upper('dinya_test')

select *From dinya_test subpartition(SYS_SUBP62)

备注：该例中，先是根据交易日期进行范围分区，然后根据交易的ID将记录散列地存储在三个表空间中。

------------------------------------------复合范围列表分区

这种分区是基于范围分区和列表分区，表首先按某列进行范围分区，然后再按某列进行列表分区，分区之中的分区被称为子分区。

示例1：

       Java代码   
       
     
 Create table sales  
 (  
    Product_id varchar2(5),  
    Sales_date date,  
    Sales_cost number(10),  
    Status varchar2(20)  
 )  
 Partition by range(Sales_cost)  
 Subpartition by list(status)  
 (  
    Partition p1 values less than (1) tablespace dinya_space01  
    (  
        Subpartition p1sub1 values('ACTIVE') tablespace   dinya_space03,  
        Subpartition p1sub2 values('INACTIVE') tablespace dinya_space04  
    ),  
    Partition p2 values less than (3) tablespace dinya_space02  
    (  
        Subpartition p1sub3 values('ACTIVE') tablespace    dinya_space05,  
        Subpartition p1sub4 values('INACTIVE') tablespace dinya_space06  
    )  
 )  

测试如下：

       Java代码   
       
     
 insert into sales values(1,sysdate,0.1,'ACTIVE');  
 insert into sales values(2,sysdate+30,1,'INACTIVE');  
 insert into sales values(3,to_date('2006-05-30','yyyy-mm-dd'),2,'INACTIVE');  
   
 select * From sales：  
 Select * from sales partition(p2)  
 SELECT * FROM SALES SUBPARTITION(p1sub4)  
 SELECT * FROM SALES SUBPARTITION(p1sub3)  
 select * From dba_tab_subpartitions where table_name='SALES'  

有关表分区的一些维护性操作：

一、添加分区

       Java代码   
       
     
 以下代码给SALES表添加了一个P3分区  
 ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));  
 注意：以上添加的分区界限应该高于最后一个分区界限。  
 以下代码给SALES表的P3分区添加了一个P3SUB1子分区  
 ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');  

二、删除分区

       Java代码   
       
     
 以下代码删除了P3表分区：  
 ALTER TABLE SALES DROP PARTITION P3;  
  在测试中遇到这样的情况。如果表创建了分区，如果要删除数据文件（表空间文件），则要先删除分区，然后才能删除数据文件（但是在删除数据文件时，必须要保留一个分区才能最终删除数据文件>表空间文件，）  
 当然，也可以直接就删除表也行，刚所有的全删除，但是表空间文件还在！  
    
 在以下代码删除了P4SUB1子分区：  
 ALTER TABLE SALES DROP SUBPARTITION P4SUB1;  
 注意：如果删除的分区是表中唯一的分区，那么此分区将不能被删除，要想删除此分区，必须删除表。  

三、截断分区

       Java代码   
       
     
 截断某个分区是指删除某个分区中的数据，并不会删除分区，也不会删除其它分区中的数据。当表中即使只有一个分区时，也可以截断该分区。通过以下代码截断分区：  
 ALTER TABLE SALES TRUNCATE PARTITION P2;  
 通过以下代码截断子分区：  
 ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;  

四、合并分区

       Java代码   
       
     
 合并分区是将相邻的分区合并成一个分区，结果分区将采用较高分区的界限，值得注意的是，不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并：  
 ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;  

五、拆分分区

       Java代码   
       
     
 拆分分区将一个分区拆分两个新分区，拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。  
 ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD'))  
 INTO (PARTITION P21,PARTITION P22);  

六、接合分区(coalesca)

       Java代码   
       
     
 结合分区是将散列分区中的数据接合到其它分区中，当散列分区中的数据比较大时，可以增加散列分区，然后进行接合，值得注意的是，接合分区只能用于散列分区中。通过以下代码进行接合分区：  
 ALTER TABLE SALES COALESCA PARTITION;  

七、重命名表分区

       Java代码   
       
     
 以下代码将P21更改为P2  
 ALTER TABLE SALES RENAME PARTITION P21 TO P2;  

九、跨分区查询

       Java代码   
       
     
 select sum( *) from (  
 (select count(*) cn from t_table_SS PARTITION (P200709_1)  
 union all  
 select count(*) cn from t_table_SS PARTITION (P200709_2));  

十、查询表上有多少分区

       Java代码   
       
 SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'

       Java代码   
       
     
 --显示数据库所有分区表的信息：  
 select * from DBA_PART_TABLES where table_name=upper('dinya_test')  
    
 --显示当前用户可访问的所有分区表信息:  
 select * from ALL_PART_TABLES  
   
 --显示当前用户所有分区表的信息：  
 select * from USER_PART_TABLES  
   
 --显示表分区信息 显示数据库所有分区表的详细分区信息：  
 select * from DBA_TAB_PARTITIONS  
    
 --显示当前用户可访问的所有分区表的详细分区信息：  
 select * from ALL_TAB_PARTITIONS  
    
 --显示当前用户所有分区表的详细分区信息：  
 select * from USER_TAB_PARTITIONS  
    
 --显示子分区信息 显示数据库所有组合分区表的子分区信息：  
 select * from DBA_TAB_SUBPARTITIONS  
    
 --显示当前用户可访问的所有组合分区表的子分区信息：  
 select * from ALL_TAB_SUBPARTITIONS  
    
 --显示当前用户所有组合分区表的子分区信息：  
 select * from USER_TAB_SUBPARTITIONS  
    
 --显示分区列 显示数据库所有分区表的分区列信息：  
 select * from DBA_PART_KEY_COLUMNS  
    
 --显示当前用户可访问的所有分区表的分区列信息：  
 select * from ALL_PART_KEY_COLUMNS  
    
 --显示当前用户所有分区表的分区列信息：  
 select * from USER_PART_KEY_COLUMNS  
    
 --显示子分区列 显示数据库所有分区表的子分区列信息：  
 select * from DBA_SUBPART_KEY_COLUMNS  
    
 --显示当前用户可访问的所有分区表的子分区列信息：  
 select * from ALL_SUBPART_KEY_COLUMNS  
    
 --显示当前用户所有分区表的子分区列信息：  
 select * from USER_SUBPART_KEY_COLUMNS  
    
 --怎样查询出oracle数据库中所有的的分区表  
 select * from user_tables a where a.partitioned='YES'  
    
 --删除一个表的数据是  
 truncate table table_name;  
    
 --删除分区表一个分区的数据是  
 alter table table_name truncate partition p5;  

注：分区根据具体情况选择。

表分区有以下优点：

1、数据查询：数据被存储到多个文件上，减少了I/O负载，查询速度提高。

2、数据修剪：保存历史数据非常的理想。

3、备份：将大表的数据分成多个文件，方便备份和恢复。

4、并行性：可以同时向表中进行DML操作，并行性性能提高。

================================================

索引：

1、一般索引：

       Java代码   
       
 create index index_name on table(col_name);

2、Oracle 分区索引详解

语法：Table Index

       Java代码   
       
     
 CREATE [UNIQUE|BITMAP] INDEX [schema.]index_name  
 ON [schema.]table_name [tbl_alias]  
 (col [ASC | DESC]) index_clause index_attribs  

index_clauses:

分以下两种情况

1. Local Index

就是索引信息的存放位置依赖于父表的Partition信息，换句话说创建这样的索引必须保证父表是Partition

1.1 索引信息存放在父表的分区所在的表空间。但是仅可以创建在父表为HashTable或者composite分区表的。

       Java代码   
       
 LOCAL STORE IN (tablespace)

1.2 仅可以创建在父表为HashTable或者composite分区表的。并且指定的分区数目要与父表的分区数目要一致

       Java代码   
       
 LOCAL STORE IN (tablespace) (PARTITION [partition [LOGGING|NOLOGGING] [TABLESPACE {tablespace|DEFAULT}] [PCTFREE int] [PCTUSED int] [INITRANS int] [MAXTRANS int] [STORAGE storage_clause] [STORE IN {tablespace_name|DEFAULT] [SUBPARTITION [subpartition [TABLESPACE tablespace]]]])

1.3 索引信息存放在父表的分区所在的表空间，这种语法最简单，也是最常用的分区索引创建方式。

Local

1.4 并且指定的Partition 数目要与父表的Partition要一致

       Java代码   
       
     
 LOCAL (PARTITION [partition  
 [LOGGING|NOLOGGING]  
 [TABLESPACE {tablespace|DEFAULT}]  
 [PCTFREE int]  
 [PCTUSED int]  
 [INITRANS int]  
 [MAXTRANS int]  
 [STORAGE storage_clause]  
 [STORE IN {tablespace_name|DEFAULT]  
 [SUBPARTITION [subpartition [TABLESPACE tablespace]]]])  

Global Index

索引信息的存放位置与父表的Partition信息完全不相干。甚至父表是不是分区表都无所谓的。

语法如下：

       Java代码   
       
     
 GLOBAL PARTITION BY RANGE (col_list)  
 ( PARTITION partition VALUES LESS THAN (value_list)  
 [LOGGING|NOLOGGING]  
 [TABLESPACE {tablespace|DEFAULT}]  
 [PCTFREE int]  
 [PCTUSED int]  
 [INITRANS int]  
 [MAXTRANS int]  
 [STORAGE storage_clause] )  
 但是在这种情况下，如果父表是分区表，要删除父表的一个分区都必须要更新Global Index ,否则索引信息不正确  
 ALTER TABLE TableName DROP PARTITION PartitionName Update Global Indexes  

--查询索引

       Java代码   
       
     
 select object_name,object_type,tablespace_name,sum(value)  
 from v$segment_statistics  
 where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'  
 group by object_name,object_type,tablespace_name  
 order by 4 desc  

你可能感兴趣的:(分区表)

Oracle分区表之MODIFY 使用在线重定义对集合表进行分区 IT皮特 oracle 数据库
您可以使用联机重新定义将未分区的集合表复制到已分区的集合表格，Oracle数据库将行插入集合表格中的相应分区。示例4-41说明了如何对Objects列中的嵌套表执行此操作；类似的例子适用于XMLType表或列中的有序集合类型表。在copy_table_dependents操作期间，您指定0或false用于复制索引和约束，因为您希望保留新定义的集合表的索引和约束。但是，集合表及其分区的名称与临时表的
Online Conversion of a Non-Partitioned Table to a Partitioned Table in Oracle Database 12c Release 2 IT皮特数据库 oracle
从12.2开始，通过MODIFYTABLE可以在线实现普通表转分区表。一、创建测试表：DROPTABLEt1PURGE;CREATETABLEt1(idNUMBER,descriptionVARCHAR2(50),created_dateDATE,CONSTRAINTt1_pkPRIMARYKEY(id));CREATEINDEXt1_created_date_idxONt1(created_da
hive表格统计信息不准确 weixin_41956627 hive hive hadoop 数据仓库
问题描述有个hive分区表，orc存储格式，有个分区，查询selectcount(1)fromtablewheredt='yyyyMMdd'结果是0，但查询select*fromtablewheredt='yyyyMMdd'又能查到数据，去hdfs对应目录下查看，也能看到有数据文件解决执行如下sqlANALYZETABLEdb.table1PARTITION(dt='20240908')COMPU
二.Linux手动分区标准及建议：皆过客，揽星河 Linux操作系统 linux 运维服务器学习开发语言笔记
1.boot分区（标准分区）：一般300Mb左右作用：引导分区，包含了系统启动的必要内核文件，即使根分区损坏也能正常引导启动，一般这些文件所占空间在200M以内。分区建议：分区的时候可选100M-500M之间,如果空间足够用，建议分300-500M。避免由于长期使用的冗余文件塞满这个分区。分区格式：建议ext4，可按需求更改。2./boot/efi分区：一般200M左右作用：对于GPT分区表（UE
Linux 磁盘分区及挂载 go_forever_happy linux 服务器运维
目录查看分区情况查看磁盘查看哪块磁盘未加载和分区对未进行挂载的磁盘进行分区内核重新读取分区表再查看磁盘分区情况创建文件系统及格式化分区查看已经分区的磁盘文件系统格式化分区永久挂载至指定目录判断挂载是否正确查看文件系统，判断对应目录是否挂载对应分区镜像LVM分区创建及挂载1、磁盘分区及设置分区类型2、内核重新读取分区表3、创建pv4、创建VG（卷组）5、创建LV（逻辑卷）查看分区情况df-h可以查看
hive学习笔记之五：分桶程序员欣宸
欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容：所有原创文章分类汇总及配套源码，涉及Java、Docker、Kubernetes、DevOPS等；《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF用户自定义聚合函数(UDAF)UDTF本篇概览本文是《hive学习笔记》的第五篇
学习大数据DAY43 Sqoop 安装，配置环境和使用工科小石头大数据培训学习大数据 sqoop hive hadoop
目录sqoop安装配置mysqlsqoop安装sqoop指令集sqoop使用sqoop创建hive表sqoop全量导入表sqoop增量导入表sqoop全量导出表sqoop分区表导入表sqoop分区表导出表上机练习sqoop安装配置mysqlcreatedatabasetestDEFAULTCHARACTERSETutf8DEFAULTCOLLATEutf8_general_ci;--创建数据库sh
PostgreSQL分区表胖胖小李胡 postgresql 数据库
一、分区表的作用1.将数据按指定的方法打算到子分区，提高SQL性能。2.解决时序类、流水类业务大表在进行老旧数据清理时delete引起的性能及磁盘空间碎片问题。3.利用子分区卸载、重新挂载功能，对数据进行暂时性的隐藏、维护。4.数据归档治理业务场景：定期增加子分区、定期删除不需要的子分区来对数据进行滑窗处理，保持业务系统瘦身。5.添加子分区对业务透明，业务逻辑上只需要访问父表即可。二、业务场景举例
关于PostgreSQL的分区表的历史及分区裁剪参数enable_partition_pruning与constraint_exclusion的区别胖胖小李胡 postgresql postgresql 数据库
1.疑惑我们知道控制分区裁剪的参数有两个：enable_partition_pruningconstraint_exclusion这两个参数有什么区别呢？2.解答要说明这两个参数的区别需要先讲一讲PostgreSQL数据库中分区的历史，在PostgreSQL10版本之前，PostgreSQL数据库实际上是没有单独的创建分区表的DDL语句，都是通过表继承的原理来创建分区表，这样使得在PostgreS
【openGauss5.0.0版本】分区表新增的特性 - 示例若兰幽竹 openGauss openGauss
openGauss5.0.0版本中，List和range分区新增功能如下：List分区键最大数由1扩展为16列:createtabletp16(c1int,c2int,c3int,c4int,c5int,c6int,c7int,c8int,c9int,c10int,c11int,c12int,c13int,c14int,c15int,c16int)partitionbylist(c1,c2,c3,
hive学习（四） 2301_79721847 hive 学习 hadoop
一、分区表的数据导入1.静态分区（需要手动指定分区字段的值）直接将文件数据导入到分区表语法：loaddata[local]inpath'filepath'intotabletablenamepartition(分区字段1='分区值1',分区字段2='分区值2'...);loaddata[local]inpath'/root/hive/data/c.txtintotablenickypartitio
Python大数据之Hadoop学习——day06_hive学习02 笨小孩124 大数据 hadoop 学习
一.hive内外表操作1.建表语法create[external]table[ifnotexists]表名(字段名字段类型,字段名字段类型,...)[partitionedby(分区字段名分区字段类型)]#分区表固定格式[clusteredby(分桶字段名)into桶个数buckets]#分桶表固定格式[sortedby(排序字段名asc|desc)][rowformatdelimitedfiel
关于stm32的硬件CRC32与U盘分区中的CRC32计算方式不同的探索；stm32的硬件CRC32的使用细节；stm32的硬件CRC32的问题； believe、悠闲 stm32
背景在我准备使用32对U盘进行格式化时，其中涉及到分区表的CRC32校验值的填写，为了节约时间，我准备使用stm32上自带的CRC32校验单元；但是在经过Demo测试后，发现32的CRC校验算法并非普通的CRC，而是CRC-32/MPEG-2算法这两个算法的区别可以使用下面的网站自行测试CRC（循环冗余校验）在线计算_ip33.com发现这里探索一下他们加密的细节和区别假设我们校验11223344
HIVE 数据模型 HFDYCYY 大数据
体系结构：元数据/HQL的执行安装：嵌入/远程/本地管理：CLI/web界面/远程服务数据类型：基本/复杂/时间数据模型：数据存储/内部表/分区表/外部表/桶表/视图WEB管理工具：http://tdxy-bigdata-04:8889/notebook/editor?type=hive集群状态管理：http://tdxy-bigdata-03:7180/cmf/home基于HDFS没有专门的数据
Hive 分区表 & 数据加载 Wu_Candy 大数据测试 hive hadoop hdfs
1.Hive表数据的导入方式1.1本地上传至hdfs命令：hdfsdfs-put[文件名][hdfs绝对路径]例如：测试文件test_001.txt内容如下在hdfs绝对路径：/user/hive/warehouse/mytest.db/下有一张表test_001，建表语句如下：createtabletest_001(idstring,namestring)rowformatdelimitedfi
Linux&Shell作业题-1 Monyan Linux linux 操作系统 shell
J-Linux&Shell-W1Linux基础知识（共10分）一、判断题（共4题，每题0.25分）软件是与数据处理系统操作有关的计算机程序和相关数据等的总称。（√）操作系统是裸机之上的第一层软件，与硬件关系尤为密切。（√）hda表示电脑内串口硬盘的第一块硬盘。（×）任何分区表都只支持最多4个主分区。（×）二、单项选择题（共3题，每题0.5分）下列不属于操作系统类型的是（B）A.批处理系统B.模拟系
MySQL 数据库自动分区 youcey mysql
MySQL数据库自动分区MySQL自动分区（AutomaticPartitioning）是指数据库管理系统自动将数据分布到预先定义好的分区表结构中，而无需显式地对每个插入操作进行分区。它通常基于特定的策略，如范围、列表、哈希或螺旋分区，可以提高查询性能、管理大规模数据以及优化存储资源。几种常见的自动分区类型包括：RANGEPARTITIONING：按照某个字段值的范围划分，例如按日期范围创建每月的
linux 系统迁移到固态硬盘,把整个Linux系统迁移到另一个硬盘 zqk666mkq~ linux 系统迁移到固态硬盘
买了个固态，不想重装，所以鼓捣着直接把旧硬盘数据迁移到新硬盘中。遂有此文。原来机械硬盘是msdos分区表，新固态硬盘是gpt分区表，数据大小在100GB以内，所以使用dd命令迁移。我系统都是只装在一个分区中，所以直接在root模式下执行迁移：#ddif=/dev/sda1of=/dev/sdb1大概一个小时就迁移完成了。这里要注意的是拷贝的源和目标分别是/dev/sda1和/dev/sdb1这两个
2019-07-29 小风车_d94c
系统启动流程centos601.系统开机自检检查所有硬件是否正常02.引导系统启动MBR引导空间512字节读取分区表概念03.加载启动菜单grub菜单选择加载内核信息进入单用户模式修复系统04.加载系统内核05.运行系统进程运行系统第一个进程init进程pid106.加载运行文件运行级别文件/etc/inittab加载系统运行级别默认307.系统初始化设置主机名称加载网卡地址加载/etc/rc.d
【达梦数据库】-导入导出过程中get DDL复现过程卡西里弗斯奥数据库
在处理问题的过程中，客户反馈在达梦数据库中导入导出分区表，get表的DDL，不会出现表的所有分区信息，ORACLE数据库却会出现所有分区表，事实真的如此吗？复现过程如下：1、创建基础表数据--版本selectid_code;--结果:1-2-70-21.09.24-147898-10028-SECPack2--初始化信息--dminitpath=/dmdatapage_size=32extent_
数据库表优化实践指南 DebugDiver代码深处潜水员数据库数据库 java mysql
数据库表优化实践指南1.基础优化1.1选择合适的数据类型1.2建立合适的索引1.3规范化设计2.中级优化2.1分区表2.2垂直分割2.3水平分割3.高级优化3.1反规范化3.2预计算3.3读写分离3.4分库分表1.基础优化1.1选择合适的数据类型原理:适当的数据类型可以优化存储空间,提高查询和处理效率。不同数据类型占用不同的存储空间,影响索引效率和内存使用。例子:假设有一个用户表(users):C
mysql 分区性能,高性能mysql之分区表三水工 mysql 分区性能
mysql在创建表时使用PARTITIONBY子句定义每个分区存放的数据。在执行查询的时候优化器会根据分区定义过滤那些没有我们需要数据的分区，这样只需要查找包含需要数据的分区就可以了以下场景适合运用表分区技术：1，表非常大以至于无法全部放在内存中。2，分区表的数据更容易维护，可以对一个独立的分区进行优化，检查，修复等操作。3，分区表的数据可以在不同的无力设备上，从而高效的利用多个硬件设备4，可以使
MySQL键分区分区表中台小A mysql mysql 数据库大数据
什么是键分区分区表？键分区是一种MySQL数据库中的分区策略，它基于某个列的键值将数据分割成不同的分区。每个键值都会被映射到一个唯一的分区，这样可以确保数据在不同分区中均匀分布。键分区广泛应用于MySQLCluster环境中，它可以提供高可用性、可伸缩性和容错性。如何创建键分区分区表？创建键分区分区表需要以下几个步骤：1.设计分区键：首先，需要选择一个适合的列作为分区键。分区键的选择应该基于数据的
MySQL的哈希分区分区表中台小A mysql mysql 哈希算法数据库
什么是哈希分区分区表？哈希分区是一种根据某个列的哈希值将表数据均匀地分布到多个分区的分区方式。在哈希分区中，每个分区都有自己的哈希函数和分区数，当插入数据时，MySQL会根据指定的列值经过哈希函数计算，将数据分配到相应的分区中。这种分区方式可以使得表的数据在各个分区中均匀分布，便于管理和查询。创建哈希分区分区表要创建哈希分区分区表，首先需要选择一个列作为分区键，并且该列的数据类型必须是整数型、枚举
树莓派系统常用操作疯狂的麦克斯_max linux ubuntu
树莓派重装系统：使用DiskGenius：删除所有分区-》保存分区表-》快速分区-》确认：自定义1个分区、FAT32、去掉勾选（对齐分区到...）如果碰到这种情况锁该卷时发生错误错误5拒绝访问：window使用Win32DiskImager烧写sd卡出现：锁该卷时发生错误错误5拒绝访问：win+R输入diskpart输入listdiskselectdiskxclean树莓派开启vnc：sudora
如何把新加的分区挂载到/根目录两仪风
举例说明：新增磁盘的设备文件名为/dev/vdb大小为100GB。#fdisk-l查看新增的的磁盘1、对新增磁盘进行分区#fdisk/dev/vdb按提示操作p打印n新增d删除w操作生效q退出操作后w#partprobe强制让内核重新找一次分区表（更新分区表）这里我们新增一个分区/dev/vdb1大小为40GB2、分区格式化#mkfs-text4/dev/vdb1格式化为ext4格式3、将新硬盘临
hive学习笔记之九：基础UDF 程序员欣宸
欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容：所有原创文章分类汇总及配套源码，涉及Java、Docker、Kubernetes、DevOPS等；《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF用户自定义聚合函数(UDAF)UDTF本篇概览本文是《hive学习笔记》的第九篇
注意！2024年中科院预警名单将发布！（附往期名单+分区表下载） WangUnionpub 期刊发表人工智能大数据深度学习数据库物联网
2024年中科院预警期刊何时发布2023年12月27日，《2023年中国科学院文献情报中心期刊分区表》正式发布！此次分区表发布有几项重要变动：可参考：2023中科院分区期刊变动情况重磅！2023年中科院分区表最新名单（附下载）官方已明确，中科院国际预警期刊名单将于2024年1月更新！2023年预警期刊名单发布时间为2023年1月31日：可参考：重磅！2023年中科院《国际期刊预警名单（试行）》正式
2024年《国际期刊预警名单》公布 sagima_sdu 论文笔记论文阅读
期刊分区表团队表示，期刊预警不是论文评价，更不是否定预警期刊发表的每项成果。此预警期刊名单旨在提醒科研人员审慎选择成果发表平台、提示出版机构强化期刊质量管理。以下是2024年中科院预警期刊情况。资料仅供参考，版权属于中国科学院文献情报中心。官网地址：国际期刊预警名单-中国科学院文献情报中心期刊分区表团队今年的名单聚焦两类问题：1）破坏科研生态良性发展的学术不端行为，例如引用操纵和论文工厂；2）影响
hive学习笔记之三：内部表和外部表程序员欣宸
欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容：所有原创文章分类汇总及配套源码，涉及Java、Docker、Kubernetes、DevOPS等；《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF用户自定义聚合函数(UDAF)UDTF本篇概览本文是《hive学习笔记》系列的第
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_