wzy0623

HAWQ技术解析（八） —— 大表分区

一、HAWQ中的分区表
与大多数关系数据库一样，HAWQ也支持分区表。这里所说的分区表是指HAWQ的内部分区表，外部分区表在后面“外部数据”篇讨论。在数据仓库应用中，事实表通常有非常多的记录，分区可以将这样的大表在逻辑上分为小的、更易管理的数据片段。HAWQ的优化器支持分区消除以提高查询性能。只要查询条件中可以使用分区键作为过滤条件，那么HAWQ只需要扫描满足查询条件的分区，而不必进行全表扫描。
分区并不改变表数据在segment间的物理分布。表的分布是物理的，无论是分区表还是非分区表，HAWQ都会在segment上物理地分布数据，并且并行处理查询。而表的分区是逻辑上的，HAWQ逻辑分隔大表以提高查询性能和数据仓库应用的可维护性。例如，将老的分区数据从数据仓库转储或移除，并建立新的数据分区等。HAWQ支持以下分区类型：

范围分区：基于数字范围分区，如日期、价格等。
列表分区：基于列表值分区，如销售区域、产品分类等。
两者混合的分区类型。

图1是一个混合类型分区表的例子，sales表以销售日期范围作为主分区，而以销售区域作为一个日期分区中的列表子分区键。注意，HAWQ并没提供类似Oracle的在线重定义功能，它只能使用CREATE TABLE命令创建分区表，而没有简单的命令能够将一个非分区表转化成分区表。最好在建表之前就规划好分区方式和维护方法，因为当一个非分区表已经存在大量数据后再改作分区表的操作，时间和空间消耗上都是很棘手的问题。

图1

在CREATE TABLE命令中使用PARTITION BY或可选的SUBPARTITION BY子句建立分区。上级分区可以包含一个或多个下级分区。HAWQ内部创建上下级分区之间的层次关系。分区条件定义一个分区内可以包含的数据。在建立分区表时，HAWQ为每个分区条件创建一个唯一的CHECK约束，限制一个分区所能含有的数据，保证各个分区中数据的互斥性。查询优化器利用该CHECK约束，决定扫描哪些分区以满足查询谓词条件。
HAWQ在系统目录中存储分区的层次信息，因此插入到分区表中的行可以正确传递到子分区中。ALTER TABLE命令的PARTITION子句用于修改分区表结构。
在向分区表插入数据时，可以在INSERT命令中指定表的根分区或叶分区（适用于从主表继承方式创建的分区表）。如果数据对于指定的叶分区无效，将返回错误。INSERT命令不支持向非叶分区的子分区中插入数据。

二、确定分区策略
并不是所有表都适合分区，需要进行实测以保证所期望的性能提升。下面是一些通用的分区指南，如果对以下问题的大部分答案是肯定的，分区表对于提高性能是可行的数据库设计。否则，表不适合分区。

表是否足够大？按照一般的经验，至少千万记录以上的表才算大表。数据仓库中的事实表适合作为分区表。对于小于这个数量级的表通常不需要分区。因为系统管理与维护分区的开销会抵消掉分区带来的可见的性能优势。
性能是否不可接受？只有当实施了其它优化手段后，响应时间仍然不可接受时，再考虑使用分区。
查询谓词条件中是否包含适合的分区键？检查查询的WHERE子句中是否包含适合作为分区的条件。例如，如果大部分查询都通过日期检索数据，那么按照月或周做范围分区可能是有益的。
是否需要维护一个数据仓库的历史数据窗口？例如，组织中的数据仓库只需要保持过去12个月的数据，那么按月分区，就可以很容易地删除最老月份的分区，并向最新的月分区中装载当前数据。
根据分区定义条件，是否每个分区的数据量比较平均？分区条件应尽可能使数据平均划分。如果每个分区包含基本相同的记录数，性能会有所提升。例如，将一个大表分成10个相等的分区，如果查询条件中带有分区键，那么理论上查询应该比非分区表快将近10倍。

使用分区还要注意以下问题。首先，不要创建多余的分区。太多的分区将会减慢管理和维护任务，如检查磁盘使用、集群扩展、释放剩余空间等。其次，只有在查询条件可以利用分区消除时，性能才会得到提升。否则，一个需要扫描所有分区的查询会比非分区表还慢。可以通过查看一个查询的执行计划（explain plan）确认是否用到了分区消除。最后是关于多级分区的问题。多级分区会使分区文件的数量快速增长。例如，如果一个表按日期和城市做分区，1000天的1000个城市的数据，就会形成100万个分区。假设表有100列，并且假设表使用面向列的物理存储格式，那么系统为此表需要管理1亿个文件。

三、创建分区表
如前所述，创建分区表需要定义分区键、分区类型、分区层次。下面是几个创建分区表的例子。
1. 定义日期范围分区表
在定义日期分区表时，可以考虑以可接受的细节粒度做分区。例如，相对于以月份做主分区，日期做子分区的分区策略，每个日期一个分区，一年365个分区的方案可能更好。多级分区可以降低生成查询计划的时间，但平面化的分区设计运行地更快。

create table sales (id int, date date, amt decimal(10,2))
distributed by (id)
partition by range (date)
( start (date '2017-01-01') inclusive
   end (date '2017-02-01') exclusive
   every (interval '1 day') );

上面的语句以date列作为分区键，从2017年1月1月到2017年2月1日，每天一个分区，将建立31个分区。分区对应表对象的名称分别是sales_1_prt_1 ... sales_1_prt_31。注意inclusive表示分区中包含定义的分区键值，exclusive表示不包含。例如，sales_1_prt_1包含date >= (date '2017-01-01') and date < (date '2017-01-02')的数据，sales_1_prt_31包含date >= (date '2017-01-31') and date < (date '2017-02-01')的数据，即这个语句定义的分区是左闭右开的数据区间。

db1=# insert into sales values (1, (date '2016-12-31'),100);
ERROR:  no partition for partitioning key  (seg21 hdp4:40000 pid=60186)
db1=# insert into sales values (1, (date '2017-01-01'),100);
INSERT 0 1
db1=# insert into sales values (1, (date '2017-02-01'),100);
ERROR:  no partition for partitioning key  (seg23 hdp4:40000 pid=60190)
db1=# insert into sales values (1, (date '2017-01-31'),100);
INSERT 0 1

同样可以定义左开右闭的分区。

create table sales (id int, date date, amt decimal(10,2))
distributed by (id)
partition by range (date)
( start (date '2017-01-01') exclusive
   end (date '2017-02-01') inclusive
   every (interval '1 day') );

db1=# insert into sales values (1, (date '2017-01-01'),100);
ERROR:  no partition for partitioning key  (seg19 hdp4:40000 pid=60182)
db1=# insert into sales values (1, (date '2017-01-02'),100);
INSERT 0 1
db1=# insert into sales values (1, (date '2017-01-31'),100);
INSERT 0 1
db1=# insert into sales values (1, (date '2017-02-01'),100);
INSERT 0 1
db1=# insert into sales values (1, (date '2017-02-02'),100);
ERROR:  no partition for partitioning key  (seg23 hdp4:40000 pid=60269)

也可以显式定义每个分区。

create table sales (id int, date date, amt decimal(10,2))
distributed by (id)
partition by range (date)
( partition p201701 start (date '2017-01-01') inclusive ,
  partition p201702 start (date '2017-02-01') inclusive ,
  partition p201703 start (date '2017-03-01') inclusive ,
  partition p201704 start (date '2017-04-01') inclusive ,
  partition p201705 start (date '2017-05-01') inclusive ,
  partition p201706 start (date '2017-06-01') inclusive ,
  partition p201707 start (date '2017-07-01') inclusive ,
  partition p201708 start (date '2017-08-01') inclusive ,
  partition p201709 start (date '2017-09-01') inclusive ,
  partition p201710 start (date '2017-10-01') inclusive ,
  partition p201711 start (date '2017-11-01') inclusive ,
  partition p201712 start (date '2017-12-01') inclusive
                  end (date '2018-01-01') exclusive );

以上语句为2017年每个月建立一个分区。注意，不需要问每个分区指定END值，只要在最后一个分区（本例中的p201712）指定END值即可。

2. 定义数字范围分区表

db1=# create table rank (id int, rank int, year int, gender
db1(# char(1), count int)
db1-# distributed by (id)
db1-# partition by range (year)
db1-# ( start (2017) end (2018) every (1),
db1(#   default partition extra );
NOTICE:  CREATE TABLE will create partition "rank_1_prt_extra" for table "rank"
NOTICE:  CREATE TABLE will create partition "rank_1_prt_2" for table "rank"
CREATE TABLE
db1=# \dt
                     List of relations
 Schema |       Name       | Type  |  Owner  |   Storage   
--------+------------------+-------+---------+-------------
 public | rank             | table | gpadmin | append only
 public | rank_1_prt_2     | table | gpadmin | append only
 public | rank_1_prt_extra | table | gpadmin | append only
(3 rows)

db1=# insert into rank values (1,1,2016,'M',100);
INSERT 0 1
db1=# insert into rank values (1,1,2017,'M',100);
INSERT 0 1
db1=# insert into rank values (1,1,2018,'M',100);
INSERT 0 1
db1=# insert into rank values (1,1,2019,'M',100);
INSERT 0 1
db1=# select * from rank;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2016 | M      |   100
  1 |    1 | 2018 | M      |   100
  1 |    1 | 2019 | M      |   100
  1 |    1 | 2017 | M      |   100
(4 rows)

db1=# select * from rank_1_prt_2;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2017 | M      |   100
(1 row)

db1=# select * from rank_1_prt_extra;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2016 | M      |   100
  1 |    1 | 2018 | M      |   100
  1 |    1 | 2019 | M      |   100
(3 rows)

db1=# drop table rank;
DROP TABLE
db1=# \dt
No relations found.

从上面的例子看到：

HAWQ缺省的分区范围是左闭右开。
可以使用default partition子句增加一个缺省分区，当数据不被包含在任何明确定义的分区时，可以被包含在缺省分区中。
HAWQ在查询时可以将分区当做表看待，但删除主表后，分区被一并删除。

3. 定义列表分区表
列表分区可以使用任何允许等值比较数据类型的列作为分区键。列表分区表必须显式定义每个分区。注意列表中的字符比较区分大小写。

db1=# create table rank (id int, rank int, year int, gender
db1(# char(1), count int )
db1-# distributed by (id)
db1-# partition by list (gender)
db1-# ( partition girls values ('f'),
db1(#   partition boys values ('m'),
db1(#   default partition other );
NOTICE:  CREATE TABLE will create partition "rank_1_prt_girls" for table "rank"
NOTICE:  CREATE TABLE will create partition "rank_1_prt_boys" for table "rank"
NOTICE:  CREATE TABLE will create partition "rank_1_prt_other" for table "rank"
CREATE TABLE
db1=# \dt
                     List of relations
 Schema |       Name       | Type  |  Owner  |   Storage   
--------+------------------+-------+---------+-------------
 public | rank             | table | gpadmin | append only
 public | rank_1_prt_boys  | table | gpadmin | append only
 public | rank_1_prt_girls | table | gpadmin | append only
 public | rank_1_prt_other | table | gpadmin | append only
(4 rows)

db1=# insert into rank values (1,1,2016,'M',100);
INSERT 0 1
db1=# insert into rank values (1,1,2016,'m',100);
INSERT 0 1
db1=# insert into rank values (1,1,2016,'f',100);
INSERT 0 1
db1=# insert into rank values (1,1,2016,'F',100);
INSERT 0 1
db1=# insert into rank values (1,1,2016,'A',100);
INSERT 0 1
db1=# select * from rank;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2016 | f      |   100
  1 |    1 | 2016 | m      |   100
  1 |    1 | 2016 | M      |   100
  1 |    1 | 2016 | F      |   100
  1 |    1 | 2016 | A      |   100
(5 rows)

db1=# select * from rank_1_prt_boys;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2016 | m      |   100
(1 row)

db1=# select * from rank_1_prt_girls;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2016 | f      |   100
(1 row)

db1=# select * from rank_1_prt_other;
 id | rank | year | gender | count 
----+------+------+--------+-------
  1 |    1 | 2016 | M      |   100
  1 |    1 | 2016 | F      |   100
  1 |    1 | 2016 | A      |   100
(3 rows)

HAWQ不支持多分区键列复合比较，分区键只能是单列。

db1=# create table rank (id int, rank int, year int, gender
db1(# char(1), count int )
db1-# distributed by (id)
db1-# partition by list (gender,year)
db1-# ( partition girls values ('f',2017),
db1(#   partition boys values ('m',2018),
db1(#   default partition other );
ERROR:  Composite partition keys are not allowed

4. 定义多级分区
可以在分区中定义子分区。使用subpartition template子句保证每个分区都有相同的子分区定义，包括以后添加的分区。

create table sales (trans_id int, date date, amount
decimal(9,2), region text)
distributed by (trans_id)
partition by range (date)
subpartition by list (region)
subpartition template
( subpartition usa values ('usa'),
  subpartition asia values ('asia'),
  subpartition europe values ('europe'),
  default subpartition other_regions)
  (start (date '2017-01-01') inclusive
   end (date '2018-01-01') exclusive
   every (interval '1 month'),
   default partition outlying_dates );

以上语句建立了一共65个分区。一级分区13个，每个一级分区包含4个子分区。
下面的例子显示了一个树形分区设计。sales表按年、月、地区的层级三级分区。SUBPARTITION TEMPLATE子句保证每个分区都有相同的子分区结构。例子中的每一层级都指定了缺省的分区。

create table sales (id int, year int, month int, day int,
region text)
distributed by (id)
partition by range (year)
    subpartition by range (month)
      subpartition template (
        start (1) end (13) every (1),
        default subpartition other_months )
           subpartition by list (region)
             subpartition template (
               subpartition usa values ('usa'),
               subpartition europe values ('europe'),
               subpartition asia values ('asia'),
               default subpartition other_regions )
( start (2017) end (2018) every (1),
  default partition outlying_years );

注意，范围分区上的多级分区很容易建立大量的分区，其中有些分区可能只有很少的数据（甚至没有数据）。随着分区数量的增加，系统表的记录不断增长，查询优化和执行时所需的内存也会增加。加大范围分区的范围或者选择不同的分区策略有助于减少分区的数量。

5. 对一个已经存在的表进行分区
正如开篇提到的，HAWQ只能使用CREATE TABLE命令创建分区表。如果想对一个已经存在的表进行分区，只能这样做：新建分区表->将数据原表导入分区表->删除原表->分区表改名->分析分区表->对新建的分区表重新授权。例如：

create table sales2 (like sales)
partition by range (date)
( start (date '2017-01-01') inclusive
   end (date '2018-01-01') exclusive
   every (interval '1 month') );
insert into sales2 select * from sales;
drop table sales;
alter table sales2 rename to sales;
analyze sales;
grant all privileges on sales to admin;
grant select on sales to guest;

6. 查看分区表定义
查询pg_partitions视图可以获取分区相关信息。

select partitionboundary, partitiontablename, partitionname,partitionlevel, partitionrank
  from pg_partitions
 where tablename='sales';

以下表和视图提供了分区表的信息。

pg_partition：分区表及其层级关系。
pg_partition_templates：子分区使用的模板。
pg_partition_columns：分区键列。

五、分区消除
使用EXPLAIN可以检查查询执行计划，验证查询优化器是否只扫描了相关分区的数据。下面以sales表上的年、月、地区三级分区为例进行说明。

create table sales (id int, year int, month int, day int,
region text)
distributed by (id)
partition by range (year)
    subpartition by range (month)
      subpartition template (
        start (1) end (13) every (1),
        default subpartition other_months )
           subpartition by list (region)
             subpartition template (
               subpartition usa values ('北京'),
               subpartition europe values ('上海'),
               subpartition asia values ('广州'),
               default subpartition other_regions )
( start (2017) end (2020) every (1),
  default partition outlying_years );

sales表最底层存储数据的分区共有 4 * 13 * 4 = 208个;

1. 插入一条数据，如图2所示。

图2

2. 无条件查询，查询计划如图3所示。

图3

可以看到，该查询扫描了全部208个分区，没有分区消除。

3. 以年为条件查询，查询计划如图4所示。

图4

可以看到，该查询扫描了全部208个分区的一半，104个分区。顶级年份分区有四个，为什么where year='2017'要扫描104而不是52个分区呢？在运行时，查询优化器会扫描这个表的层级关系（系统表），并使用CHECK表约束确定扫描哪些满足查询条件的分区。如果存在DEFAULT分区，则它总是被扫描，因此该查询或扫描year=2017和default两个分区，这就是扫描的分区数是104而不是52的原因。可见，包含DEFAULT分区会增加整体扫描时间。按理说DEFAULT与其它所有分区的数据都是互斥的，完全不必在可以确定分区的条件下再去扫描它，这是不是HAWQ查询优化器的一个问题也未可知。

3. 以年、月为条件查询，查询计划如图5所示。

图5

可以看到，这次只扫描了16个分区。同样道理本应只扫描4个底层分区，因为DEFAULT的存在，需要扫描16个分区。

4. 以年、月、地区为条件查询，查询计划如图6所示。

图6

这次只需扫描一个分区。当查询中包含所有层级的谓词条件时，没有扫描DEFAULT，而是唯一确定了一个分区。

5. 以DEFAULT条件查询，查询计划如图7所示。

图7

这次只要扫描年份DEFAULT分区下的52个子分区。
分区消除有以下限制：

查询优化器只有在查询条件中包含=、<、<=、>、>=、<>等比较运算符是才可能应用分区消除。
对于稳定的函数会应用分区消除，对于易变函数不会应用分区消除。例如，WHERE date > CURRENT_DATE会应用分区消除，而time > TIMEOFDAY则不会。

六、分区表维护
ALTER TABLE命令维护分区表。尽管可以通过引用分区对应的表对象的名子进行查询和装载数据，但修改分区表结构时，只能使用ALTER TABLE...PARTITION引用分区的名字。也可以使用PARTITION FOR (value)或PARTITION FOR(RANK(number))指示分区。注意，HAWQ不支持在多级分区上的如下操作：

增加缺省分区
增加分区
删除缺省分区
删除分区
分割分区
所有修改子分区的操作

1. 增加分区

create table sales (id int, year int, month int, day int,
region text)
distributed by (id)
partition by range (year)
    subpartition by range (month)
      subpartition template (
        start (1) end (13) every (1),
        default subpartition other_months )
           subpartition by list (region)
             subpartition template (
               subpartition usa values ('北京'),
               subpartition europe values ('上海'),
               subpartition asia values ('广州'),
               default subpartition other_regions )
( start (2017) end (2020) every (1));

alter table sales add partition
 start (2016) inclusive
 end (2017) exclusive;

使用add partition增加分区时不能存在DEFAULT分区，否则会报类似以下的错误：

ERROR:  cannot add RANGE partition to relation "sales" with DEFAULT partition "outlying_years"
HINT:  need to SPLIT partition "outlying_years"

这时需要使用split partition增加分区。
为一个分区表增加子分区时，可以指定需要修改的分区。

alter table sales alter partition for (rank(12))
      add partition africa values ('africa');
	  
alter table sales alter partition for (rank(1))
      add partition africa values ('africa');

2. 增加缺省分区

alter table sales add default partition other;

如果没有DEFAULT分区，不能匹配分区CHECK约束的数据行将被拒绝入库，并且数据转载失败。为了避免这种情况，指定DEFAULT分区。任何不能与分区匹配的行都被装载进DEFAULT分区。

3. 分区改名
每个子分区对应一个表对象，可以用\dt元命令查看到。如果是自动生成的范围分区，在没有指定名称的分区被赋予一个数字。分区对应表对象的命名规则如下：

__prt_

例如：

sales_1_prt_1_2_prt_11_3_prt_other_regions

上面的名称表示该分区名为'other_regions'，是sales表的一个第三级分区，隶属第一级的1号分区下的第二级的11号分区下。
修改顶级父表的名称，会重命名所有分区子表名，例如：

alter table sales rename to globalsales;

相关的分区子表名变为：

globalsales_1_prt_1_2_prt_11_3_prt_other_regions

也可以将顶级分区名改为自定义的名称，例如：

alter table sales rename partition for (2017) to y2017;

表对象名的最大长度为64字节，超长会报错：

db1=# alter table globalsales rename partition for (2017) to year2017;
ERROR:  relation name "globalsales_1_prt_year2017_2_prt_other_months_3_prt_other_regions" for child partition is too long

当使用ALTER TABLE...PARTITION 命令修改分区表时，总是用分区名称（如y2017）而不是分区对应的表对象全名（globalsales_1_prt_y2017）。

4. 删除分区
ALTER TABLE命令也可用来删除分区，如果被删除的分区有子分区，则这些子分区及其数据也都被一起删除。

alter table globalsales drop partition for (2017);
alter table globalsales drop partition for (2018);

不能删除最后一个分区：

db1=# alter table globalsales drop partition for (2019);
ERROR:  cannot drop partition for value (2019) of relation "globalsales" -- only one remains
HINT:  Use DROP TABLE "globalsales" to remove the table and the final partition

5. 清空分区
使用ALTER TABLE命令清空一个分区及其所有子分区的数据。不能单独清空一个子分区。

alter table globalsales truncate partition for (2018);

6. 分区交换
分区交换指的是用一个表的数据与一个分区的数据交换。HAWQ只支持单级分区表的分区交换。

db1=# alter table sales exchange partition for (2017)
db1-# with table stage_sales;
ERROR:  cannot EXCHANGE PARTITION for relation "sales" -- partition has children

经常使用分区交换向分区表装载数据。当然也能使用COPY或INSERT命令向分区表装载数据，此时数据被自动路由到正确的底层分区，就像普通表一样。但是，这种装载数据的方法会根据数据遍历整个分区层次结构，因此数据装载的性能很差。在前面208个分区的例子中，插入一条记录竟然用时16秒多，如图8所示。

图8

向分区表装载数据的推荐方法创建一个中间过渡表，装载过渡表，然后用过渡表与分区做交换。

db1=# create table sales (id int, year int, month int, day int, region varchar(10))
db1-# distributed by (id)
db1-# partition by range (year)
db1-# ( start (2017) end (2020) every (1));
NOTICE:  CREATE TABLE will create partition "sales_1_prt_1" for table "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_2" for table "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_3" for table "sales"
CREATE TABLE
Time: 497.864 ms
db1=# insert into sales values (1,2017,1,1,'北京');
INSERT 0 1
Time: 463.546 ms
db1=# insert into sales values (2,2018,2,2,'上海');
INSERT 0 1
Time: 133.454 ms
db1=# insert into sales values (3,2019,3,3,'广州');
INSERT 0 1
Time: 109.118 ms
db1=# create table stage_sales (like sales);
NOTICE:  Table doesn't have 'distributed by' clause, defaulting to distribution columns from LIKE table
CREATE TABLE
Time: 130.794 ms
db1=# \dt;
                   List of relations
 Schema |     Name      | Type  |  Owner  |   Storage   
--------+---------------+-------+---------+-------------
 public | sales         | table | gpadmin | append only
 public | sales_1_prt_1 | table | gpadmin | append only
 public | sales_1_prt_2 | table | gpadmin | append only
 public | sales_1_prt_3 | table | gpadmin | append only
 public | stage_sales   | table | gpadmin | append only
(5 rows)

db1=# insert into stage_sales values (4,2017,4,4,'深圳'); 
INSERT 0 1
Time: 1559.465 ms
db1=# alter table sales exchange partition for (2017) with table stage_sales;
ALTER TABLE
Time: 61.744 ms
db1=# select * from sales;
 id | year | month | day | region 
----+------+-------+-----+--------
  2 | 2018 |     2 |   2 | 上海
  3 | 2019 |     3 |   3 | 广州
  4 | 2017 |     4 |   4 | 深圳
(3 rows)

Time: 91.150 ms
db1=# select * from stage_sales;
 id | year | month | day | region 
----+------+-------+-----+--------
  1 | 2017 |     1 |   1 | 北京
(1 row)

Time: 82.853 ms

7. 分裂分区
分裂分区指的是将一个分区分裂成两个分区，HAWQ只能分裂单级分区表。

db1=# alter table sales split partition for (2017)
db1-# at (2016)
db1-# into (partition y016, partition y2017);
ERROR:  cannot split partition with child partitions
HINT:  Try splitting the child partitions.

下面的例子将2017年1月的分区，分割成2017年1月1日到2017年1月15日、2017年1月16日到2017年1月31日两个分区，分割值包含在后一个分区中。

db1=# create table sales (id int, date date, amt decimal(10,2))
db1-# distributed by (id)
db1-# partition by range (date)
db1-# ( partition p201701 start (date '2017-01-01') inclusive ,
db1(#   partition p201702 start (date '2017-02-01') inclusive 
db1(#                     end (date '2017-03-01') exclusive );
NOTICE:  CREATE TABLE will create partition "sales_1_prt_p201701" for table "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_p201702" for table "sales"
CREATE TABLE
Time: 274.237 ms
db1=# insert into sales values (1, date '2017-01-15', 100);
INSERT 0 1
Time: 386.221 ms
db1=# insert into sales values (1, date '2017-01-16', 100);
INSERT 0 1
Time: 146.437 ms
db1=# select * from sales_1_prt_p201701;
 id |    date    |  amt   
----+------------+--------
  1 | 2017-01-15 | 100.00
  1 | 2017-01-16 | 100.00
(2 rows)

Time: 117.187 ms
db1=# alter table sales split partition for ('2017-01-01') at ('2017-01-16')
db1-# into (partition p20170101to0115, partition p20170116to0131);
NOTICE:  exchanged partition "p201701" of relation "sales" with relation "pg_temp_68011"
NOTICE:  dropped partition "p201701" for relation "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_p20170101to0115" for table "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_p20170116to0131" for table "sales"
ALTER TABLE
Time: 446.998 ms
db1=# select * from sales_1_prt_p20170101to0115;
 id |    date    |  amt   
----+------------+--------
  1 | 2017-01-15 | 100.00
(1 row)

Time: 132.169 ms
db1=# select * from sales_1_prt_p20170116to0131;
 id |    date    |  amt   
----+------------+--------
  1 | 2017-01-16 | 100.00
(1 row)

Time: 86.589 ms

如果表有DEFAULT分区，必须使用分裂分区的方法添加分区。使用INTO子句的第二个分区为DEFAULT分区。

db1=# alter table sales add default partition other;
NOTICE:  CREATE TABLE will create partition "sales_1_prt_other" for table "sales"
ALTER TABLE
Time: 134.470 ms
db1=# insert into sales values (3, date '2017-03-01', 100);
INSERT 0 1
Time: 242.053 ms
db1=# insert into sales values (4, date '2017-04-01', 100);
INSERT 0 1
Time: 147.235 ms
db1=# select * from sales_1_prt_other;
 id |    date    |  amt   
----+------------+--------
  4 | 2017-04-01 | 100.00
  3 | 2017-03-01 | 100.00
(2 rows)

Time: 79.584 ms
db1=# alter table sales split default partition
db1-# start ('2017-03-01') inclusive
db1-# end ('2017-04-01') exclusive
db1-# into (partition p201703, default partition);
NOTICE:  exchanged partition "other" of relation "sales" with relation "pg_temp_68051"
NOTICE:  dropped partition "other" for relation "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_p201703" for table "sales"
NOTICE:  CREATE TABLE will create partition "sales_1_prt_other" for table "sales"
ALTER TABLE
Time: 756.526 ms
db1=# select * from sales_1_prt_p201703;
 id |    date    |  amt   
----+------------+--------
  3 | 2017-03-01 | 100.00
(1 row)

Time: 89.353 ms
db1=# select * from sales_1_prt_other;
 id |    date    |  amt   
----+------------+--------
  4 | 2017-04-01 | 100.00
(1 row)

Time: 69.030 ms

8. 修改子分区模板
ALTER TABLE SET SUBPARTITION TEMPLATE修改一个分区表的子分区模板。新模板只影响后面添加的数据，不修改现有的分区数据。

db1=# create table sales (trans_id int, date date, amount decimal(9,2), region text)
db1-#   distributed by (trans_id)
db1-#   partition by range (date)
db1-#   subpartition by list (region)
db1-#   subpartition template
db1-#     ( subpartition usa values ('usa'),
db1(#       subpartition asia values ('asia'),
db1(#       subpartition europe values ('europe'),
db1(#       default subpartition other_regions )
db1-#   ( start (date '2017-01-01') inclusive
db1(#     end (date '2017-04-01') exclusive
db1(#     every (interval '1 month') );
NOTICE:  CREATE TABLE will create partition "sales_1_prt_1" for table "sales"
...
CREATE TABLE
Time: 623.565 ms
db1=# alter table sales set subpartition template
db1-# ( subpartition usa values ('usa'),
db1(#   subpartition asia values ('asia'),
db1(#   subpartition europe values ('europe'),
db1(#   subpartition africa values ('africa'),
db1(#   default subpartition regions );
NOTICE:  replacing level 1 subpartition template specification for relation "sales"
ALTER TABLE
Time: 49.767 ms

当添加一个分区时，使用新的子分区模板。

db1=# alter table sales add partition "4"
db1-#   start ('2017-04-01') inclusive
db1-#   end ('2017-05-01') exclusive ;
NOTICE:  CREATE TABLE will create partition "sales_1_prt_4" for table "sales"
...
ALTER TABLE
Time: 414.251 ms
db1=# \dt sales*
                             List of relations
 Schema |               Name                | Type  |  Owner  |   Storage   
--------+-----------------------------------+-------+---------+-------------
 public | sales                             | table | gpadmin | append only
 public | sales_1_prt_1                     | table | gpadmin | append only
 public | sales_1_prt_1_2_prt_asia          | table | gpadmin | append only
 public | sales_1_prt_1_2_prt_europe        | table | gpadmin | append only
 public | sales_1_prt_1_2_prt_other_regions | table | gpadmin | append only
 public | sales_1_prt_1_2_prt_usa           | table | gpadmin | append only
 public | sales_1_prt_2                     | table | gpadmin | append only
 public | sales_1_prt_2_2_prt_asia          | table | gpadmin | append only
 public | sales_1_prt_2_2_prt_europe        | table | gpadmin | append only
 public | sales_1_prt_2_2_prt_other_regions | table | gpadmin | append only
 public | sales_1_prt_2_2_prt_usa           | table | gpadmin | append only
 public | sales_1_prt_3                     | table | gpadmin | append only
 public | sales_1_prt_3_2_prt_asia          | table | gpadmin | append only
 public | sales_1_prt_3_2_prt_europe        | table | gpadmin | append only
 public | sales_1_prt_3_2_prt_other_regions | table | gpadmin | append only
 public | sales_1_prt_3_2_prt_usa           | table | gpadmin | append only
 public | sales_1_prt_4                     | table | gpadmin | append only
 public | sales_1_prt_4_2_prt_africa        | table | gpadmin | append only
 public | sales_1_prt_4_2_prt_asia          | table | gpadmin | append only
 public | sales_1_prt_4_2_prt_europe        | table | gpadmin | append only
 public | sales_1_prt_4_2_prt_regions       | table | gpadmin | append only
 public | sales_1_prt_4_2_prt_usa           | table | gpadmin | append only
(22 rows)

下面的命令移除子分区模板：

alter table sales set subpartition template ();

9. 分区滚动窗口维护
在对数据表进行范围分区处理的基础上，可以进一步设计滚动数据的策略。通过维护一个数据滚动窗口，删除老分区，添加新分区，将老分区的数据迁移到数据仓库以外的次级存储，以节省系统开销。下面以一个常见的应用场景说明分区自动滚动的实现。假设一个数据仓库保留最近一年的销售记录，按日期每天一个分区。初始建立一年的分区，并装载近一年的数据，然后每天装载前一天的销售数据。
（1）建立分区表

create table sales (id int, date date, amt decimal(10,2))
distributed by (id)
partition by range (date)
( start (date '2016-03-01') inclusive
   end (date '2017-05-01') exclusive
   every (interval '1 day') );

该语句建立了从2016-03-01至2017-04-30的每天一个分区。

（2）创建动态滚动分区的函数
HAWQ从PostgreSQL继承了过程化编程，并使用多种语言。在我自己使用过的SQL-on-Hadoop产品中，HAWQ是唯一支持过程化编程的。而且，其内建函数、操作符和语法与Oracle极为接近，这对于传统数据库的开发管理人员及广大DBA是非常有吸引力的。在转到大数据平台时，他们可以复用原来积淀的知识与经验。仅凭这一点，HAWQ就可以在众多SQL-on-Hadoop解决方案中体现出独有的优势和价值。下一篇将详细描述HAWQ的过程化语言编程。

create or replace function fn_rolling_partition() returns int
as $body$
declare
    oldest_month_first_day date := date(date_trunc('month',current_date) + interval '-13 month');
    oldest_month_last_day date := date(date_trunc('month',current_date) + interval '-12 month - 1 day');
    newest_month_first_day date := date(date_trunc('month',current_date) + interval '1 month');
    newest_month_last_day date := date(date_trunc('month',current_date) + interval '2 month - 1 day');
    i int;
    j int;
    sqlstring varchar(1000);  
begin   
    -- 转储最早一个月的数据，
    sqlstring = 'copy (select * from sales where date >= date(''' || oldest_month_first_day || ''') and date <= date(''' || oldest_month_last_day || ''')) to ''/home/gpadmin/sales_' || to_char(oldest_month_first_day,'YYYYMM') || '.txt'' with delimiter ''|'';';
    execute sqlstring;
    -- raise notice '%', sqlstring;

    -- 删除最早月份对应的分区
    i := 1; 
    j := oldest_month_last_day - oldest_month_first_day + 1;
	
    for i in 1 .. j loop	    
        sqlstring := 'alter table sales drop partition for (rank('|| i ||'));';
        execute sqlstring;
	end loop;
	
    -- 增加下一个月份的新分区
    while newest_month_first_day <= newest_month_last_day loop	    
        sqlstring := 'alter table sales add partition start (date '''|| newest_month_first_day ||''') inclusive end (date '''|| (newest_month_first_day + 1) ||''') exclusive;';
        execute sqlstring;
        -- raise notice '%', sqlstring;
        newest_month_first_day = newest_month_first_day + 1;
	end loop;
	
    -- 正常返回1
    return 1;
	
-- 异常返回0
exception when others then 
    raise exception '%: %', sqlstate, sqlerrm;  
    return 0;
end
$body$ language plpgsql;

（3）在cron中增加作业，例如，从下个月开始的每月一日两点执行分区滚动。

0 2 1 * * psql -d db1 -c "select fn_rolling_partition();" > rolling_partition.log 2>&1

你可能感兴趣的:(BI)

OpenCV图像处理基础2 指尖下的技术 OpenCV opencv 图像处理计算机视觉
接着上一篇OpenCV图像处理基础1继续说。图像阈值处理1、简单阈值处理ret,thresholded_image=cv2.threshold(image,thresh,maxval,cv2.THRESH_BINARY)thresh是阈值，maxval是最大值。2、自适应阈值处理thresholded_image=cv2.adaptiveThreshold(image,maxval,cv2.ADA
L2-4 吉利矩阵小竹子14 矩阵深度优先算法
输入样例：73输出样例：666这道题是暴力纯搜，但是很难想，我这个是看的别人的代码#include"bits/stdc++.h"usingnamespacestd;intx[20][20];intl,n;intcnt=0;intsumx[5],sumy[5];voiddfs(intx,inty){if(x==n+1){cnt++;return;}//其实不需要考虑列的和是否满足l,因为如果超出l的
NLP高频面试题（七）——GPT和Bert的mask有什么区别？ Chaos_Wang_ NLP常见面试题自然语言处理 gpt bert
GPT和BERT的Mask机制对比：核心区别与优化策略在NLP领域，GPT和BERT是最具代表性的预训练语言模型之一。它们都在训练过程中使用了Mask机制来引导模型学习语言表示，但具体实现方式和目标却有所不同。本文将深入探讨GPT和BERT的Mask方法的核心区别，并分析其优化策略。1.BERT的Mask机制：基于MLM（MaskedLanguageModel）BERT（Bidirectional
第三十一篇数据仓库（DW）与商业智能（BI）架构设计与实践指南随缘而动，随遇而安数据库 sql 数据仓库大数据数据库架构
目录一、DW/BI架构核心理论与选型策略1.1主流架构模式对比（1）Kimball维度建模架构（2）Inmon企业工厂架构（3）混合架构二、架构设计方法论与实施步骤2.1维度建模实战指南（1）模型选择决策树（2）ETL开发规范2.2实时BI技术栈选型三、全链路实施与优化策略3.1五阶段实施框架3.2数据治理体系构建四、行业场景深度实践4.1电商用户行为分析4.2金融风控实时预警五、关键问题解析Q1
比特币全节点同步加速记录（使用Bitcoin Core钱包） wusimpl 区块链区块链全节点同步加速 bitcoin core
1.预先下载或从别的地方拷贝区块数据而不是直接在BitcoinCore钱包中下载这方面可以参考截止到2022年8月的区块数据2.将区块头数据和区块实体数据分开存储区块头数据放到SSD中，区块实体数据放到HDD中这方面可以参考BitcoinCore节点同步加速原理和方法实验-CodeAntenna3.使用代理下载剩余的数据最好用全局代理，并且在bitcoin.conf中配置proxy可添加离自己区域
负载均衡策略之轮询策略 Time-Traveler Python 算法与数据结构
本文转自:https://mozillazg.com/2019/02/load-balancing-strategy-algorithm-weighted-round-robin.html#hidround-robin,尊重原创前言:本文简单介绍一下轮询(RoundRobin)这个负载均衡策略。轮询选择(RoundRobin):轮询选择指的是从已有的后端节点列表中按顺序依次选择一个节点出来提供服务
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构 egzosn nginx 负载均衡架构运维
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构一、负载均衡的核心价值当单台服务器无法承载高并发流量时，负载均衡通过将请求分发到多台服务器，实现：横向扩展：突破单机性能瓶颈故障隔离：自动剔除异常节点动态调度：根据策略优化资源利用率二、Nginx原生负载均衡策略1.轮询(RoundRobin)配置示例：upstreambackend{server192.168.1.10:8080;s
OpenGL ES 如何渲染 16bit 图像？字节流动 OpenGL ES 3.0 OpenGLES 音视频图形渲染 Android c++
未经作者（微信ID：Byte-Flow）允许，禁止转载文章首发于公众号：字节流动最近有不少读者私信问OpenGLES如何处理16bit图像（P010）？然后我直接贴给他们一段在OpenGL环境下验证过的上传16bit图像数据的代码glTexImage2D(GL_TEXTURE_2D,0,GL_R16UI,width,height,0,GL_RED_INTEGER,GL_UNSIGNED_SHORT
【Docker】搭建实用的内网穿透工具 - FRP UPToZ 群晖Docker docker 容器运维
前言本教程基于群晖的NAS设备DS423+的docker功能进行搭建FRP的客户端，DSM版本为7.2.1-69057Update5。采用香港机Debian12系统的服务器来安装FRP的服务端作为演示。服务器购买地址：https://www.crash.work/aff/AQXGDNKY简介FRP（FastReverseProxy）是一个高性能的反向代理应用，它可以帮助您将内网服务通过反向代理暴露
ARM：ELF bin Hex axf 守正待 ARM SoC RTOS arm
前言：PC平台流行的可执行文件格式(ExecutableFileFormat)，主要是Windows下的PE（PortableExecutable）和Linux的ELF(ExecutableandLinkingFormat，可执行和链接格式)。他们都是COFF(CommonObjectFileFormat)的变种。ARM架构采用的也是ELF文件格式。COFF是在UnixSystemVRelease
git runner 配置_gitlab-ci配置详解(一) 夏天的sunnyrain git runner 配置
近期因为折腾gitlab-ci，专门去翻了很多文档，想想貌似自己挺傻的。按照官网教程本来biubiubiu就弄好了，非自己折腾了好几天，还没啥积累，真是作。想想唯一能积累的就是ci的配置详解了。该文基于最新版GitLabCommunityEdition10.1.1和GitLabRunner9.5.1-1使用.gitlab-ci.yml配置你的项目这篇文档描述了.gitlab-ci.yml的用法，本
【赵渝强老师】在Docker中运行达梦数据库数据库docker
Docker是一个客户端服务器（Client-Server）架构。Docker客户端和Docker守护进程交流，而Docker的守护进程是运作Docker的核心，起着非常重要的作用（如构建、运行和分发Docker容器等）。达梦官方提供了DM8在Docker容器中进行部署的镜像文件，下面通过具体的步骤进行演示。视频讲解如下：https://www.bilibili.com/video/BV1yBfB
蓝桥杯---纯职业小组（c语言）写代码的熊萌新蓝桥杯 c语言哈希算法
问题描述在蓝桥王国，国王统治着一支由n个小队组成的强大军队。每个小队都由相同职业的士兵组成。具体地，第i个小队包含了bi名职业为ai的士兵。近日，国王计划在王宫广场举行一场盛大的士兵检阅仪式，以庆祝王国的繁荣昌盛。然而，在士兵们入场的过程中，一场突如其来的风暴打乱了他们的行列，使得不同小队的士兵混杂在一起，次序乱成一团，尽管国王无法知道每个士兵的具体职业，但为了确保仪式能顺利进行，国王打算从这些混
【RabbitMQ】超详细Windows系统下RabbitMQ的安装配置 m0_74825074 面试学习路线阿里巴巴 rabbitmq windows 分布式
RabbitMQ是一个开源的消息队列中间件，广泛用于分布式系统中的异步消息传递。它支持多种消息协议，易于扩展，功能强大。本文将详细介绍如何在Windows系统下安装和配置RabbitMQ，包括所需的依赖项、安装步骤、基本配置和常见问题解决方案。目录什么是RabbitMQ？安装前的准备2.1系统要求2.2安装ErlangRabbitMQ的安装步骤3.1下载RabbitMQ3.2安装RabbitMQ配
Mysql中的mysqlbinlog_MySQL程序只mysqlbinlog详解 Fly蒋
mysqlbinlog命令详解mysqlbinlog用于处理二进制的日志文件，如果想要查看这些日志文件的文本内容，就需要使用mysqlbinlog工具用法：mysqlbinlog[options]log-files参数详解：-?,--help#显示帮助信息并退出--base64-output=name#binlog输出语句的base64解码分为三类：默认是值auto,仅打印base64编码的需要的
毕业论文代码实验（Python\MATLAB）基于K-means聚类的EMD-BiLSTM-Attention光伏功率预测模型清风AI 毕业设计代码实现 python lstm 深度学习神经网络人工智能 matlab pytorch
一、项目背景1.1光伏功率预测意义在能源结构转型背景下（国家能源局2025规划），光伏发电渗透率已超过18%。但受天气突变、云层遮挡等因素影响，光伏出力具有显著波动性，导致：电网调度难度增加（±15%功率波动）电力市场交易风险提升光储协同控制效率降低1.2技术挑战多尺度特征耦合：分钟级辐照度变化与小时级天气模式共存非线性映射关系：气象因素与发电功率呈高阶非线性关系数据模态差异：数值天气预报(NWP
解决Ubuntu命令“sudo apt-get install”——“ E: 无法定位软件包”问题 Joker 007 服务器 ubuntu linux 服务器
1.添加镜像源(本文是清华源)。运行代码：sudovim/etc/apt/sources.list添加如下内容：debhttps://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionicmainrestricteduniversemultiverse#deb-srchttps://mirrors.tuna.tsinghua.edu.cn/ubuntu/bionicm
如何对关键字段进行脱敏(一）在使用Mybatis-plus执行查询张瀚元782738120 mybatis java
为了在读取用户表中的mobile字段时进行脱敏处理，并实现一个通用的方法以便将来对其他字段例如：邮箱、身份证、姓名等进行脱敏处理，可以采用以下步骤：1.添加依赖首先，在pom.xml文件中添加必要的依赖，包括SpringBoot、MyBatis-Plus和Hutool工具库：org.springframework.bootspring-boot-starter-webcom.baomidoumyb
shell 脚本搭建apache 好多知识都想学 apache
#!/bin/bash#SetApacheversiontoinstall##author:yuan#检查外网连接echo"检查外网连接..."pingwww.baidu.com-c3>/dev/null2>&1if[$?-eq0];then echo"外网通讯良好！"else echo"网络连接失败，请检查你的网络设置！" exit1fisleep5#检查并安装APR库echo"检查并安装
环境准备系列——使家里的工作站在公网上也可以通过ssh进行访问 music&movie 工具 ssh 运维
一、基础配置：启用SSH服务与端口开放安装SSH服务•Ubuntu/Debian系统：sudoaptupdate&&sudoaptinstallopenssh-server•CentOS系统：sudoyuminstallopenssh-server•启动服务：sudosystemctlstartsshd&&sudosystemctlenablesshd修改默认端口（推荐）•编辑配置文件：sudov
Spring系列学习之Spring Messaging消息支持 m0_74825488 面试学习路线阿里巴巴 spring linq java
英文原文：https://docs.spring.io/spring-boot/docs/current/reference/html/boot-features-messaging.html目录JMSActiveMQ支持Artemis支持使用JNDIConnectionFactory发送消息接收消息AMQPRabbitMQ支持发送消息接收消息ApacheKafka支持发送消息接收消息Kafka流
在Ubuntu20.04上交叉编译能在Windows上运行的Qt5应用 daqinzl linux qt C++Ubuntu20.04 Qt5 交叉编译 Windows应用
参考链接：https://blog.csdn.net/Interview_TC/article/details/146050419https://bugreports.qt.io/browse/QTBUG-82592重要设置sudoupdate-alternatives--configx86_64-w64-mingw32-g++选择后缀带posix的，（/usr/bin/x86_64-w64-mi
5、Spring Boot 3.x 集成 RabbitMQ Kenny.志 java-rabbitmq spring boot rabbitmq
一、前言本篇主要是围绕着SpringBoot3.x与RabbitMQ的集成，这边文章比较简单，RabbitMQ的集成没有太大的变化，这篇文章主要是为了后续的RabbitMQ的动态配置做铺垫。1、Docker安装RabbitMQ2、SpringBoot3.x集成RabbitMQ二、Docker安装RabbitMQ1、创建docker-network#创建docker网络，方便后续连通多个容器dock
spring boot 三步集成rabbitmq PXM的算法星球 Java后端 java-rabbitmq spring boot rabbitmq
引入依赖org.springframework.bootspring-boot-starter-amqp编写config类@ConfigurationpublicclassRabbitmqConfig{publicstaticfinalStringRECORD_QUEUE="teaching-assistant-record_queue";@BeanpublicJackson2JsonMessag
大规异构集群混合并行分布式训练系统，解决算力不均衡问题 HETHUB 爱串门的小马驹万卡大规模集群大模型训练异构集群大规模集群分布式大模型训练
视频教程在这：3.2大规模异构集群，混合并行分布式系统，解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因：同一种GPU数量有限难以构建大规模集群：训练大规模模型依赖于大量的计算资源。例如，训练GPT-4模型（1.8万亿个参数）需要25000个A100GPU。用一种GPU加速器构建大规模集群是一个挑战。使用多种类型的GPU加速器构建大规模集群是解决同构GPU加速
MongoDB z小天才b MongoDB mongodb 数据库
一、MongoDB简介1.1什么是MongoDB？MongoDB是一个基于分布式文件存储的开源NoSQL数据库系统，由C++语言编写，旨在为Web应用提供可扩展的高性能数据存储解决方案。MongoDB将数据存储为一个文档，数据结构由键值对组成，类似于JSON对象，字段值可以包含其他文档、数组及文档数组。1.2MongoDB的核心特性文档型数据库：数据以BSON（BinaryJSON）格式存储灵活的
Android Google Pay接入 2401_87017192 android windows
//TheBillingClientisready.Youcanquerypurchaseshere.}}@OverridepublicvoidonBillingServiceDisconnected(){//Trytorestarttheconnectiononthenextrequestto//GooglePlaybycallingthestartConnection()method.}});
MySQL时间转换可儿·四系桜 #MySQL mysql 数据库
1.bigint类型的时间戳1.1将bigint转为datetimeFROM_UNIXTIME(时间戳/1000)1.2将bigint转为date方式一：DATE(FROM_UNIXTIME(时间戳/1000))方式二：字符串隐式转换FROM_UNIXTIME(时间戳/1000,'%Y-%m-%d')1.3将bigint转为指定格式的varcharFROM_UNIXTIME(时间戳/1000,'%
【HDOJ】2050 - 2059 _17_ 杭电OJ 考研
引言：两年没写博客了，两年来经历了很多的事情，太多太多，无法说清(；′⌒`)。无论如何生活还要继续，当前计划从杭电OJ开始记录我的痕迹(ง•_•)ง。(如有错误，欢迎指正o(￣▽￣)ブ)目录2050(折线分割平面)2051(Bitset)2052(Picture)2053(SwitchGame)2054(A==B?)2055(Aneasyproblem)2056(Rectangles)2057(A
Ubuntu18.04切换python3.8版本波波维琦 python linux ubuntu
安装python3.8sudoaptinstallpython3.8赋予python优先级sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python3.82切换python默认版本sudoupdate-alternatives--configpython选择python3.8的编号，回车赋予python3优先级sudou
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &