cclovezbf

kudu on impala 基本用法。

好久没用kudu了突然别的项目组开始用kudu，问各种问题，实在招架不住。。。。

于是自我学习一波。

https://impala.apache.org/docs/build/impala-2.12.pdf

1.尽量考虑用kudu自己的api来增删改查，而不是通过impala的jdbc接口去做些事。

这个就是说我们可以直接通过kudumaster的地址获取kudusession来dml操作

还可以通过impala jdbc的方式连接后直接crud。

官网推荐kudu方式。

2.dml

-- Single partition. Only for Impala 2.10 and higher. -

--仅供impala2.10及以上版本参考。

- Only suitable for small lookup tables. 这种只适合小表，不分区。

CREATE TABLE kudu_no_partition_by_clause ( id bigint PRIMARY KEY, s STRING, b BOOLEAN ) STORED AS KUDU;

-- Single-column primary key. 一列分区。

CREATE TABLE kudu_t1 (id BIGINT PRIMARY key, s STRING, b BOOLEAN) PARTITION BY HASH (id) PARTITIONS 20 STORED AS KUDU;

备注像这种主键唯一，hash分区一般就会选择主键，因为主键已经满足了hash(主键)尽可能分散的这个要求

-- Multi-column primary key. 多列分区

CREATE TABLE kudu_t2 (id BIGINT, s STRING, b BOOLEAN, PRIMARY KEY (id,s)) PARTITION BY HASH (s) PARTITIONS 30 STORED AS KUDU;

备注，你看这里主键是id和s 联合起来的。但是hash分区只是根据s。

那么根据hash(s)分区的目的是啥呢？为啥不直接hash(id,s)。

因为s肯定是有重复的数据的，其实可以这么理解。该表为一个顾客每天登陆总数表。顾客id+每天s登陆次数唯一。但是顾客每天都会登录。这个时候我们hash(s)=每一天的数据，那么我门查询每天的数据时，所查找的tablet server 就是在一起。同理如果我们采用hash(id)，那么我们在查询单个顾客每天的登录次数的时候，速度就会比 hash(s)和hash(id,s)快。

所以这里 hash()分区的值是很重要的，直接影响你以后的查询效果，个人认为 hash(id,name.socre)这种多字段分区是不可取的。

-- Meaningful primary key column is good for range partitioning

--选好主键很关键！！！

CREATE TABLE kudu_t3 (
id BIGINT,
year INT,
s STRING,
b BOOLEAN,
PRIMARY KEY (id,year)
)
PARTITION BY HASH (id) PARTITIONS 20,
RANGE (year) (

PARTITION 1980 <=VALUES < 1990,
PARTITION 1990 <=VALUES < 2000,
PARTITION VALUE = 2001,
PARTITION 2001

) STORED AS KUDU;

注意。这里分区细节。

1.这里是联合分区即hash和range

2.这里range里有范围和固定值，其中范围用values 固定值用value

3.这里说下这种联合分区的好处，既保证了插入效率又保证了读取速度，比较中庸

建外部表本质就是表数据在kudu里但是显示在impala

Here is an example of creating an external Kudu table:

-- Inherits column definitions from original table. -- For tables created through Impala, the kudu.table_name property -- comes from DESCRIBE FORMATTED output from the original table.

CREATE EXTERNAL TABLE external_t1 STORED AS KUDU TBLPROPERTIES ('kudu.table_name'='kudu_tbl_created_via_api');

具体操作

1.kudu api建了个default.cc_test_kd_2表，然后通过insert api插入数据，此时在impala上是查不到该表的，该表都查不到，数据更不用说了。但是kudu api还是可以查到

2.在impala上操作 CREATE EXTERNAL TABLE cc_test_impala_kd2 STORED AS KUDU
TBLPROPERTIES ('kudu.table_name'='default.cc_test_kd_2');

3.此时我们可以在impala上查到该数据

4. 同样我们在impala删除该表数据还是会保留在kudu里

CTAS建表语法

-- The CTAS statement defines the primary key and partitioning scheme. -- The rest of the column definitions are derived from the select list.

CREATE TABLE ctas_t1 PRIMARY KEY (id) PARTITION BY HASH (id) PARTITIONS 10 STORED AS KUDU AS SELECT id, s FROM kudu_t1

The following CREATE TABLE clauses are not supported for Kudu tables:

• PARTITIONED BY (Kudu tables use the clause PARTITION BY instead)

• LOCATION

• ROWFORMAT

• CACHED IN | UNCACHED

• WITH SERDEPROPERTIES

这种建表就是说我们指定了主键分区其余的键不需要我们指定，默认会继承

create table ctas_impala_kd primary key(name )

partition by hash(name ) partitions 4
stored as kudu
as select name ,id ,age from cc_test_impala_kd2

--注意 name放最前，你要创建的主键字段放最前面

其中其余的属性例如压缩编码默认值基本都不用。。。后面学到了再说。

关于kudu的分区知道多少呢？hash range ？这只是最基本的，实际上我觉得很多要学的。

PARTITION BY HASH

-- Apply hash function to 1 primary key column.
create table hash_t1 (x bigint, y bigint, s string, primary key (x,y))
partition by hash (x) partitions 10
stored as kudu;
-- Apply hash function to a different primary key column.
create table hash_t2 (x bigint, y bigint, s string, primary key (x,y))
partition by hash (y) partitions 10
stored as kudu;
-- Apply hash function to both primary key columns.
-- In this case, the total number of partitions is 10.
create table hash_t3 (x bigint, y bigint, s string, primary key (x,y))
partition by hash (x,y) partitions 10
stored as kudu;
-- When the column list is omitted, apply hash function to all primary key
columns.
create table hash_t4 (x bigint, y bigint, s string, primary key (x,y))
partition by hash partitions 10
stored as kudu;

备注-如果不指定hash(xxx,yyy)默认就是按照主键，如上就是hash(x,y)
-- Hash the X values independently from the Y values.
-- In this case, the total number of partitions is 10 x 20.
create table hash_t5 (x bigint, y bigint, s string, primary key (x,y))
partition by hash (x) partitions 10, hash (y) partitions 20
stored as kudu;
--思考下这种做的目的是啥。。。。

hash (x) partitions 10, hash (y) partitions 20 对比 hash(x,y)parittions 200

比如我经常要通过x,y去查询字段，那么选择哪一种呢？

如果是随机系列的比如 202021 cclovezbf 淘宝购买了哪些东西

如果是前者要经过两次hash运算找到tablet 的具体数据快，而后者只需要一次hash运算找到该tablet,然后再确定具体数据块，个人感觉是差不多的或者前者优于后者。

但是如果我这种时候有需要查询cclovezbf总共买了多少商品呢？此时前者通过计算得到了10个tablet，在10个tablet去查找数据，而后者还是需要在200个tablet去查找。。。明显前者优于后者。

如果我选择插入呢？比如我插入202001的数据，谁的性能更好呢？前者直接插入到10个tablet，后者插入到200个tablet。实话说我觉的前者差于后者。，但是。。感觉10个tablet并发插入也不算很差了。

总的来说感觉前者的写法更好，那有没有什么坏处呢？。。暂时没想到以后来填坑。。!!!

PARTITION BY RANGE

-- Create partitions that cover every possible value of X.
-- Ranges that span multiple values use the keyword VALUES between
-- a pair of < and <= comparisons.
create table range_t1 (x bigint, s string, s2 string, primary key (x, s))
partition by range (x)
(
partition 0 <= values <= 49, partition 50 <= values <= 100,
partition values < 0, partition 100 < values
)
stored as kudu;
-- Create partitions that cover some possible values of X.
-- Values outside the covered range(s) are rejected. 不在range范围内的插入无效。不会报错
-- New range partitions can be added through ALTER TABLE.

增加分区

ALTER TABLE sales_by_year ADD RANGE PARTITION VALUE = 2017;

删除分区
ALTER TABLE sales_by_year DROP RANGE PARTITION VALUE = 2012;

create table range_t2 (x bigint, s string, s2 string, primary key (x, s))
partition by range (x)
(
partition 0 <= values <= 49, partition 50 <= values <= 100
)
stored as kudu;
-- A range can also specify a single specific value, using the keyword VALUE
-- with an = comparison.
create table range_t3 (x bigint, s string, s2 string, primary key (x, s))
partition by range (s)
(
partition value = 'Yes', partition value = 'No', partition value =
'Maybe'
)
stored as kudu;
-- Using multiple columns in the RANGE clause and tuples inside the
partition spec
-- only works for partitions specified with the VALUE= syntax.
create table range_t4 (x bigint, s string, s2 string, primary key (x, s))
partition by range (x,s)
(
partition value = (0,'zero'), partition value = (1,'one'), partition
value = (2,'two')
)
stored as kudu;

combining both HASH and RANGE syntax for the PARTITION BY

-- Values from each range partition are hashed into 10 associated buckets.
-- Total number of partitions in this case is 10 x 2.
create table combined_t1 (x bigint, s string, s2 string, primary key (x, s))
partition by hash (x) partitions 10, range (x)
(
partition 0 <= values <= 49, partition 50 <= values <= 100
)
stored as kudu;
-- The hash partitioning and range partitioning can apply to different
columns.
-- But all the columns used in either partitioning scheme must be from the
primary key.
create table combined_t2 (x bigint, s string, s2 string, primary key (x, s))
partition by hash (s) partitions 10, range (x)
(
partition 0 <= values <= 49, partition 50 <= values <= 100
)
stored as kudu;

这里又有问题了如果一个顾客购买商品表。字段如下日期date 顾客 cid 商品pid ....

毫无疑问这个数据是很大的，那么我如何分区呢？

1.hash(date) 20

2.hash(cid) 20

3.hash(cid,date) partitions 20

4.hash(cid) partitions 4 hash(date)partitions 5

5.hash(cid) partitions4, range(date) partition value=20200101,partition value==20200102

6.range(date) partition value=20200101,partition value==20200102

先说

1.日期的hash值，这样能够把相同日期的数据放到一个tabletserver里，但是。。初期天数比较少的时候，

每天的数据hash值都一样，还是会插入到一个tablet server上，压力大

前期 20210101 和20200102的hash值最后都分配到同一个数据里，会导致分配不均，部分机器压力过大。

但是查询条件是 where date=xxx 速度还行。。

强烈不推荐。。

2.根据cid分组，因为cid很多 hash值会尽量平均数据分布均匀，每台机器负载平均，大批量数据插入的机器压力小，插入速度块。

查询 where cid=cc 的时候速度还行

查询 where date=202111效果差

3.根据hash(cid,date)分区，数据均匀分布，插入性能好

联合查询 where date=202110 and cid=cclovezbf 速度快。

where date=202110效果差。 where cid=cclovezbf 速度慢

4.也是均匀分区，即使插入同一天的数据，但是因为cid hash不同，还是会分布到不同tablet server上，所以插入速度块

查询 where cid=cc 或者where date= 202111 速度中

查询where cid=cc and date =202111 速度快 与3一样

借用kudu官网的话。

5.与4相比差别在于 hash(date) 还是range(date)

区别在哪？

1.如果date的天数较少有一定的分布不归但是由于都cid hash了，所以数据不均的影响较小，但是此时hash date 差于 range date

如果date 天数较多，hash均匀，但是 rang如何分区？我hash可以直接parittions 20

按天分区每天alter table add range partition 比较麻烦。range需要手动维护，

查询的话不用 where date =20210101 range 优于 hash，但是维护稍微麻烦点。(可以使用脚本建)

如果按月分区查询 where date=202101 效率差不多把。一个是从20个parititions去找一个是从多少个range去找，一般差不了多少。

6.适用于经常对date进行查询的表，比如要算每天销售额每天顾客数量。

其实综合来说还是5>4>6>123 但是你有一些特殊需求，可以自己分区。。。

以上都是个人认识未经过认证。。勿喷。

就是说kudu可以增删改查，和基于hdfs的hive相比功能强大还能实时读取

但是不支持load data，truncate table ，insert overwrite。

kudu和impala的结合非常适合于那些对查询比较重要的。如果数据是持续不断的每一小批，或者那种部分更新的,就不是特别适合。随着数据的到达，基于hdfs的表需要大量的资源去替换和查找原始数据文件。

impala对于查看kudu表也很好，修改和删除也不错， java api也可以搞这些事。。

这种感觉没啥营养不想翻译了。

对于基于hdfs的表来说，我们一般要考虑集群有多少个dn，在集群中查询的适合 hdfs数据文件有多大，有多少被读到，同时每个dn的工作效率和网络交互最终组成了查询结果

对于kudu表来说有点不一样

1.存储模式不一样 hbase hive都是存在hdfs上的但是 kudu就是存在服务器上

2.kudu 必须分区，对于分区数据每个分区的数据是单独的

3.尽量将dn和tablet server放在同一机器上不必须。

4.kudu表的副本数为奇数。

Impala DDL Enhancements for Kudu Tables

1.kudu表首次向impala引入了主键的概念，主键一般由1-n列构成，在查询的时候会被用到多列构建的主键，这个值必须唯一，并且不能有null，并且联合主键不能被更新比如我date=202101 id=cclovezbf 你就不能把我id改为zbflovecc 。同时分区列必须来源于主键

主键有物理和逻辑考虑

1.物理：因为主键唯一，通常将主键的值映射到特定的tablet，怎么理解这句话？

因为分区列来源于主键，知道了主键其实也就知道了分区。

2.逻辑：因为主键唯一约束存在，所以insert失败了，我还可以继续insert直至成功，对我没有影响，即使我insert了100次才成功(insert重复主键，不报错)，对于要更新的数据，通过upsert也可以一直更新，同时还不用创建新的副本

Kudu-Specific Column Attributes for CREATE TABLE

PRIMARY KEY 

| [NOT] NULL 

| ENCODING codec 

| COMPRESSION algorithm 

| DEFAULT constant_expression 

| BLOCK_SIZE number

PRIMARY KEY Attribute

对于列来说可以加如下属性。

可以一列或者多列组成

主键默认用于自然排序

每行的主键唯一

主键不能为空，所以主键列默认not null

主键必须写在最前面就是create table (column1 column2 c3 c4 ) 你可以 PRIMARY KEY(c1)，或PRIMARY KEY(c1,c2)但是不要 PRIMARY KEY(c2)

两种写法primarykey 都有点类似mysql主键

CREATE TABLE pk_inline
(
 col1 BIGINT PRIMARY KEY,
 col2 STRING,
 col3 BOOLEAN
) PARTITION BY HASH(col1) PARTITIONS 2 STORED AS KUDU;
CREATE TABLE pk_at_end
(
 col1 BIGINT,
 col2 STRING,
 col3 BOOLEAN,
 PRIMARY KEY (col1)
) PARTITION BY HASH(col1) PARTITIONS 2 STORED AS KUDU;
--两列作为联合主键
CREATE TABLE pk_multiple_columns
(
 col1 BIGINT,
 col2 STRING,
 col3 BOOLEAN,
 PRIMARY KEY (col1, col2)
) PARTITION BY HASH(col2) PARTITIONS 2 STORED AS KUDU;

查看建表语句

SHOW CREATE TABLE inline_pk_rewritten;

主键不能改！

如果联合主键太多，有56个了会降低写入性能。

因此主键的选择：经常被使用的，最具有代表性的，非空列。例如身份证手机号码 qq号。。。

如果一个列的值经常被改变那么就不要做逐渐，用个 not null 就好了。

如果有一列的值不正确或者过期了(说的应该是主键不对)。删除这列，并且插入一列正确的列(有个正确的主键)

NULL | NOT NULL Attribute

CREATE TABLE required_columns
(
 id BIGINT PRIMARY KEY,
 latitude DOUBLE NOT NULL,
 longitude DOUBLE NOT NULL,
 place_name STRING,
 altitude DOUBLE,
 population BIGINT
) PARTITION BY HASH(id) PARTITIONS 2 STORED AS KUDU;

在性能优化过程中，Kudu可以利用不允许空值跳过某些检查每个输入行，加快查询和联接操作。因此，在适当时指定NOTNULL约束。

除了主键其余列都是默认null即默认可以为空，因为默认的所以可以忽略

由于主键列不能包含任何NULL值，因此主键不需要NOTNULL子句，也可以加没卵用

DEFAULT Attribute

CREATE TABLE default_vals
(
 id BIGINT PRIMARY KEY,
 name STRING NOT NULL DEFAULT 'unknown',
 address STRING DEFAULT upper('no fixed address'),
 age INT DEFAULT -1,
 earthling BOOLEAN DEFAULT TRUE,
 planet_of_origin STRING DEFAULT 'Earth',
 optional_col STRING DEFAULT NULL
) PARTITION BY HASH(id) PARTITIONS 2 STORED AS KUDU;

default 默认值必须是常量constant expression 例如文字值、算术和字符串操作的组合。它不能包含对列或列的引用，非确定性函数调用。这里说的有点笼统，其实就是不能有sysdate。。。

当设计一个全新的schema的时候，推荐使用default null作为占位符(默认的)，因为你不知道接下来的数据是什么样的，因为null能被存储的非常有效，并且在查询is null 和is not null的时候是非常快的。

ENCODING Attribute

CREATE TABLE various_encodings
(
 id BIGINT PRIMARY KEY,
 c1 BIGINT ENCODING PLAIN_ENCODING,
 c2 BIGINT ENCODING AUTO_ENCODING,
 | Using Impala to Query Kudu Tables | 736
 c3 TINYINT ENCODING BIT_SHUFFLE,
 c4 DOUBLE ENCODING BIT_SHUFFLE,
 c5 BOOLEAN ENCODING RLE,
 c6 STRING ENCODING DICT_ENCODING,
 c7 STRING ENCODING PREFIX_ENCODING
) PARTITION BY HASH(id) PARTITIONS 2 STORED AS KUDU;
-- Some columns are omitted from the output for readability.
describe various_encodings;
+------+---------+-------------+----------+-----------------+
| name | type | primary_key | nullable | encoding |
+------+---------+-------------+----------+-----------------+
| id | bigint | true | false | AUTO_ENCODING |
| c1 | bigint | false | true | PLAIN_ENCODING |
| c2 | bigint | false | true | AUTO_ENCODING |
| c3 | tinyint | false | true | BIT_SHUFFLE |
| c4 | double | false | true | BIT_SHUFFLE |
| c5 | boolean | false | true | RLE |
| c6 | string | false | true | DICT_ENCODING |
| c7 | string | false | true | PREFIX_ENCODING |
+------+---------+-------------+----------+-----------------+

每一列都可以自由编码。

• AUTO_ENCODING: use the default encoding based on the column type, which are bitshuffle for the numeric type columns and dictionary for the string type columns.
• PLAIN_ENCODING: leave the value in its original binary format.
• RLE: compress repeated values (when sorted in primary key order) by including a count.
• DICT_ENCODING: when the number of different string values is low, replace the original string with a numeric ID.
• BIT_SHUFFLE: rearrange the bits of the values to efficiently compress sequences of values that are identical or vary only slightly based on primary key order. The resulting encoded data is also compressed with LZ4.
• PREFIX_ENCODING: compress common prefixes in string values; mainly for use internally within Kudu.

总结下默认都是AUTO_ENCODING 其中数字类型的默认BIT_SHUFFLE，string类型的DICT_ENCODING

那么这几种的编码各有什么用呢？优势和劣势？

AUTO_ENCODING 省心省力

PLAIN_ENCODING 保持数据原本的二进制格式

RLE 好像是通过xx来压缩重复的值，当通过主键排序的时候。。不太理解，感觉好像是有些数据有很多重复的时候使用这个好点，比如人员信息表，身高一栏？

DICT_ENCODING 当字符串数值重复的较少的时候，用数字id替换？例如，身份证号码？基本不一样，或者账号id 物流id？

BIT_SHUFFLE 根据主键顺序重新排列值的位，以有效压缩相同或略有不同的值序列。得到的编码数据也用LZ4压缩

PREFIX_ENCODING 压缩字符串值中的常用前缀；主要用于Kudu内部。比如有的前缀是地名hb_cc gd_cc hn_cc?

仅供学习，吹牛比用的。平常用个auto 就够了。

BLOCK_SIZE Attribute

要看kudu官网等会

Apache Kudu - Introducing Apache Kuduhttps://kudu.apache.org/docs/index.htmlPartitioning for Kudu Tables

Kudu tables use special mechanisms to distribute data among the underlying tablet servers. Although we refer to such
tables as partitioned tables, they are distinguished from traditional Impala partitioned tables by use of different clauses
on the CREATE TABLE statement. Kudu tables use PARTITION BY, HASH, RANGE, and range specification
clauses rather than the PARTITIONED BY clause for HDFS-backed tables, which specifies only a column name and
creates a new partition for each different value.

就是说kudu和hdfs数据不一样，本质是服务器之间的数据分发。

Hash Partitioning

Hash partitioning is the simplest type of partitioning for Kudu tables. For hash-partitioned Kudu tables, inserted
rows are divided up between a fixed number of “buckets” by applying a hash function to the values of the columns
specified in the HASH clause. Hashing ensures that rows with similar values are evenly distributed, instead of
clumping together all in the same bucket. Spreading new rows across the buckets this way lets insertion operations
work in parallel across multiple tablet servers. Separating the hashed values can impose additional overhead on
queries, where queries with range-based predicates might have to read multiple tablets to retrieve all the relevant
values.

hash分区是最简单的分区。还是之前的话，hash尽可能分散，比如cclovezbf 和cclovezbf1两个值很接近但是hash后的值完全不一样。分布到各个tablet server区间，

插入快，但是如果是范围查询(like < >)的话就需要跨多个tablet server了

-- 1M rows with 50 hash partitions = approximately 20,000 rows per partition.

100w/50= 2w一分区，如果1000w呢？那就要500个分区
-- The values in each partition are not sequential, but rather based on a hash function.
-- Rows 1, 99999, and 123456 might be in the same partition.

分区内的数据不是连续！是基于hash的

例如分区column列的1 99999 123456可能是在同一个分区
CREATE TABLE million_rows (id string primary key, s string)
PARTITION BY HASH(id) PARTITIONS 50
STORED AS KUDU;
-- Because the ID values are unique, we expect the rows to be roughly
-- evenly distributed between the buckets in the destination table.
INSERT INTO million_rows SELECT * FROM billion_rows ORDER BY id LIMIT 1e6;

Note: The largest number of buckets that you can create with a PARTITIONS clause varies depending on the number of tablet servers in the cluster, while the smallest is 2. For simplicity, some of the simple CREATE TABLE statements throughout this section use PARTITIONS 2 to illustrate the minimum requirements for a Kudu table. For large tables, prefer to use roughly 10 partitions per server in the cluster.

最小是2 大点的表建议每个server 10个起步，我们集群差不多7-8个server 按照之前说的就是70个partition也就是140w数据。差不多了

Range Partitioning

Range partitioning lets you specify partitioning precisely, based on single values or ranges of values within one or more columns. You add one or more RANGE clauses to the CREATE TABLE statement, following the PARTITION BY clause. Range-partitioned Kudu tables use one or more range clauses, which include a combination of constant expressions, VALUE or VALUES keywords, and comparison operators. (This syntax replaces the SPLIT ROWS clause used with early Kudu versions.)

通过value 和values 来进行partition by range(column)( partition value=xxx)分区

-- 50 buckets, all for IDs beginning with a lowercase letter.
-- Having only a single range enforces the allowed range of value
-- but does not add any extra parallelism.
create table million_rows_one_range (id string primary key, s string)
partition by hash(id) partitions 50,
range (partition 'a' <= values < '{')
stored as kudu;

上面的例子说range就分了一个区和sb一样不要这样干

-- 50 buckets for IDs beginning with a lowercase letter
-- plus 50 buckets for IDs beginning with an uppercase letter.
-- Total number of buckets = number in the PARTITIONS clause x number of
ranges.
-- We are still enforcing constraints on the primary key values
-- allowed in the table, and the 2 ranges provide better parallelism
-- as rows are inserted or the table is scanned.
create table million_rows_two_ranges (id string primary key, s string)
partition by hash(id) partitions 50,
range (partition 'a' <= values < '{', partition 'A' <= values < '[')
stored as kudu;

range两个分区有较好的并行度

-- Same as previous table, with an extra range covering the single key value
'00000'.
create table million_rows_three_ranges (id string primary key, s string)
partition by hash(id) partitions 50,
range (partition 'a' <= values < '{', partition 'A' <= values < '[',
partition value = '00000')
stored as kudu;
-- The range partitioning can be displayed with a SHOW command in impalashell.
show range partitions million_rows_three_ranges;
+---------------------+
| RANGE (id) |
+---------------------+
| VALUE = "00000" |
| "A" <= VALUES < "[" |
| "a" <= VALUES < "{" |
+---------------------+

Note:
When defining ranges, be careful to avoid “fencepost errors” where values at the extreme ends might be included or omitted by accident. For example, in the tables defined in the preceding code listings, the range "a" <= VALUES< "{" ensures that any values starting with z, such as za or zzz or zzz-ZZZ, are all included, by using a less-than operator for the smallest value after all the values starting with z.
For range-partitioned Kudu tables, an appropriate range must exist before a data value can be created in the table.
Any INSERT, UPDATE, or UPSERT statements fail if they try to create column values that fall outside the specified ranges. The error checking for ranges is performed on the Kudu side; Impala passes the specified range information to Kudu, and passes back any error or warning if the ranges are not valid. (A nonsensical range specification causes an error for a DDL statement, but only a warning for a DML statement.)

fencepost errors 翻译篱笆桩错误是啥呢？思考了下就是范围分区貌似不能动态分区，比如我要按天数分区，天数一直增长我不可能一直无限制增长到2099-12-31.结果发现理解错了。。

意思是就是范围分区特别是 <>这种 "a" <= VALUES< "{ “这种分区才是正确的，如果是"a" <= VALUES<= "z" 那么zzz zzz-ZZ可能就被排除了

你可能感兴趣的:(kudu,kudu)

【Azure 应用服务】如何查看App Service Java堆栈JVM相关的参数默认配置值？云中路灯
问题描述如何查看AppServiceJava堆栈JVM相关的参数默认配置值？问题解答可以通过AppService的高级管理工具(kudu:)来查看JVM的相关参数，使用命令：java-XX:+PrintFlagsInitial-versionimage鉴于以上输出的参数太多，可以通过命令把结果输出在txt文件中，如：java-XX:+PrintFlagsInitial-version>D:\hom
【Azure 应用服务】Python3.7项目在引用pandas 模块后，部署报错云中路灯
问题描述参考“快速入门：在Linux上的Azure应用服务中创建Python应用”文档，在AppServiceForLinux环境中部署Python应用，在添加了pandas，应用本地运行成功，但是部署到AppService后，启动报错：ApplicationError2021051101.png问题分析获取日志：可以通过高级工具（kudu）连接到AppService后台，因为是Linux系统，所
java.io.InvalidClassException(spark任务运行失败） LATASA spark java 大数据
背景：客户集群内偶尔会出现java.io.InvalidClassException:org.apache.kudu.spark.kudu.KuduRDD;localclassincompatible:streamclassdescserialVersionUID=1,localclassserialVersionUID=1738372855795541573，公司集群从未出现。之前一直以为是版本
【Azure 应用服务】在 App Service for Windows 中自定义 PHP 版本的方法云中路灯
问题描述在AppServiceforWindows的环境中，当前只提供了PHP7.4版本的选择情况下，如何实现自定义PHPRuntime的版本呢?如PHPVersion8.1.9？image.png当AppService创建号值后，并且在门户上设置PHPVersion版本位PHP7.4,然后进入Kudu站点中，进入C:\home\sites\wwwroot目录中，创建一个index.php文件，文
69.Kudu、Spark2、Kafka安装—CDH 大勇任卷舒
69.1演示环境介绍CDH集群运行正常操作系统版本为：CentOS6.5CM和CDH版本为：5.12.1CM管理员为：admin用户操作系统用户为：root用户69.2操作演示Kudu安装Kudu的Parcel部署下载Kudu的Parcel包：http://archive.cloudera.com/kudu/parcels/5.12.1/KUDU-1.4.0-1.cdh5.12.1.p0.10-e
AJ-Report 【开源的一个BI平台】临水逸 java 大数据
AJ-Report是全开源的一个BI平台，酷炫大屏展示，能随时随地掌控业务动态，让每个决策都有数据支撑。多数据源支持，内置mysql、elasticsearch、kudu驱动，支持自定义数据集省去数据接口开发，目前已支持30+种大屏组件/图表，不会开发，照着设计稿也可以制作大屏。三步轻松完成大屏设计：配置数据源---->写SQL配置数据集---->拖拽配置大屏---->保存发布。欢迎体验。
Kudu+Impala介绍 wjmmjr1
转自：http://www.360doc.com/content/18/0913/16/59691344_786386910.shtmlKudu+Impala介绍概述Kudu和Impala均是Cloudera贡献给Apache基金会的顶级项目。Kudu作为底层存储，在支持高并发低延迟kv查询的同时，还保持良好的Scan性能，该特性使得其理论上能够同时兼顾OLTP类和OLAP类查询。Impala作为
impala与kudu进行集成 shandongwill 大数据 impala kudu impala与kudu集成
文章目录概要Kudu与Impala整合配置Impala内部表Impala外部表Impalasql操作kuduImpalajdbc操作表如果使用了Hadoop使用了Kerberos认证，可使用如下方式进行连接。概要Impala是一个开源的高效率的SQL查询引擎，用于查询存储在Hadoop分布式文件系统（HDFS）中的大规模数据集。它提供了一个类似于传统关系型数据库的SQL接口，允许用户使用SQL语言
大数据框架(分区，分桶，分片) 坨坨的大数据
前言在大数据分布式中，分区，分桶，分片是设计框架的重点。此篇就来总结各个框架。建议收藏目录Hive分区与分桶ES分片Kafka分区HBase分区Kudu分区HiveHive分区是按照数据表的某列或者某些列分为多区，在hive存储上是hdfs文件，也就是文件夹形式。现在最常用的跑T+1数据，按当天时间分区的较多。把每天通过sqoop或者datax拉取的一天的数据存储一个区，也就是所谓的文件夹与文件。
45.使用Sentry授权—Kudu 大勇任卷舒
45.1演示环境CDH5.11.2和CDH5.13两个集群运行正常两个集群Kudu已经安装，且已集成Impala，操作正常两个集群都已启用Sentry并且配置正确CDH5.11.2和CDH5.13集群用root用户操作集群未启用Kerberos该项不影响整个测试效果，Fayson只是为了操作方便。45.2操作演示CDH5.11.2测试Kudu1.3的Sentry授权创建admin管理员role，给
Kudu-1.16编译中下载Gradle依赖失败的解决办法 stiga-huang Impala gradle impala
Kudu-1.16编译中下载Gradle依赖失败的解决办法最近在国内的机器上编译Impala的native-toolchain，没法挂代理，发现编译kudu-1.16时失败了：FAILURE:Buildfailedwithanexception.*Whatwentwrong:Executionfailedfortask':buildSrc:compileGroovy'.>Couldnotresol
Impala元数据简介 stiga-huang Impala
Impala元数据简介背景Impala是一个高性能的OLAP查询引擎，与其它SQL-on-Hadoop的ROLAP解决方案如Presto、SparkSQL等不同的是，Impala对元数据（Metadata/Catalog）做了缓存，因此在做查询计划生成时不再依赖外部系统（如Hive、HDFS、Kudu），能做到毫秒级别的生成时间。另外缓存元数据也能极大减少对底层系统Master节点（HiveMet
Kudu之Scala版本API 香山上的麻雀
建表：//创建kudu连接valkuduClient=newKuduClient.KuduClientBuilder("172.20.85.29:7051").build()//设置表名valtableName="kudu_test"//创建列valcolums=List[ColumnSchema]((newColumnSchema.ColumnSchemaBuilder("name",Type.
Hive实战处理（二十三）hive整合phoenix sheep8521 hbase hive hive hbase
背景：业务表使用hbase存储,使用hive整合phoenix，使用sql语句进行数据查询（如果可以的话使用网关API对外提供服务）统一接口调用，查询上线比较高效。1、hive整合phoenix的原理Hive支持使用HDFS之外的存储系统作为底层存储系统，其中官方明确支持HBase，Kudu，Druid和JDBC(MySQL等)。Hive提供了相应的接口StorageHandlers，用以实现和其
kudu介绍和使用古城的风cll 大数据 kudu
kudu架构同hdfs和Hbase相似,kudu使用单个的master节点，用来管理集群的元数据，并且使用任意数量的tabletserver节点来存储实际数据。可以部署多个master节点来提高容错性，一个table表的数据，被分割成一个或多个tablet,tablet被部署在tabletserver来提高数据读写服务Kudu有列长度限制，不能超过64k不支持CHAR、VARCHAR、DATE和数
impala + kudu | 大数据实时计算踩坑优化指南王知无(import_bigdata) java 数据库 mysql spark hadoop
一开始需要全量导入kudu，这时候我们先用sqoop把关系数据库数据导入临时表，再用impala从临时表导入kudu目标表由于sqoop从关系型数据直接以parquet格式导入hive会有问题，这里默认hive的表都是text格式；每次导完到临时表，需要做invalidatemetadata表操作，不然后面直接导入kudu的时候会查不到数据.除了查询，建议所有impala操作都在impala-sh
Impala查询详解 weixin_34234823 系统架构数据库 c/c++
Impala的定位是一种新型的MPP查询引擎，但是它又不是典型的MPP类型的SQL引擎，提到MPP数据库首先想到的可能是GreenPlum，它的每一个节点完全独立，节点直接不共享数据，节点之间的信息传递全都通过网络实现。而Impala可以说是一个MPP计算引擎，它需要处理的数据存储在HDFS、Hbase或者Kudu之上，这些存储引擎都是独立于Impala的，可以称之为第三方存储引擎，Impala使
kudu NoSQL数据库详解 wespten 数据库存储块存储文件存储对象存储分布式网络存储 ui
一、Hbase、Kudu和ClickHouse对比Hadoop生态圈中HDFS一直用来保存底层数据。Hbase作为一款Nosql也是Hadoop生态圈的核心组件，它海量的存储能力，优秀的随机读写能力，能够处理一些HDFS不足的地方。Clickhouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。能够使用SQL查询实时生成分析数据报告。它同样拥有优秀的数据存储能力。ApacheK
备份kudu表数据（Kudu导入导出）冬瓜螺旋雪碧 Hadoop Kudu 自己踩得坑 Impala kudu数据导入导出 impala备份kudu表数据 kudu数据备份 impala数据备份
由于kudu修改hostname导致数据raft无法自动刷新，无法写入和修改所以需要做好备份。方法0：最简单的方法是建好一张和需要备份的表一样的kudu表INSERTINTOTABLEsome_parquet_tableSELECT*FROMkudu_table方法一：(在Hue中进行即可）1,利用impala进行备份，将Kudu表结构转化为impala表结构(其数据存储在hdfs中)提前建好im
kudu update操作 badboynt EsgynDB kudu学习笔记数据库 sql
kudu的update操作与insert操作类似，一开始需要先查询主键是否存在。如果不存在则会报错。。只有当主键存在时，才会真正进行写入操作。查询主键的过程与insert过程完全相同。流程如下图所示：当主键存在时，此时已经定位到某个具体的rowset了。在这里update操作与insert操作开始体现出区别。一个diskrowset中包含一个basedata以及多个deltafile。insert
Impala-查询Kudu表详解（超详细）大数据魔法师 Impala 大数据
文章目录前言一、使用Impala查询kudu表介绍1.使用Impala与Kudu表的好处2.配置Impala以使用Kudu3.Kudu副本因子二、ImpalaDDL增强功能1.Kudu表的主键列2.Kudu表特定的列属性1.主键属性2.NULL|NOTNULL属性3.DEFAULT属性4.ENCODING属性5.COMPRESSION属性6.BLOCK_SIZE属性三、Kudu表分区1.哈希分区2
23.Kudu表插入中文字符大勇任卷舒
23.1问题情况使用ImpalaJDBC向Kudu表中插入中文字符，插入的中文字符串乱码，中文字符串被截断。测试环境：CDH5.12.0Kudu1.4.0ImpalaJDBC41_2.5.35使用ImpalaJDBC代码进行测试，测试代码staticStringJDBC_DRIVER="com.cloudera.impala.jdbc41.Driver";staticStringCONNECTIO
Flink实时电商数仓之Doris框架（七）十七✧ᐦ̤ flink 大数据 doris
Doris框架大规模并行处理的分析型数据库产品。使用场景：一般先将原始数据经过清洗过滤转换后，再导入doris中使用。主要实现的功能有：实时看板面向企业内部分析师和管理者的报表面向用户或者客户的高并发报表分析即席查询统一数仓构建：替换了原来由Spark,Hive，Kudu,Hbase等旧框架数据湖联邦查询：通过外表的方式联邦分析位于Hive，IceBerg,Hudi中的数据Doris架构后端：C语
01-黑马程序员大数据开发 S1406793 大数据开发大数据
一.Hadoop概述1.什么是大数据狭义上：对海量数据进行处理的软件技术体系广义上：数字化、信息化时代的基础支撑，以数据为生活赋2.大数据的核心工作：存储：妥善保存海量待处理数据；ApacheKUDU、云平台存储：阿里云OSS、UCloud的US3、AWS的S3、金山云的KS3等等计算：完成海量数据的价值挖掘；ApacheHadoop-MapReduce；ApacheHive是一款以SQL
kudu建表/试图sql Poo某人
----创建kudu表CREATETABLEDatabases.Table1(idINT,nameSTRING,ageSTRING,PRIMARYKEY(id1))PARTITIONBYHASHPARTITIONS3STOREDASKUDU-----创建kudu试图CREATEVIEWIFNOTEXISTSDatabases.view1ASSELECTid,name,ageFROMDatabase
kudu由来、架构、数据存储结构、注意事项 AllenGd KUDU kudu
一、kudu背景介绍Kudu是Cloudera开源的新型列式存储系统，是ApacheHadoop生态圈的成员之一(incubating)，专门为了对快速变化的数据进行快速的分析，填补了以往Hadoop存储层的空缺。1.1一方面：在KUDU之前，大数据主要以两种方式存储；（1）静态数据：以HDFS引擎作为存储引擎，适用于高吞吐量的离线大数据分析场景。这类存储的局限性是数据无法进行随机的读写。（2）动
Kudu-架构与设计临江蓑笠翁大数据 #Kudu 架构
Kudu架构与设计一、背景1.存储组件2.使用场景3.多组件组合缺点3.1架构复杂3.2时效性低3.3应对数据更新二、Kudu概述1.设计特点2.框架适用场景3.框架不适用场景三、数据模型与存储1.Table2.Tablet3.MetaData4.RowSet5.MemRowSet6.DiskRowSet6.1BaseData6.2DeltaStores四、Kudu架构图1.Mastertable
2.CENTOS安装CDH和Kudu-1 大勇任卷舒
版本：CENTOS7.2CDH5.10Kudu1.22.1概述本文CENTOS7.2操作系统部署CDH企业版的过程。Cloudera企业级数据中心的安装主要分为4个步骤：集群服务器配置，包括安装操作系统、关闭防火墙、同步服务器时钟等；外部数据库安装安装Cloudera管理器；安装CDH集群；集群完整性检查，包括HDFS文件系统、MapReduce、Hive等是否可以正常运行。这篇文档将着重介绍Cl
flink写入带kerberos认证的kudu connector 重生之我在异世界打工 flink flink
文章目录前言一、介绍二、先来看kudujavaapi认证kerberos1.首先需要进行kerberos的验证（需要将相应用户的keytab文件引入本地）2.依赖3.引入hadoop配置文件4.获取客户端5.增删改查三、修改flink-kuduconnector支持kerberos1.先从github下载源码2.修改四、修改后的代码分享前言找了半天网上一点资料都没有，还是得靠自己。一、介绍flin
这个牛逼了，基于 SpringBoot + Vue 实现的可视化拖拽编辑的大屏项目 qq_18932003 vue elasticsearch mysql
今天给小伙伴们分享一个基于SpringBoot+Vue实现的可视化拖拽编辑的大屏项目-AJ-Report简介AJ-Report由安吉加加开源的一个BI平台，酷炫大屏展示，能随时随地掌控业务动态，让每个决策都有数据支撑。多数据源支持，内置mysql、elasticsearch、kudu驱动，支持自定义数据集省去数据接口开发，支持17种大屏组件，不会开发，照着设计稿也可以制作大屏。三步轻松完成
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象