vagabond6

clickhouse SQL查询语句【译自Github 英文文档】

内容有缩减，原文请点击这里

创建数据库

CREATE DATABASE [IF NOT EXISTS] db_name

创建表

CREATE TABLE可以有几种形式。

创建一张表，最好指定引擎结构

CREATE [TEMPORARY] TABLE [IF NOT EXISTS] [db.]name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE = engine

创建一张像另一张表结构的表

CREATE [TEMPORARY] TABLE [IF NOT EXISTS] [db.]name AS [db2.]name2 [ENGINE = engine]

创建一张自定义引擎，数据及结构来源于另一张表的表

CREATE [TEMPORARY] TABLE [IF NOT EXISTS] [db.]name ENGINE = engine AS SELECT ...

默认值

列描述可以指定一个默认值的表达式，其中有以下几个方法：默认的expr、物化expr、别名expr。示例:URLDomain字符串默认域（URL）。
如果没有定义默认值的表达式，那么默认值将被设置为0，用于数字、字符串的空字符串、数组的空数组，以及用于日期的00-00 00 00 00 00 0000-0000。不支持null。

临时表

在所有情况下，如果指定临时表，就会创建临时表。临时表有以下特点：

临时表在会话结束时消失，包括连接丢失。
一个临时表是用内存引擎创建的。其他表引擎不受支持。
DB不能为临时表指定。它是在数据库之外创建的。
如果临时表与另一个表的名称相同，并且查询指定表名而不指定DB，则使用临时表。
对于分布式查询处理，查询中使用的临时表被传递给远程服务器。

在大多数情况下，临时表不是手动创建的，而是在使用外部数据进行查询时，或者在分布式（全局）中使用。

创建视图

CREATE [MATERIALIZED] VIEW [IF NOT EXISTS] [db.]name [TO[db.]name] [ENGINE = engine] [POPULATE] AS SELECT ...

有两种类型的视图：正常的和物化的。

在创建物化视图时，必须指定引擎—用于存储数据的表引擎。

物化视图的工作原理如下：当将数据插入SELECT中指定的表时，插入数据的一部分被这个SELECT查询转换，结果被插入到视图中。
普通视图不存储任何数据，只是执行从另一个表读取的数据。换句话说，正常的视图只不过是一个保存的查询。从视图读取时，这个保存的查询被用作FROM子句中的子查询。

举例，假设你已经创建了一个视图

CREATE VIEW view AS SELECT ...

而且写了一个查询

SELECT a, b, c FROM view

这个查询等价于这个子查询

SELECT a, b, c FROM (SELECT ...)

物化视图是这样安排的：在将数据插入到SELECT中指定的表时，插入数据的一部分被这个SELECT查询转换，结果被插入到视图中。如果您指定填充，则在创建时将现有的表数据插入视图中，就像创建一个CREATE TABLE。作为选择……否则，查询只包含创建视图后插入到表中的数据。我们不建议使用填充，因为在视图创建期间插入到表中的数据不会被插入到其中。

ATTACH

这个查询与CREATE完全相同，但是不是“创建”这个词，它使用“附加”这个词。

该查询不会在磁盘上创建数据，但是假设数据已经在适当的位置，并且只向服务器添加关于表的信息。执行附加查询后，服务器将知道表的存在。如果表以前是分离的，也就是说它的结构是已知的，那么您可以使用速记而不用定义结构。

ATTACH TABLE [IF NOT EXISTS] [db.]name

在启动服务器时使用该查询。服务器将表元数据存储为带有附加查询的文件，它只是在启动时运行（除了在服务器上显式创建的系统表之外）

DETACH

从服务器删除关于“name”表的信息。服务器停止知道表的存在。

DETACH TABLE [IF EXISTS] [db.]name

这不会删除表的数据或元数据。在下一次服务器启动时，服务器将读取元数据并再次查找表。类似地，可以使用附加查询重新连接一个“分离”表（除了系统表之外，没有为它们存储的元数据）。

DROP

DROP数据库

DROP DATABASE [IF EXISTS] db [ON CLUSTER cluster]

DROP TABLE

DROP [TEMPORARY] TABLE [IF EXISTS] [db.]name [ON CLUSTER cluster]

RENAME

重命名一个或多个表。

RENAME TABLE [db11.]name11 TO [db12.]name12, [db21.]name21 TO [db22.]name22, ... [ON CLUSTER cluster]

所有表都在全局锁定下重命名。重命名表是一项轻操作。如果您在之后指定了另一个数据库，那么该表将被移动到这个数据库。但是，带有数据库的目录必须位于相同的文件系统中（否则，将返回错误）

ALTER

ALTER查询只支持MergeTree表，以及mergeand分布式。该查询有几个变体。

ALTER TABLE [db].name [ON CLUSTER cluster] ADD|DROP|MODIFY COLUMN ...

增加列（排在某个列之后）

ADD COLUMN name [type] [default_expr] [AFTER name_after]

删除列

DROP COLUMN name

改变列类型

MODIFY COLUMN name [type] [default_expr]

不支持在主键或采样键中删除列（在引擎表达式中是列）。更改主键中包含的列的类型只有在此更改不会导致数据被修改时才可能（例如，允许将值添加到枚举中，或者将DateTime的类型更改为UInt32）。

有几个处理阶段：

用修改过的数据准备临时的（新的）文件
重命名旧文件
将临时（新）文件重命名为旧的名称
删除旧的文件

只有第一阶段需要时间。如果在此阶段出现故障，则数据不会更改。如果在一个连续的阶段出现故障，则可以手动恢复数据。唯一的例外是，如果旧文件从文件系统中删除，但是新文件的数据没有写到磁盘上，并且丢失了。

分区操作

它只适用于MergeTree的表：

DETACH PARTITION —— 将一个分区移动到“分离”目录并忘记它
DROP PARTITION —— 删除一个分区
ATTACH PART|PARTITION —— 将一个新的部分或分区从分离的目录添加到表
FREEZE PARTITION —— 创建一个分区的备份
FETCH PARTITION —— 从另一个服务器下载一个分区

每一种类型的查询都被单独地覆盖。

表中的一个分区是单个日历月的数据。这是由表引擎参数中指定的日期键的值决定的。每个月的数据都是单独存储的，以简化对这些数据的操作。

表中的“部分”是来自单个分区的数据的一部分，按主键排序。你可以使用这个系统。用于查看表部分和分区的部件表

例如：只算活跃的部分，不活跃的部分是在合并到更大的部分后剩余的部分——这些部分在合并后大约10分钟被删除。

SELECT * FROM system.parts WHERE active

另一种查看一组部件和分区的方法是使用表数据进入目录。数据目录:/var/lib/clickhouse/data/database/table/,/var/lib/clickhouse/ ClickHouse的路径数据,数据库的数据库名称,表的表名。

$ ls -l /var/lib/clickhouse/data/test/visits/
total 48
drwxrwxrwx 2 clickhouse clickhouse 20480 may   13 02:58 20140317_20140323_2_2_0
drwxrwxrwx 2 clickhouse clickhouse 20480 may   13 02:58 20140317_20140323_4_4_0
drwxrwxrwx 2 clickhouse clickhouse  4096 may   13 02:55 detached
-rw-rw-rw- 1 clickhouse clickhouse     2 may   13 02:58 increment.txt

在这里，2014031720140323220和20140320140323440是数据部分的目录。让我们来分解第一部分的名

20140317是数据块中数据的最小日期
20140323是数据块中数据的最大日期
2是数据块的最小值
2是数据块的最大值
0是块级别（合并树的深度是由它形成的）

每个部分都与一个单独的分区有关，并且只包含一个月的数据。201403是分区的名称。一个分区是一个月的一组部件。

在操作服务器上，您不能手动更改文件系统上的部分或它们的数据，因为服务器不知道它。对于非复制表，当服务器停止时，您可以这样做，但我们不建议这样做。对于复制的表，在任何情况下都不能更改部分。

分离的目录包含服务器不使用的部分——使用ALTER从表中分离

将名为“name”的分区的所有数据移动到“分离”目录，然后忘记它们。分区名称以YYYYMM格式指定。它可以用单引号或没有引号表示

ALTER TABLE [db.]table DETACH PARTITION 'name'

与分离操作相同。从表中删除数据。数据部分将被标记为不活动，在大约10分钟内将被完全删除。该查询将被复制——数据将在所有副本上被删除。

ALTER TABLE [db.]table ATTACH PARTITION|PART 'name'

从“分离”目录中添加数据到表中。

ALTER TABLE [db.]table ATTACH PARTITION|PART 'name'

创建一个或多个分区的本地备份。名称可以是分区的全名（例如，201403），或者它的前缀（例如，2014）：然后将为所有相应的分区创建备份。

ALTER TABLE [db.]table FREEZE PARTITION 'name'

备份和复制

这个查询只适用于可复制的表

ALTER TABLE [db.]table FETCH PARTITION 'name' FROM 'path-in-zookeeper'

尽管查询被称为ALTER TABLE，但它不会改变表结构，也不会立即更改表中可用的数据。它从碎片中下载指定的分区，它在FROM子句中指定了路径，然后将其放入指定表的分离目录中。

SHOW DATABASES

展示所有数据库

SHOW DATABASES [INTO OUTFILE filename] [FORMAT format]

SHOW TABLES

展示数据库里所有表格

SHOW [TEMPORARY] TABLES [FROM db] [LIKE 'pattern'] [INTO OUTFILE filename] [FORMAT format]

SHOW PROCESSLIST

输出正在处理的查询列表

SHOW PROCESSLIST [INTO OUTFILE filename] [FORMAT format]

SHOW CREATE TABLE

显示创建表的SQL

DESC|DESCRIBE TABLE [db.]table [INTO OUTFILE filename] [FORMAT format]

DESCRIBE TABLE

每个字段的名称及类型

DESC|DESCRIBE TABLE [db.]table [INTO OUTFILE filename] [FORMAT format]

EXISTS

存在一个utf-8的列，返回1，否则0

EXISTS [TEMPORARY] TABLE [db.]name [INTO OUTFILE filename] [FORMAT format]

USE

使用某一个数据库

USE db

SET

SET param = value

允许您设置param值，如果指定了全局，则为会话或服务器（全局）设置设置。在创建全局设置时，设置并不适用于已经运行的会话，包括当前会话。它只会用于新会话。当服务器重新启动时，使用SET的全局设置就会丢失。要在服务器重新启动后进行设置

OPTIMIZE

OPTIMIZE TABLE [db.]name [PARTITION partition] [FINAL]

仅支持MergeTree引擎，用于回收闲置的数据库空间，当表上的数据行被删除时，所占据的磁盘空间并没有立即被回收，使用了OPTIMIZE TABLE命令后这些空间将被回收，并且对磁盘上的数据行进行重排

INSERT

不严格插入数据，没有出现的列自动填充为默认值

INSERT INTO [db.]table [(c1, c2, c3)] VALUES (v11, v12, v13), (v21, v22, v23), ...

严格插入数据，每一列都必须出现在上面

INSERT INTO [db.]table [(c1, c2, c3)] FORMAT Values (v11, v12, v13), (v21, v22, v23), ...

插入select 得到的数据

INSERT INTO [db.]table [(c1, c2, c3)] SELECT ...

Performance considerations

按主键对输入数据进行排序，并按月将它们划分为分区。如果您在混合月份插入数据，那么它会显著降低INSERT查询的性能。为了避免这种情况:：

在相当大的批量中添加数据，比如一次100,000行。
在将数据上传至ClickHouse之前，先将数据分组。

性能不会降低：

数据是实时添加的
上传的数据通常是按时间排序的

SELECT

SELECT [DISTINCT] expr_list
    [FROM [db.]table | (subquery) | table_function] [FINAL]
    [SAMPLE sample_coeff]
    [ARRAY JOIN ...]
    [GLOBAL] ANY|ALL INNER|LEFT JOIN (subquery)|table USING columns_list
    [PREWHERE expr]
    [WHERE expr]
    [GROUP BY expr_list] [WITH TOTALS]
    [HAVING expr]
    [ORDER BY expr_list]
    [LIMIT [n, ]m]
    [UNION ALL ...]
    [INTO OUTFILE filename]
    [FORMAT format]
    [LIMIT n BY columns]

子句几乎与查询执行传输器的顺序相同。

在使用FINAL时，查询处理得比较慢。在大多数情况下，您应该避免使用FINAL。

SAMPLE

仅支持MergeTree引擎，且必须在创建时指定抽样表达式

SELECT
    Title,
    count() * 10 AS PageViews
FROM hits_distributed
SAMPLE 0.1
WHERE
    CounterID = 34
    AND toDate(EventDate) >= toDate('2013-01-29')
    AND toDate(EventDate) <= toDate('2013-02-04')
    AND NOT DontCountHits
    AND NOT Refresh
    AND Title != ''
GROUP BY Title
ORDER BY PageViews DESC LIMIT 1000

SAMPLE k 当k在0~1之间时，如上例k=0.1，即在10%上的数据执行

SAMPLE k 当k为正整数时，如上例k=1000，运行该查询最多为1000行

上例是在10%的数据里执行的，所以count()要手动*10，当使用类似10000000的样例时，没有任何关于哪个相对百分比的数据被处理的信息，或者聚合函数应该乘以什么，因此这种写作方法并不总是适用于这种情况。

ARRAY JOIN

查询只能指定单个数组连接子句

ARRAY本质上和INNER JOIN 一样，举例：

:) CREATE TABLE arrays_test (s String, arr Array(UInt8)) ENGINE = Memory

CREATE TABLE arrays_test
(
    s String,
    arr Array(UInt8)
) ENGINE = Memory

Ok.

0 rows in set. Elapsed: 0.001 sec.

:) INSERT INTO arrays_test VALUES ('Hello', [1,2]), ('World', [3,4,5]), ('Goodbye', [])

INSERT INTO arrays_test VALUES

Ok.

3 rows in set. Elapsed: 0.001 sec.

:) SELECT * FROM arrays_test

SELECT *
FROM arrays_test

┌─s───────┬─arr─────┐
│ Hello   │ [1,2]   │
│ World   │ [3,4,5] │
│ Goodbye │ []      │
└─────────┴─────────┘

3 rows in set. Elapsed: 0.001 sec.

:) SELECT s, arr FROM arrays_test ARRAY JOIN arr

SELECT s, arr
FROM arrays_test
ARRAY JOIN arr

┌─s─────┬─arr─┐
│ Hello │   1 │
│ Hello │   2 │
│ World │   3 │
│ World │   4 │
│ World │   5 │
└───────┴─────┘

5 rows in set. Elapsed: 0.001 sec.

可以在数组连接子句中指定一个别名。在这种情况下，可以通过这个别名访问数组项

:) SELECT s, arr, a FROM arrays_test ARRAY JOIN arr AS a

SELECT s, arr, a
FROM arrays_test
ARRAY JOIN arr AS a

┌─s─────┬─arr─────┬─a─┐
│ Hello │ [1,2]   │ 1 │
│ Hello │ [1,2]   │ 2 │
│ World │ [3,4,5] │ 3 │
│ World │ [3,4,5] │ 4 │
│ World │ [3,4,5] │ 5 │
└───────┴─────────┴───┘

5 rows in set. Elapsed: 0.001 sec.

相同大小的多个数组可以在数组连接子句中进行逗号分隔。在这种情况下，连接是同时执行的

:) SELECT s, arr, a, num, mapped FROM arrays_test ARRAY JOIN arr AS a, arrayEnumerate(arr) AS num, arrayMap(x -> x + 1, arr) AS mapped

SELECT s, arr, a, num, mapped
FROM arrays_test
ARRAY JOIN arr AS a, arrayEnumerate(arr) AS num, arrayMap(lambda(tuple(x), plus(x, 1)), arr) AS mapped

┌─s─────┬─arr─────┬─a─┬─num─┬─mapped─┐
│ Hello │ [1,2]   │ 1 │   1 │      2 │
│ Hello │ [1,2]   │ 2 │   2 │      3 │
│ World │ [3,4,5] │ 3 │   1 │      4 │
│ World │ [3,4,5] │ 4 │   2 │      5 │
│ World │ [3,4,5] │ 5 │   3 │      6 │
└───────┴─────────┴───┴─────┴────────┘

5 rows in set. Elapsed: 0.002 sec.

:) SELECT s, arr, a, num, arrayEnumerate(arr) FROM arrays_test ARRAY JOIN arr AS a, arrayEnumerate(arr) AS num

SELECT s, arr, a, num, arrayEnumerate(arr)
FROM arrays_test
ARRAY JOIN arr AS a, arrayEnumerate(arr) AS num

┌─s─────┬─arr─────┬─a─┬─num─┬─arrayEnumerate(arr)─┐
│ Hello │ [1,2]   │ 1 │   1 │ [1,2]               │
│ Hello │ [1,2]   │ 2 │   2 │ [1,2]               │
│ World │ [3,4,5] │ 3 │   1 │ [1,2,3]             │
│ World │ [3,4,5] │ 4 │   2 │ [1,2,3]             │
│ World │ [3,4,5] │ 5 │   3 │ [1,2,3]             │
└───────┴─────────┴───┴─────┴─────────────────────┘

5 rows in set. Elapsed: 0.002 sec.

数组连接也可以使用嵌套的数据结构

:) CREATE TABLE nested_test (s String, nest Nested(x UInt8, y UInt32)) ENGINE = Memory

CREATE TABLE nested_test
(
    s String,
    nest Nested(
    x UInt8,
    y UInt32)
) ENGINE = Memory

Ok.

0 rows in set. Elapsed: 0.006 sec.

:) INSERT INTO nested_test VALUES ('Hello', [1,2], [10,20]), ('World', [3,4,5], [30,40,50]), ('Goodbye', [], [])

INSERT INTO nested_test VALUES

Ok.

3 rows in set. Elapsed: 0.001 sec.

:) SELECT * FROM nested_test

SELECT *
FROM nested_test

┌─s───────┬─nest.x──┬─nest.y─────┐
│ Hello   │ [1,2]   │ [10,20]    │
│ World   │ [3,4,5] │ [30,40,50] │
│ Goodbye │ []      │ []         │
└─────────┴─────────┴────────────┘

3 rows in set. Elapsed: 0.001 sec.

:) SELECT s, nest.x, nest.y FROM nested_test ARRAY JOIN nest

SELECT s, `nest.x`, `nest.y`
FROM nested_test
ARRAY JOIN nest

┌─s─────┬─nest.x─┬─nest.y─┐
│ Hello │      1 │     10 │
│ Hello │      2 │     20 │
│ World │      3 │     30 │
│ World │      4 │     40 │
│ World │      5 │     50 │
└───────┴────────┴────────┘

5 rows in set. Elapsed: 0.001 sec.

当在数组连接中指定嵌套数据结构的名称时，其含义与数组连接的含义相同，它包含了所有数组元素。

如下SQL与上面结果相同：

:) SELECT s, nest.x, nest.y FROM nested_test ARRAY JOIN nest.x, nest.y

SELECT s, `nest.x`, `nest.y`
FROM nested_test
ARRAY JOIN `nest.x`, `nest.y`

┌─s─────┬─nest.x─┬─nest.y─┐
│ Hello │      1 │     10 │
│ Hello │      2 │     20 │
│ World │      3 │     30 │
│ World │      4 │     40 │
│ World │      5 │     50 │
└───────┴────────┴────────┘

5 rows in set. Elapsed: 0.001 sec.

其他示例：

:) SELECT s, nest.x, nest.y FROM nested_test ARRAY JOIN nest.x

SELECT s, `nest.x`, `nest.y`
FROM nested_test
ARRAY JOIN `nest.x`

┌─s─────┬─nest.x─┬─nest.y─────┐
│ Hello │      1 │ [10,20]    │
│ Hello │      2 │ [10,20]    │
│ World │      3 │ [30,40,50] │
│ World │      4 │ [30,40,50] │
│ World │      5 │ [30,40,50] │
└───────┴────────┴────────────┘

5 rows in set. Elapsed: 0.001 sec.

别名依旧可以用于ARRAY：

:) SELECT s, n.x, n.y, nest.x, nest.y FROM nested_test ARRAY JOIN nest AS n

SELECT s, `n.x`, `n.y`, `nest.x`, `nest.y`
FROM nested_test
ARRAY JOIN nest AS n

┌─s─────┬─n.x─┬─n.y─┬─nest.x──┬─nest.y─────┐
│ Hello │   1 │  10 │ [1,2]   │ [10,20]    │
│ Hello │   2 │  20 │ [1,2]   │ [10,20]    │
│ World │   3 │  30 │ [3,4,5] │ [30,40,50] │
│ World │   4 │  40 │ [3,4,5] │ [30,40,50] │
│ World │   5 │  50 │ [3,4,5] │ [30,40,50] │
└───────┴─────┴─────┴─────────┴────────────┘

5 rows in set. Elapsed: 0.001 sec.

使用arrayEnumerate函数：

:) SELECT s, n.x, n.y, nest.x, nest.y, num FROM nested_test ARRAY JOIN nest AS n, arrayEnumerate(nest.x) AS num

SELECT s, `n.x`, `n.y`, `nest.x`, `nest.y`, num
FROM nested_test
ARRAY JOIN nest AS n, arrayEnumerate(`nest.x`) AS num

┌─s─────┬─n.x─┬─n.y─┬─nest.x──┬─nest.y─────┬─num─┐
│ Hello │   1 │  10 │ [1,2]   │ [10,20]    │   1 │
│ Hello │   2 │  20 │ [1,2]   │ [10,20]    │   2 │
│ World │   3 │  30 │ [3,4,5] │ [30,40,50] │   1 │
│ World │   4 │  40 │ [3,4,5] │ [30,40,50] │   2 │
│ World │   5 │  50 │ [3,4,5] │ [30,40,50] │   3 │
└───────┴─────┴─────┴─────────┴────────────┴─────┘

5 rows in set. Elapsed: 0.002 sec.

JOIN

该连接与上面描述的array join 没有关联

[GLOBAL] ANY|ALL INNER|LEFT [OUTER] JOIN (subquery)|table USING columns_list

有几种类型的连接：

INNER or LEFT：同mysql

ANY or ALL：如果指定了ANY，那么只有第一个找到的行被连接，如果指定了ALL，那么所有符合的行都被连接

GLOBAL ... JOIN：全局查询，首先，请求者服务器运行一个子查询来计算正确的表。这个临时表被传递给每个远程服务器，并使用传输的临时数据在它们上运行查询，请谨慎使用GLOBAL ... JOIN

SELECT
    CounterID,
    hits,
    visits
FROM
(
    SELECT
        CounterID,
        count() AS hits
    FROM test.hits
    GROUP BY CounterID
) ANY LEFT JOIN
(
    SELECT
        CounterID,
        sum(Sign) AS visits
    FROM test.visits
    GROUP BY CounterID
) USING CounterID
ORDER BY hits DESC
LIMIT 10

┌─CounterID─┬───hits─┬─visits─┐
│   1143050 │ 523264 │  13665 │
│    731962 │ 475698 │ 102716 │
│    722545 │ 337212 │ 108187 │
│    722889 │ 252197 │  10547 │
│   2237260 │ 196036 │   9522 │
│  23057320 │ 147211 │   7689 │
│    722818 │  90109 │  17847 │
│     48221 │  85379 │   4652 │
│  19762435 │  77807 │   7026 │
│    722884 │  77492 │  11056 │
└───────────┴────────┴────────┘

子查询不允许您设置名称或使用它们来引用特定子查询中的列。在使用中指定的列必须在子查询中具有相同的名称，而其他列必须以不同的方式命名。您可以使用别名来更改子查询中的列的名称

右表（子查询结果）驻留在RAM中。如果没有足够的内存，就不能运行一个连接。

只有一个连接可以在查询中指定（在一个级别上）。要运行多个连接，您可以将它们放入子查询中

在各种类型的连接中，最有效的是任何左连接，然后是任何内部连接。最低效的是所有的左连接和所有内部连接。

如果需要连接维度表（这些表中包含维度属性的相对较小的表，例如用于广告活动的名称），那么连接可能不太方便，因为使用了大量的语法，而且每个查询都需要重新访问正确的表。对于这种情况，有一个“外部字典”特性，您应该使用它而不是连接

WHERE

如果有WHERE子句，它必须包含带有UInt8类型的表达式

PREWHERE

首先，只需要执行预读操作的列。然后读取其他列来运行查询，但是只有那些块才是真值，仅支持引擎为 MergeTree的表

GROUP BY

SELECT
    count(),
    median(FetchTiming > 60 ? 60 : FetchTiming),
    count() - sum(Refresh)
FROM hits

与MySQL不同（并且符合标准SQL），您不能获得某些不在键或聚合函数中的列的值（除非是常量表达式）。为了解决这个问题，您可以使用“any”聚合函数（获得第一个碰见的值）或“最小/最大值”。

SELECT
    domainWithoutWWW(URL) AS domain,
    count(),
    any(Title) AS title -- getting the first occurred page header for each domain.
FROM hits
GROUP BY domain

一个常量不能被指定为聚合函数的参数，你可以消去常数。例如用count()代替sum（1）。

WITH TOTALS modifier

GROUP BY in external memory

您可以将临时数据转储到磁盘，以限制组内的内存使用。通过设置，maxbytes先于外部组通过临时数据对文件系统来确定倾倒组的阈值RAM消耗量。如果设置为0（缺省值），则禁用它。

LIMIT N BY

SELECT
    domainWithoutWWW(URL) AS domain,
    domainWithoutWWW(REFERRER_URL) AS referrer,
    device_type,
    count() cnt
FROM hits
GROUP BY domain, referrer, device_type
ORDER BY cnt DESC
LIMIT 5 BY domain, device_type
LIMIT 100

这个查询将为每个域选择前5个引用器，devicetype对，但是不会超过100行（限制n BY+限制）。

HAVING

类似where字句，如果没有使用聚合，则不能使用它

ORDER BY

默认为ASC升序，外部排序比RAM排序有效

DISTINCT

Distinct与Group by 不同之处：

distinct可以和group by 合用
当Limit被定义并且没有Order by时，在读取了所需数目的不同行之后，查询立即停止运行。
数据块是在处理它们的过程中产生的，而不需要等待整个查询完成运行。

在至少有一个数组存在的情况下，distinct是不被支持的

LIMIT

如果没有一个ORDER BY子句显式地对结果进行排序，那么结果可能是任意的和不确定的

UNION ALL

你可以使用UNION ALL来合并任意数量的查询

SELECT CounterID, 1 AS table, toInt64(count()) AS c
    FROM test.hits
    GROUP BY CounterID

UNION ALL

SELECT CounterID, 2 AS table, sum(Sign) AS c
    FROM test.visits
    GROUP BY CounterID
    HAVING c > 0

只支持UNION ALL 不支持UNION

可能列名有所不同，但最终列名取自第一个查询

INTO OUTFILE

添加到OUTFILE filename子句（其中文件名是一个字符串文字）将查询输出重定向到指定的文件。与MySQL相反，文件是在客户端创建的。如果具有相同文件名的文件已经存在，那么查询将失败。这个功能在命令行客户端和clicklocal本地（通过HTTP接口发送的查询将失败）

默认的输出格式是TAB分离的

FORMAT

指定格式“格式”以获取任何指定格式的数据。您可以将其用于方便，或用于创建转储。要了解更多信息，请参阅“格式”一节。如果省略了格式子句，则使用默认的格式，这取决于用于访问DB的设置和接口。对于HTTP接口和批处理模式下的命令行客户端，默认的格式是制表符。对于交互式模式下的命令行客户端，缺省格式是PrettyCompact（它有吸引和紧凑的表）

IN

操作符的左边要么是一个列，要么是一个元祖

SELECT UserID IN (123, 456) FROM ...
SELECT (CounterID, UserID) IN ((34, 123), (101500, 456)) FROM ...

如果右边是一系列常量并且数量不太多（小于数百万），则会使用索引。如果数量太多，会使用子查询

子查询可以为过滤元组指定多个列

SELECT (CounterID, UserID) IN (SELECT CounterID, UserID FROM ...) FROM ...

左右两边列应该具有相同的类型

查询操作符和子查询可以发生在查询的任何部分，包括聚合函数和lambda函数

SELECT
    EventDate,
    avg(UserID IN
    (
        SELECT UserID
        FROM test.hits
        WHERE EventDate = toDate('2014-03-17')
    )) AS ratio
FROM test.hits
GROUP BY EventDate
ORDER BY EventDate Asc

┌──EventDate─┬────ratio─┐
│ 2014-03-17 │        1 │
│ 2014-03-18 │ 0.807696 │
│ 2014-03-19 │ 0.755406 │
│ 2014-03-20 │ 0.723218 │
│ 2014-03-21 │ 0.697021 │
│ 2014-03-22 │ 0.647851 │
│ 2014-03-23 │ 0.648416 │
└────────────┴──────────┘

Distributed subqueries

分布式子查询

in/join 与GLOBAL in /GLOBAL join 的区别：

当使用in的时候，查询被发送到远程服务器，并且每个服务器都在IN或JOIN子句中运行子查询

如

SELECT uniq(UserID) FROM distributed_table

将会被发送到所有远程服务器

SELECT uniq(UserID) FROM local_table

然后并行运行，直到达到中间结果可以结合的阶段。然后，中间结果将被返回给请求者服务器并在其上合并，最终的结果将被发送到客户端。

两个受众交集的计算：

SELECT uniq(UserID) FROM distributed_table WHERE CounterID = 101500 AND UserID IN (SELECT UserID FROM local_table WHERE CounterID = 34)

这个查询将发送到所有服务器

SELECT uniq(UserID) FROM local_table WHERE CounterID = 101500 AND UserID IN (SELECT UserID FROM local_table WHERE CounterID = 34)

换句话说， In子句中的数据集将在每个服务器上独立地收集，只收集本地储存的数据。

如果您已经准备好了这种情况，并且在集群服务器上分布数据，那么单个UserID的数据完全驻留在一台服务器上，那么这将是正确和最优的。在这种情况下，所有必需的数据将在每个服务器上本地可用。否则，结果将是不准确的。我们将该查询的变体称为“localin”

当数据在集群服务器上随机分布时，为了纠正查询的工作方式，您可以在子查询中指定分布表。这个查询看起来是这样的：

SELECT uniq(UserID) FROM distributed_table WHERE CounterID = 101500 AND UserID IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

这个查询将被发送到所有远程服务器

SELECT uniq(UserID) FROM local_table WHERE CounterID = 101500 AND UserID IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

子查询将开始在每个远程服务器上运行。由于子查询使用分布式表，所以每个远程服务器上的子查询将会对每个远程服务器都感到不满，如果您有一个100个服务器集群，执行整个查询将需要10000个基本请求，这通常被认为是不可接受的。

SELECT UserID FROM local_table WHERE CounterID = 34

在这种情况下，您应该始终使用GLOBAL in 而不是In。让我们看看它是如何在查询中工作的

SELECT uniq(UserID) FROM distributed_table WHERE CounterID = 101500 AND UserID GLOBAL IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

服务器将运行子查询

SELECT UserID FROM distributed_table WHERE CounterID = 34

结果将被放在RAM中的临时表中。然后请求将被发送到每个远程服务器

SELECT uniq(UserID) FROM local_table WHERE CounterID = 101500 AND UserID GLOBAL IN _data1

临时表“data1”将连同查询一起被发送到每个远程服务器（临时表的名称是实现定义的）。

记住以下几点：

在创建临时表时，数据不是惟一的。为了减少通过网络传输的数据量，在子查询中指定不同的数据。在 in 的情况下不用
临时表将被发送到所有远程服务器。传输不考虑网络拓扑。例如，如果10个远程服务器驻留在与请求者服务器相对较远的数据中心中，那么数据将通过通道发送10次到远程数据中心。在使用global in时尽量避免大数据集
在将数据传输到远程服务器时，对网络带宽的限制是不可配置的。你可能会让网络超负荷
尝试跨服务器分发数据，这样您就不需要经常使用global in。
如果您需要经常使用global in，那么就计划一下ClickHouse集群的位置，这样单个副本就可以驻留在一个数据中心中，并且在它们之间建立一个快速网络，这样一个查询就可以在一个数据中心内进行处理了

Extreme values

极值

除了结果之外，您还可以获得结果列的最小值和最大值。要做到这一点，将extremes设置为1。对于数值类型、日期和日期，计算最小值和最大值。对于其他栏目，输出的是默认值

Notes

笔记，说明

group by 和order by 不支持位置参数，比如group by 1,2不是按第一列第二列聚集，而会被解释为常量分组，即所有行聚合为1

你可以在查询的任何部分加上一个*而不是表达式，但只有少部分*是合理的：

创建表转储时
对于仅包含几个列的表，如系统表
为了获取关于表中有哪些列。在这种情况下，设置limit 1，最好使用DESC查询。
当在少量的列上使用强过滤时 prewhere
在子查询中（因为外部查询不需要的列被排除在子查询之外）。

KILL QUERY

KILL QUERY
  WHERE 
  [SYNC|ASYNC|TEST]
  [FORMAT format]

尝试终止当前正在运行的查询。从系统中选择terminate查询

例如：

-- Terminates all queries with the specified query_id.
KILL QUERY WHERE query_id='2-857d-4a57-9ee0-327da5d60a90'

-- Synchronously terminates all queries run by `username`.
KILL QUERY WHERE user='username' SYNC

只读用户只能终止他们自己的请求

你可能感兴趣的:(clickhouse)

全面指南：用户行为从前端数据采集到实时处理的最佳实践数字沉思营销流量运营系统架构前端内容运营大数据
引言在当今的数据驱动世界，实时数据采集和处理已经成为企业做出及时决策的重要手段。本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。无论你是想提升产品体验还是做用户行为分析，这篇文章都将为你提供全面的解决方案。设计一个通用的ClickHouse表来存储用户事件时，需要考虑多种因素，包括事件类型、时间戳、用户信
从底层原理上理解ClickHouse 中的稀疏索引 goTsHgo 大数据分布式 Clickhouse 数据库 clickhouse
稀疏索引（SparseIndexes）是ClickHouse中一个重要的加速查询机制。与传统数据库使用的B-Tree或哈希索引不同，ClickHouse的稀疏索引并不是为每一行数据构建索引，而是为数据存储的块或部分数据生成索引。这种索引的核心思想是通过减少需要扫描的数据范围来加速查询，特别适用于大数据量场景。1.基本概念：数据存储与索引在理解稀疏索引之前，首先需要理解ClickHouse的列式存储
ClickHouse 高性能的列式数据库管理系统小丁学Java ClickHouse clickhouse 数据库
ClickHouse是一个高性能的列式数据库管理系统（DBMS），主要用于在线分析处理查询（OLAP）。以下是对ClickHouse的详细介绍：基本信息：来源：由俄罗斯的Yandex公司于2016年开源。全称：ClickStream,DataWareHouse，简称ClickHouse。创始人：AaronKatz、AlexeyMilovidov、YuryIzrailevsky。主要特点：高性能：能
对话 ClickHouse 创始人 Alexey：不仅是数据库，所有的数据处理系统都能从 AI 受益 AI科技大本营 clickhouse 数据库人工智能
“Alexey，你希望ClickHouse的未来怎么发展？”我希望ClickHouse成为最流行的开源分析数据库，从此任何人考虑分析数据库的时候，脑海里第一个也是显而易见的选择就是ClickHouse。顺便说一句，我们其实已经是最流行的开源分析数据库了，所以我想让这个现状保持下去，以便更多的人能知道这一点。作者|王启隆出品|《新程序员》编辑部当今的分析型数据库领域，ClickHouse是最闪亮的名
clickhouse-v24.1-离线部署 Wonderful呀数据库 clickhouse 数据库运维 linux
部署版本数据库版本：24.1.1.2048jdk版本：jdk84个文件（三个ck的包）：OpenJDK8U-jdk_x64_linux_hotspot_8u382b05.tarclickhouse-client-24.1.1.2048.x86_64.rpmclickhouse-common-static-24.1.1.2048.x86_64.rpmclickhouse-server-24.1.1.
starrocks和clickhouse数据库比较 CodeMaster_37714848 clickhouse 数据库
Starrocks和ClickHouse都是用于数据分析的数据库，但它们的设计理念和用途有所不同。下面是这两者的一些主要比较点：1.基础架构与设计目标Starrocks:Starrocks是一个专注于实时数据分析的平台，常用于大数据处理和商业智能应用。它设计用于高效处理大规模数据集，并且支持复杂查询和数据处理。支持多种数据源的集成，并且可以与其他大数据技术（如Hadoop、Spark）协同工作。C
clickhouse对比两台机器数据微亮之海 clickhouse
selectconcat(database,'.',name),total_rowsfromsystem.tableswhereengine='MergeTree'anddatabase!='system'andtotal_rows!=0orderbydatabase,name;两台机器分别跑，导出数据后对比
ClickHouse与其他数据库的对比九州Pro ClickHouse 数据库 clickhouse 数据仓库大数据 sql
目录1与传统关系型数据库的对比1.1性能差异1.2数据模型差异1.3适用场景差异2与其他列式存储数据库的对比2.1ApacheCassandra2.2HBase3与分布式数据库的对比3.1GoogleBigQuery3.2AmazonRedshift3.3Snowflake4ClickHouse的缺点5ClickHouse的其他优点1与传统关系型数据库的对比1.1性能差异ClickHouse是一种
Hbase、hive以及ClickHouse的介绍和区别？ damokelisijian866 hbase hive clickhouse
一、Hbase介绍：HBase是一个分布式的、面向列的开源数据库，由ApacheSoftwareFoundation开发，是Hadoop生态系统中的一个重要组件。HBase的设计灵感来源于Google的Bigtable论文，它通过提供类似于Bigtable的能力，在Hadoop之上构建了一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase主要用于存储大量结构化数据，并支持随机读写访问，
ClickHouse 分布式部署、分布式表创建及数据迁移指南努力做一名技术 clickhouse 分布式
文章目录部署ClickHouse集群1.1环境准备1.2安装ClickHouse1.3配置集群创建分布式表2.1创建本地表2.2创建分布式表2.3删除分布式表测试分布式表3.1插入测试数据。配置和管理4.1配置监控4.2数据备份数据迁移5.1导出5.2导入部署ClickHouse集群QuantumInsights的部署将基于一个高可用的分布式ClickHouse集群，以实现对大规模数据的高效处理和
ClickHouse实战处理（一）：MergeTree系列引擎 sheep8521 clickhouse 数据库大数据
MergeTree作为家族系列最基础的表引擎，主要有以下特点：存储的数据按照主键排序：创建稀疏索引加快数据查询速度。支持数据分区，可以通过PARTITIONBY语句指定分区字段。支持数据副本。支持数据采样。总之适用于高负载任务的最通用和功能最强大的表引擎。可以快速插入数据并进行后续的后台数据处理。支持数据复制（使用Replicated*的引擎版本）、分区和其他引擎不支持的特性MergeTree系列
ClickHouse 二进制特征值怎么转化为字符串树下水月 clickhouse
要将二进制特征值转化为字符串，可以使用以下方法：1.使用base64编码base64是一种将二进制数据编码为ASCII字符串的方法。在ClickHouse中，可以使用函数base64Encode()来将二进制特征值转化为base64编码的字符串。例如：SELECTbase64Encode(feature)FROMmy_table;2.使用hex编码hex是一种将二进制数据转化为十六进制字符串的方法
ClickHouse安装与使用指南富艾霏
ClickHouse安装与使用指南clickhouseNodeJSclientforClickHouse项目地址:https://gitcode.com/gh_mirrors/clic/clickhouse项目介绍ClickHouse是由Yandex开发的一个用于在线分析处理(OLAP)的列式数据库管理系统(DBMS)。此开源项目位于https://github.com/TimonKK/click
【开端】clickhouse入门使用奋力向前123 数据库 clickhouse
一、绪论这两天使用clickhouse进行数据分析，在使用上和mysql等关系型数据库还是有区别的，在SQL语法上也有差别，所以这里总结一下使用。二、clickhouse入门使用ClickHouse介绍ClickHouse是俄罗斯的Yandex公司于2016年开源的列式存储数据库（DBMS），它使用C++语言编写，主要面向在线分析处理查询（OLAP），能够使用SQL查询实时生成分析数据报告。Cli
APO选择ClickHouse存储Trace的考量云观秋毫 apo clickhouse
OpenTelemetry生态已经很成熟，但对用户而言，选择OpenTelemetry仍然需要考虑以下几个问题：探针的成熟度海量Trace数据的存储和展示的问题本文重点讨论海量Trace数据的存储与展示问题，APO定位是一个OpenTelmetry的发行版，本文将重点讨论APO团队是如何考虑这个问题的。现有OpenTelemetry的Trace存储方案OpenTelemetry生态过于灵活，选择众
clickhouse安装教程 123 黑曼巴大数据
官网地址安装教程https://clickhouse.com/learn/lessons/gettingstarted/#1-installing-clickhouse
Clickhouse篇之数据的备份与恢复听说唐僧不吃肉 Clickhouse clickhouse 数据库
Clickhouse数据的备份与恢复要备份ClickHouse数据库中的数据表，你可以使用ClickHouse提供的BACKUP和RESTORE功能，或者通过手动备份文件系统中的数据目录来实现。以下是两种常用的方法：方法一：使用BACKUP和RESTORE功能从ClickHouse21.8版本开始，支持BACKUP和RESTORE命令。以下是备份和恢复的步骤：1.备份数据库备份整个数据库BACKU
click house学习路线——开篇 Fred3D Click house 数据库
clickhouse学习路线官方文档前提:最近要计算数据指标,开始使用olap列示存储的数据库,对clickhouse的使用进行了系统学习推荐阅读的书官方文档地址ClickHouse原理解析与应用实践(朱凯)占位后续更新…
Clickhouse 集群部署安装想当厨子的小章同学 Clickhouse linux 服务器运维
ClickHouse集群部署安装1、环境准备（1）、阿里云服务器两台集群节点信息192.168.5.13ch01192.168.5.14ch02（2）、修改/etc/cloud/cloud.cfg(所有节点)[root@iZbp1fsk0p3opmtlo52u91Z~]#vim/etc/cloud/cloud.cfg注释掉#manage_etc_hosts:localhost（3）、文件打开数调整
clickhouse集群部署林鸟鸟 clickhouse clickhouse 服务器
单节点设置为了延迟演示分布式环境的复杂性，我们将首先在单个服务器或虚拟机上部署ClickHouse。ClickHouse通常是从deb或rpm包安装，但对于不支持它们的操作系统也有其他方法。例如，您选择deb安装包，执行:sudoapt-getinstall-yapt-transport-httpsca-certificatesdirmngrsudoapt-keyadv--keyserverhkp
clickhouse-neighbor 坑爹的排序 [email protected] clickhouse
对于排序规则明显的数据集，使用neighbor来做分析，是一个非常强大的函数，能完成很多复杂的计算，例如高速公路分析车辆流量。高速公路截面流量一般是通过路面上的门架采集设备采集通行卡的信息和识别牌照组成，在路面行驶的车辆，受天气、车辆密集度、电子卡片、采集设备等因素影响，也不能100%准确采集到通行数据，如果仅仅以单一采集点来分析流量，准确度必然打折扣。不过，任何方法都不能说完全准确分析出数据，肯
【离线安装clickhouse集群】 eddianliu bigdata clickhouse centos
离线安装clickhouse集群clickhouse介绍Clickhouse是俄罗斯yandex公司于2016年开源的一个列式数据库管理系统，在OLAP领域像一匹黑马一样，以其超高的性能受到业界的青睐。特性：基于shard+replica实现的线性扩展和高可靠采用列式存储，数据类型一致，压缩性能更高硬件利用率高，连续IO，提高了磁盘驱动器的效率向量化引擎与SIMD提高了CPU利用率，多核多节点并行
clickhouse集群搭建颍天 clickhouse 数据库
文章目录安装clickhouse修改集群配置文件启动clickhouse集群测试集群的可用性安装clickhouse本次用了4台服务器搭建clickhouse集群，使用rpm安装方式在4台服务器上安装clickhouse，步骤如下：sudoyuminstall-ycurlcurl-shttps://packagecloud.io/install/repositories/altinity/clic
k8s上的clickhouse集群部署并创建分布式表（附详细参数说明和参考链接） KirutoCode 开发技能
k8s上的clickhouse集群部署并创建分布式表制作docker镜像创建configmap创建clickhouseservicepod创建clickhouseclientpod创建Service创建分布式表部署总体参考：https://blog.csdn.net/tototuzuoquan/article/details/111305125clickhouse的配置文件相关解读：https:/
Clickhouse和MySQL的区别以及适用业务场景听说唐僧不吃肉 Clickhouse MySQL clickhouse mysql 数据库
Clickhouse和MySQL的区别ClickHouse和MySQL是两种不同类型的数据库管理系统，它们在设计理念、数据处理方式和应用场景上有着明显的区别。区别和特点1.设计目标ClickHouseClickHouse是一种面向分析的列式存储数据库，旨在处理大规模数据的高性能查询和实时分析。它专注于快速的数据插入和复杂的分析查询。MySQLMySQL是一种传统的关系型数据库管理系统(RDBMS)
从零到一建设数据中台 - 关键技术汇总我码玄黄数据中台数据挖掘数据分析大数据
一、数据中台关键技术汇总语言框架：Java、Maven、SpringBoot数据分布式采集：Flume、Sqoop、kettle数据分布式存储：HadoopHDFS离线批处理计算：MapReduce、Spark、Flink实时流式计算：Storm/SparkStreaming、Flink批处理消息队列：Kafka查询分析：Hbase、Hive、ClickHouse、Presto搜索引擎：Elast
clickhouse自定义函数的困惑 [email protected] clickhouse
近期遇到一个困惑的问题，自定义函数中，如果出现查询语句，则传递的参数，不能传递字段名，只能传递常量或者表达式，文档中也没有找到对应的解决办法。需求其实比较简单，查询的时候，要做一个“少数服从多数”的决定，在一行记录中，存在多个字段值是String类型，使用哪个字段值，取决于字段内容出现的频率次数最高的字符串，注意，这里是一行记录，可以理解成，一个数组字段类型，常规想法就是selectgroupby
【Hadoop】使用Scala与Spark连接ClickHouse进行数据处理音乐学家方大刚 Scala Hadoop hadoop scala spark
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域，ApacheSpark是一个广泛使用的高性能、通用的计算框架，而ClickHouse作为一个高性能的列式数据库，特别适合在线分析处理（OLAP）。结合Scala语
ClickHouse副本节点数据损坏恢复旺仔_牛奶 ClickHouse clickhouse 数据库 java
参考链接：https://blog.csdn.net/qq_42082701/article/details/127771766参考链接：https://kb.altinity.com/altinity-kb-setup-and-maintenance/suspiciously-many-broken-parts/#背景CK配置为1分片2副本#配置参数,这里我们将max_suspicious_br
ClickHouse存储引擎之ReplacingMergeTree引擎小枫@码大数据运维 clickhouse
一、ReplacingMergeTree作用ClickHouse中最常用也是最基础的表引擎为MergeTree，在它的功能上添加特定功能就构成了MergeTree系列引擎。MergeTree支持主键，但主键主要用来缩小查询范围，且不具备唯一性约束，可以正常写入相同主键的数据。但在一些情况下，可能需要表中没有主键重复的数据。ReplacingMergeTree就是在MergeTree的基础上加入了去
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

clickhouse SQL查询语句 【译自Github 英文文档】