Fan_-_

ClickHouse查询分布式表LEFT JOIN改RIGHT JOIN的大坑

由一个慢查询衍生出的问题

我们线上有一个ClickHouse集群, 总共6个服务器, 配置均为16C 64G SSD, 集群配置为三分片两副本

有两个表这里称为small_table和big_table. 都是ReplicatedMergeTree引擎(三个分片两个副本).

small_table有79w数据, big_table有5亿数据(数据在之后的示例中没有任何变化), 在下文中small_table和big_table都为分布式表, 可以获取全量数据, small_table_local和big_table_local为各节点上的本地表名称

SELECT 
    table, 
    formatReadableSize(sum(data_compressed_bytes)) AS tc, 
    formatReadableSize(sum(data_uncompressed_bytes)) AS tu, 
    sum(data_compressed_bytes) / sum(data_uncompressed_bytes) AS ratio
FROM system.columns
WHERE (database = currentDatabase()) AND (table IN ('small_table_local', 'big_table_local'))
GROUP BY table
ORDER BY table ASC

┌─table─────────────────────────┬─tc────────┬─tu────────┬──────────────ratio─┐
│ small_table_local             │ 12.87 MiB │ 14.91 MiB │ 0.8633041477100831 │
│ big_table_local               │ 15.46 GiB │ 57.31 GiB │ 0.2697742507036428 │
└───────────────────────────────┴───────────┴───────────┴────────────────────┘

SELECT count(*)
FROM small_table

┌─count()─┐
│  794469 │
└─────────┘


SELECT count(*)
FROM big_table

┌───count()─┐
│ 519898780 │
└───────────┘

有如下查询

SELECT a.UID,B.UID from dwh.small_table a LEFT JOIN dwh.big_table b on a.UID = b.UID

这个查询在ClickHouse中要跑近300秒

#time clickhouse-client --time --progress --query="
SELECT 
    a.UID, B.UID
FROM
    dwh.small_table a
        LEFT JOIN
    dwh.big_table b ON a.UID = b.UID
" > /dev/null
293.769

real    4m53.798s
user    0m0.574s
sys     0m0.225s

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KUfGWdcJ-1598656246445)(https://raw.githubusercontent.com/Fanduzi/Figure_bed/master/img/%E6%9F%A5%E8%AF%A2%E5%8D%A0%E7%94%A8%E5%86%85%E5%AD%98.png)]

而在TIDB只需要20秒(节点数和配置比CH略好, 数据略多于CH, 未使用TIFlash)

# time mysql -uroot -hxx.xx.xx -P4000 -p dwh -e "
SELECT 
    a.UID, B.UID
FROM
    dwh.small_table a
        LEFT JOIN
    dwh.big_table b ON a.UID = b.UID;
" > /dev/null
Enter password:

real    0m20.955s
user    0m11.292s
sys     0m2.321s

本人接触ClickHouse不久, 没什么实战经验, 看到这结果就感觉肯定是自己使用姿势不对

JOIN操作时一定要把数据量小的表放在右边

一通百度Google, 看到一篇来自携程的文章每天十亿级数据更新，秒出查询结果，ClickHouse在携程酒店的应用, 其中有一段话:

JOIN操作时一定要把数据量小的表放在右边，ClickHouse中无论是Left Join 、Right Join还是Inner Join永远都是拿着右表中的每一条记录到左表中查找该记录是否存在，所以右表必须是小表。

有点神奇…

我们知道在常见的关系型数据库如Oralce、MySQL中, LEFT JOIN和RIGTH JOIN是可以等价改写的, 那么我改成RIGHT JOIN不就"把小表放在右边"了吗, 于是SQL改写为

SELECT a.UID,B.UID from dwh.big_table b RIGHT JOIN dwh.small_table a on a.UID = b.UID

实测

#time clickhouse-client --time --progress --query="
SELECT 
    a.UID, B.UID
FROM
    dwh.big_table b
        RIGHT JOIN
    dwh.small_table a ON a.UID = b.UIDT
" > /dev/null
19.588

real    0m19.609s
user    0m0.742s
sys     0m0.293s

没想到还真好使… 难道CH优化器这么弱?

谨慎起见, 我比对了一下结果, 简单count一下吧

LEFT JOIN

#time clickhouse-client --time --progress --query="
SELECT 
    COUNT(*)
FROM
    dwh.small_table a
        LEFT JOIN
    dwh.big_table b ON a.UID = b.UID
"
6042735 --count
917.560 --时间

real    15m17.580s
user    0m0.253s
sys     0m0.489s

RIGHT JOIN

#time clickhouse-client --time --progress --query="
SELECT 
    COUNT(*)
FROM
    dwh.big_table b
        RIGHT JOIN
    dwh.small_table a ON a.UID = b.UID
"
6897617 --count
11.655 --时间

real    0m11.675s
user    0m0.014s
sys     0m0.017s

RIGHT JOIN数据不对啊

ClickHouse分布式表A LEFT JOIN B != B RIGHT JOIN A

创建测试表

ch-node-05 default@localhost:9000 [dwh]
:) show create table t1;

SHOW CREATE TABLE t1

┌─statement─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ CREATE TABLE dwh.t1 (`I_ID` String, `CTIME` DateTime) ENGINE = Distributed('ch_cluster_all', 'dwh', 't1_local', rand()) │
└───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

1 rows in set. Elapsed: 0.001 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) show create table t2;

SHOW CREATE TABLE t2

┌─statement─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ CREATE TABLE dwh.t2 (`I_ID` String, `CTIME` DateTime) ENGINE = Distributed('ch_cluster_all', 'dwh', 't2_local', rand()) │
└───────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

1 rows in set. Elapsed: 0.001 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) show create table t1_local;

SHOW CREATE TABLE t1_local

┌─statement──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ CREATE TABLE dwh.t1_local (`I_ID` String, `CTIME` DateTime) ENGINE = ReplicatedReplacingMergeTree('/clickhouse/dwh/tables/{layer}-{shard}/t1', '{replica}') PARTITION BY toDate(CTIME) ORDER BY I_ID SETTINGS index_granularity = 8192 │
└────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

1 rows in set. Elapsed: 0.001 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) show create table t2_local;

SHOW CREATE TABLE t2_local

┌─statement──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ CREATE TABLE dwh.t2_local (`I_ID` String, `CTIME` DateTime) ENGINE = ReplicatedReplacingMergeTree('/clickhouse/dwh/tables/{layer}-{shard}/t2', '{replica}') PARTITION BY toDate(CTIME) ORDER BY I_ID SETTINGS index_granularity = 8192 │
└────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

1 rows in set. Elapsed: 0.001 sec.

数据

ch-node-05 default@localhost:9000 [dwh]
:) select * from t1;

SELECT *
FROM t1

┌─I_ID─┬───────────────CTIME─┐
│ 1    │ 2020-08-27 15:24:05 │
│ 2    │ 2020-08-27 15:24:50 │
│ 8    │ 2020-08-27 15:24:50 │
└──────┴─────────────────────┘
┌─I_ID─┬───────────────CTIME─┐
│ 3    │ 2020-08-27 15:24:50 │
│ 5    │ 2020-08-27 15:24:50 │
│ 9    │ 2020-08-27 15:24:50 │
└──────┴─────────────────────┘
┌─I_ID─┬───────────────CTIME─┐
│ 10   │ 2020-08-27 15:24:50 │
│ 3    │ 2020-08-27 15:24:50 │
│ 6    │ 2020-08-27 15:24:50 │
│ 7    │ 2020-08-27 15:24:50 │
└──────┴─────────────────────┘

10 rows in set. Elapsed: 0.003 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) select * from t2;

SELECT *
FROM t2

┌─I_ID─┬───────────────CTIME─┐
│ 1    │ 2020-08-27 15:25:14 │
└──────┴─────────────────────┘
┌─I_ID─┬───────────────CTIME─┐
│ 2    │ 2020-08-27 15:25:33 │
│ 5    │ 2020-08-27 15:25:33 │
└──────┴─────────────────────┘
┌─I_ID─┬───────────────CTIME─┐
│ 3    │ 2020-08-27 15:25:33 │
│ 3    │ 2020-08-27 15:25:33 │
└──────┴─────────────────────┘

5 rows in set. Elapsed: 0.003 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) SELECT 
:-]     _shard_num, 
:-]     count(*)
:-] FROM 
:-] (
:-]     SELECT 
:-]         _shard_num, 
:-]         a.*
:-]     FROM dwh.t1 AS a
:-] )
:-] GROUP BY _shard_num
:-]     WITH ROLLUP;

SELECT 
    _shard_num, 
    count(*)
FROM 
(
    SELECT 
        _shard_num, 
        a.*
    FROM dwh.t1 AS a
)
GROUP BY _shard_num
    WITH ROLLUP

┌─_shard_num─┬─count()─┐
│          3 │       3 │
│          2 │       3 │
│          1 │       4 │
└────────────┴─────────┘
┌─_shard_num─┬─count()─┐
│          0 │      10 │
└────────────┴─────────┘

4 rows in set. Elapsed: 0.004 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) SELECT 
:-]     _shard_num, 
:-]     count(*)
:-] FROM 
:-] (
:-]     SELECT 
:-]         _shard_num, 
:-]         a.*
:-]     FROM dwh.t2 AS a
:-] )
:-] GROUP BY _shard_num
:-]     WITH ROLLUP;

SELECT 
    _shard_num, 
    count(*)
FROM 
(
    SELECT 
        _shard_num, 
        a.*
    FROM dwh.t2 AS a
)
GROUP BY _shard_num
    WITH ROLLUP

┌─_shard_num─┬─count()─┐
│          3 │       2 │
│          2 │       1 │
│          1 │       2 │
└────────────┴─────────┘
┌─_shard_num─┬─count()─┐
│          0 │       5 │
└────────────┴─────────┘

4 rows in set. Elapsed: 0.005 sec.

测试LEFT JOIN RIGHT JOIN

ch-node-05 default@localhost:9000 [dwh]
:) SELECT 
:-]     a.I_ID, 
:-]     b.I_ID
:-] FROM dwh.t2 AS a
:-] LEFT JOIN dwh.t1 AS b ON a.I_ID = b.I_ID
:-] ORDER BY a.I_ID ASC;

SELECT 
    a.I_ID, 
    b.I_ID
FROM dwh.t2 AS a
LEFT JOIN dwh.t1 AS b ON a.I_ID = b.I_ID
ORDER BY a.I_ID ASC

┌─I_ID─┬─b.I_ID─┐
│ 1    │ 1      │
└──────┴────────┘
┌─I_ID─┬─b.I_ID─┐
│ 2    │ 2      │
│ 3    │ 3      │
│ 3    │ 3      │
│ 3    │ 3      │
│ 3    │ 3      │
└──────┴────────┘
┌─I_ID─┬─b.I_ID─┐
│ 5    │ 5      │
└──────┴────────┘

7 rows in set. Elapsed: 0.006 sec. 

ch-node-05 default@localhost:9000 [dwh]
:) SELECT 
:-]     a.I_ID, 
:-]     b.I_ID
:-] FROM dwh.t1 AS b
:-] RIGHT JOIN dwh.t2 AS a ON a.I_ID = b.I_ID
:-] ORDER BY a.I_ID ASC;

SELECT 
    a.I_ID, 
    b.I_ID
FROM dwh.t1 AS b
RIGHT JOIN dwh.t2 AS a ON a.I_ID = b.I_ID
ORDER BY toUInt32(a.I_ID) ASC

┌─a.I_ID─┬─I_ID─┐
│ 1      │      │
│ 1      │ 1    │
│ 1      │      │
│ 2      │      │
│ 2      │ 2    │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 2      │      │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 3      │ 3    │
│ 3      │ 3    │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 3      │      │
│ 3      │      │
│ 3      │ 3    │
│ 3      │ 3    │
│ 5      │      │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 5      │      │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 5      │ 5    │
└────────┴──────┘

可以看到RIGHT JOIN返回了一些错误的数据

难道想要对于这个SQL, 就不能用分布式表了吗? 如果我想用RIGHT JOIN就只能用单机? 说好的水平扩展呢?

那看一下单机查询速度吧…

为此我在一个CH节点创建两个表small_table_total和big_table_toal 他们都不是分布式表, 都拥有全量数据

SELECT count(*)
FROM `big_table_toal`

┌───count()─┐
│ 519898780 │
└───────────┘

1 rows in set. Elapsed: 0.001 sec. 


SELECT count(*)
FROM `small_table_total`

┌─count()─┐
│  794469 │
└─────────┘

分布式表只能和分布式表关联, 分布式表无法和本地表关联

#clickhouse-client --time --progress --query="SELECT count(*) from dwh.big_table b RIGHT JOIN dwh.small_table_total a on a.UID = b.UID"      
→ Progress: 0.00 rows, 0.00 B (0.00 rows/s., 0.00 B/s.) Received exception from server (version 20.3.5):
Code: 60. DB::Exception: Received from localhost:9000. DB::Exception: Received from bj2-ch-node-04:9000. DB::Exception: Table dwh.small_table_total doesn't exist.. 
0.107

测试查询速度

#clickhouse-client --time --progress --query="
SELECT 
    COUNT(*)
FROM
    dwh.big_table_total b
        RIGHT JOIN
    dwh.small_table_total a ON a.UID = b.UID
"
6042735 --count
7.262  --用时

好家伙, 数据准确, 而且比分片了还快

难道只能用本地表?

分布式表要想RIGHT JOIN返回正确结果, 只能改写SQL

原始语句

SELECT 
    a.UID, b.UID
FROM
    dwh.small_table a
        LEFT JOIN
    dwh.big_table b ON a.UID = b.UID

改写为INNER JOIN, 但是没有改表顺序(性能差)

SELECT 
    a.id, b.uid
FROM
    dwh.small_table a
        GLOBAL INNER JOIN
    dwh.big_table b ON a.UID = b.UID 
UNION ALL SELECT 
    a.UID, NULL
FROM
    dwh.small_table a
WHERE
    a.UID GLOBAL NOT IN (SELECT 
            UID
        FROM
            dwh.big_table)

这里我还没理解为什么要用GLOBAL JOIN

在我的例子中 ,这个语句根本跑不成功, GLOBAL太耗费内存了

SELECT 
    a.UID, 
    b.UID
FROM dwh.small_table AS a
GLOBAL INNER JOIN dwh.big_table AS b ON a.UID = b.UID
UNION ALL
SELECT 
    a.UID, 
    NULL
FROM dwh.small_table AS a
WHERE a.UID GLOBAL NOT IN 
(
    SELECT UID
    FROM dwh.big_table
)

↑ Progress: 220.53 million rows, 29.82 GB (51.24 million rows/s., 6.93 GB/s.) ████████████████████████████████████▋                                                                                                                                          20%Received exception from server (version 20.3.5):
Code: 241. DB::Exception: Received from localhost:9000. DB::Exception: Memory limit (for query) exceeded: would use 50.00 GiB (attempt to allocate chunk of 4249200 bytes), maximum: 50.00 GiB: (while reading column CH_BILL_USER_TELEPHONE): (while reading from part /data/clickhouse/ch_9000/data/dwh/big_table_local/201910_0_5_1/ from mark 216 with max_rows_to_read = 8192): 
Code: 241, e.displayText() = DB::Exception: Memory limit (for query) exceeded: would use 50.00 GiB (attempt to allocate chunk of 4227680 bytes), maximum: 50.00 GiB: (while reading column CH_XXX_NAME): (while reading from part /data/clickhouse/ch_9000/data/dwh/big_table_local/202001_6_11_1/ from mark 240 with max_rows_to_read = 8192) (version 20.3.5.21 (official build)): 
Code: 241, e.displayText() = DB::Exception: Memory limit (for query) exceeded: would use 50.00 GiB (attempt to allocate chunk of 5211280 bytes), maximum: 50.00 GiB: (avg_value_size_hint = 66, avg_chars_size = 69.6, limit = 8192): (while reading column CH_BROKER_NAME): (while reading from part /data/clickhouse/ch_9000/data/dwh/big_table_local/202007_6_11_1/ from mark 24 with max_rows_to_read = 8192) (version 20.3.5.21 (official build)): 
Code: 241, e.displayText() = DB::Exception: Memory limit (for query) exceeded: would use 50.00 GiB (attempt to allocate chunk of 4572064 bytes), maximum: 50.00 GiB: (avg_value_size_hint = 66.00048828125, avg_chars_size = 69.6005859375, limit = 8192): (while reading column CH_XX_NAME): (while reading from part /data/clickhouse/ch_9000/data/dwh/big_table_local/201805_2_2_0/ from mark 24 with max_rows_to_read = 8192) (version 20.3.5.21 (official build)): While executing CreatingSetsTransform. 

0 rows in set. Elapsed: 4.404 sec. Processed 220.53 million rows, 29.82 GB (50.07 million rows/s., 6.77 GB/s.)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yRfwYkgo-1598656246449)(https://raw.githubusercontent.com/Fanduzi/Figure_bed/master/img/GLOBAL_JOIN_memory.png)]

如果去掉GLOBAL JOIN, 也不行(GLOBAL IN不能去)

SELECT 
    a.UID, 
    b.UID
FROM dwh.small_table AS a
INNER JOIN dwh.big_table AS b ON a.UID = b.UID
UNION ALL
SELECT 
    a.UID, 
    NULL
FROM dwh.small_table AS a
WHERE a.UID GLOBAL NOT IN 
(
    SELECT UID
    FROM dwh.big_table
)

↑ Progress: 1.91 billion rows, 105.59 GB (6.36 million rows/s., 352.30 MB/s.) ██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                90%Received exception from server (version 20.3.5):
Code: 241. DB::Exception: Received from localhost:9000. DB::Exception: Received from clickhouse-node-01:9000. DB::Exception: Memory limit (total) exceeded: would use 50.10 GiB (attempt to allocate chunk of 133829856 bytes), maximum: 50.00 GiB: While executing CreatingSetsTransform. 

0 rows in set. Elapsed: 299.809 sec. Processed 1.91 billion rows, 105.59 GB (6.35 million rows/s., 352.18 MB/s.)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qx71EIoG-1598656246451)(https://raw.githubusercontent.com/Fanduzi/Figure_bed/master/img/JOIN_memory.png)]

改写表顺序, 让小表在"右边"

SELECT a.UID FROM dwh.big_table b
GLOBAL INNER JOIN dwh.small_table a
ON a.UID = b.UID
UNION ALL
SELECT a.UID,null FROM dwh.small_table a
WHERE a.UID GLOBAL NOT IN
(
    SELECT UID FROM dwh.big_table
    WHERE UID GLOBAL IN (SELECT id FROM dwh.small_table)
)

实测

time clickhouse-client --time --progress --query="
SELECT a.UID,b.UID FROM dwh.big_table b
GLOBAL INNER JOIN dwh.small_table a
on a.UID = b.UID
UNION ALL
SELECT a.UID,null FROM dwh.small_table a
WHERE a.UID GLOBAL NOT IN
(
    SELECT UID FROM dwh.big_table
    WHERE UID GLOBAL IN (SELECT UID FROM dwh.small_table)
)" >/dev/null
21.142

real    0m21.164s
user    0m1.133s
sys     0m0.378s

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vIffKb3r-1598656246453)(https://raw.githubusercontent.com/Fanduzi/Figure_bed/master/img/rewrite_sql_memory.png)]

看一下行数对不对

time clickhouse-client --time --progress --query="
SELECT sum(cnt) FROM (
SELECT count(*)  cnt FROM dwh.big_table b
GLOBAL INNER JOIN dwh.small_table a
on a.UID = b.UID
UNION ALL
SELECT count(*) cnt FROM dwh.small_table a
WHERE a.UID GLOBAL NOT IN
(
    SELECT UID FROM dwh.big_table
    WHERE UID GLOBAL IN (SELECT UID FROM dwh.small_table)
))"
6042735 --count
12.525  --用时

real    0m12.545s
user    0m0.018s
sys     0m0.012s

最后一个问题

不知道你们是否注意到了

ClickHouse

SELECT 
    a.I_ID, 
    b.I_ID
FROM dwh.t1 AS b
RIGHT JOIN dwh.t2 AS a ON a.I_ID = b.I_ID
ORDER BY a.I_ID ASC

┌─a.I_ID─┬─I_ID─┐
│ 1      │      │
│ 1      │ 1    │
│ 1      │      │
│ 2      │      │
│ 2      │ 2    │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 2      │      │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 3      │ 3    │
│ 3      │ 3    │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 3      │      │
│ 3      │      │
│ 3      │ 3    │
│ 3      │ 3    │
│ 5      │      │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 5      │      │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 5      │ 5    │
└────────┴──────┘

MySQL(例子无关)

root@localhost 15:15:26 [fanboshi]> select a.id,b.id from t1 a left join t3 b on a.id=b.id; 
+----+------+
| id | id   |
+----+------+
|  1 |    1 |
|  2 |    2 |
|  3 |    3 |
|  4 |    4 |
|  5 | NULL |
|  6 | NULL |
|  7 | NULL |
|  8 | NULL |
|  9 | NULL |
| 11 | NULL |
| 13 | NULL |
| 15 | NULL |
| 17 | NULL |
| 19 | NULL |
| 21 | NULL |
| 23 | NULL |
| 25 | NULL |
| 27 | NULL |
| 29 | NULL |
| 30 | NULL |
| 31 | NULL |
+----+------+
21 rows in set (0.00 sec)

在CH里外链接不想MySQL那样"用null补未匹配的数据"而是用该列数据类型的默认值填充

https://github.com/ClickHouse/ClickHouse/blob/master/src/Core/Settings.h#L189

join_use_nulls可以在语句,用户profile添加

SELECT 
    a.I_ID, 
    b.I_ID
FROM dwh.t1 AS b
RIGHT JOIN dwh.t2 AS a ON a.I_ID = b.I_ID
ORDER BY toUInt32(a.I_ID) ASC
SETTINGS join_use_nulls = 1

┌─a.I_ID─┬─I_ID─┐
│ 1      │ ᴺᵁᴸᴸ │
│ 1      │ 1    │
│ 1      │ ᴺᵁᴸᴸ │
│ 2      │ ᴺᵁᴸᴸ │
│ 2      │ 2    │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 2      │ ᴺᵁᴸᴸ │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 3      │ 3    │
│ 3      │ 3    │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 3      │ ᴺᵁᴸᴸ │
│ 3      │ ᴺᵁᴸᴸ │
│ 3      │ 3    │
│ 3      │ 3    │
│ 5      │ ᴺᵁᴸᴸ │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 5      │ ᴺᵁᴸᴸ │
└────────┴──────┘
┌─a.I_ID─┬─I_ID─┐
│ 5      │ 5    │
└────────┴──────┘

15 rows in set. Elapsed: 0.015 sec.

结论

也算不上啥结论

小表写后面
不要用RIGHT JOIN, 而是按照示例改写SQL

参考资料

我提了issue, 详细原因请看https://github.com/ClickHouse/ClickHouse/issues/14160

总之除了LEFT JOIN 外 For other OUTER JOINs there's no general solution to return expected result yet

你可能感兴趣的:(ClickHouse)

全面指南：用户行为从前端数据采集到实时处理的最佳实践数字沉思营销流量运营系统架构前端内容运营大数据
引言在当今的数据驱动世界，实时数据采集和处理已经成为企业做出及时决策的重要手段。本文将详细介绍如何通过前端JavaScript代码采集用户行为数据、利用API和Kafka进行数据传输、通过Flink实时处理数据的完整流程。无论你是想提升产品体验还是做用户行为分析，这篇文章都将为你提供全面的解决方案。设计一个通用的ClickHouse表来存储用户事件时，需要考虑多种因素，包括事件类型、时间戳、用户信
从底层原理上理解ClickHouse 中的稀疏索引 goTsHgo 大数据分布式 Clickhouse 数据库 clickhouse
稀疏索引（SparseIndexes）是ClickHouse中一个重要的加速查询机制。与传统数据库使用的B-Tree或哈希索引不同，ClickHouse的稀疏索引并不是为每一行数据构建索引，而是为数据存储的块或部分数据生成索引。这种索引的核心思想是通过减少需要扫描的数据范围来加速查询，特别适用于大数据量场景。1.基本概念：数据存储与索引在理解稀疏索引之前，首先需要理解ClickHouse的列式存储
ClickHouse 高性能的列式数据库管理系统小丁学Java ClickHouse clickhouse 数据库
ClickHouse是一个高性能的列式数据库管理系统（DBMS），主要用于在线分析处理查询（OLAP）。以下是对ClickHouse的详细介绍：基本信息：来源：由俄罗斯的Yandex公司于2016年开源。全称：ClickStream,DataWareHouse，简称ClickHouse。创始人：AaronKatz、AlexeyMilovidov、YuryIzrailevsky。主要特点：高性能：能
对话 ClickHouse 创始人 Alexey：不仅是数据库，所有的数据处理系统都能从 AI 受益 AI科技大本营 clickhouse 数据库人工智能
“Alexey，你希望ClickHouse的未来怎么发展？”我希望ClickHouse成为最流行的开源分析数据库，从此任何人考虑分析数据库的时候，脑海里第一个也是显而易见的选择就是ClickHouse。顺便说一句，我们其实已经是最流行的开源分析数据库了，所以我想让这个现状保持下去，以便更多的人能知道这一点。作者|王启隆出品|《新程序员》编辑部当今的分析型数据库领域，ClickHouse是最闪亮的名
clickhouse-v24.1-离线部署 Wonderful呀数据库 clickhouse 数据库运维 linux
部署版本数据库版本：24.1.1.2048jdk版本：jdk84个文件（三个ck的包）：OpenJDK8U-jdk_x64_linux_hotspot_8u382b05.tarclickhouse-client-24.1.1.2048.x86_64.rpmclickhouse-common-static-24.1.1.2048.x86_64.rpmclickhouse-server-24.1.1.
starrocks和clickhouse数据库比较 CodeMaster_37714848 clickhouse 数据库
Starrocks和ClickHouse都是用于数据分析的数据库，但它们的设计理念和用途有所不同。下面是这两者的一些主要比较点：1.基础架构与设计目标Starrocks:Starrocks是一个专注于实时数据分析的平台，常用于大数据处理和商业智能应用。它设计用于高效处理大规模数据集，并且支持复杂查询和数据处理。支持多种数据源的集成，并且可以与其他大数据技术（如Hadoop、Spark）协同工作。C
clickhouse对比两台机器数据微亮之海 clickhouse
selectconcat(database,'.',name),total_rowsfromsystem.tableswhereengine='MergeTree'anddatabase!='system'andtotal_rows!=0orderbydatabase,name;两台机器分别跑，导出数据后对比
ClickHouse与其他数据库的对比九州Pro ClickHouse 数据库 clickhouse 数据仓库大数据 sql
目录1与传统关系型数据库的对比1.1性能差异1.2数据模型差异1.3适用场景差异2与其他列式存储数据库的对比2.1ApacheCassandra2.2HBase3与分布式数据库的对比3.1GoogleBigQuery3.2AmazonRedshift3.3Snowflake4ClickHouse的缺点5ClickHouse的其他优点1与传统关系型数据库的对比1.1性能差异ClickHouse是一种
Hbase、hive以及ClickHouse的介绍和区别？ damokelisijian866 hbase hive clickhouse
一、Hbase介绍：HBase是一个分布式的、面向列的开源数据库，由ApacheSoftwareFoundation开发，是Hadoop生态系统中的一个重要组件。HBase的设计灵感来源于Google的Bigtable论文，它通过提供类似于Bigtable的能力，在Hadoop之上构建了一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase主要用于存储大量结构化数据，并支持随机读写访问，
ClickHouse 分布式部署、分布式表创建及数据迁移指南努力做一名技术 clickhouse 分布式
文章目录部署ClickHouse集群1.1环境准备1.2安装ClickHouse1.3配置集群创建分布式表2.1创建本地表2.2创建分布式表2.3删除分布式表测试分布式表3.1插入测试数据。配置和管理4.1配置监控4.2数据备份数据迁移5.1导出5.2导入部署ClickHouse集群QuantumInsights的部署将基于一个高可用的分布式ClickHouse集群，以实现对大规模数据的高效处理和
ClickHouse实战处理（一）：MergeTree系列引擎 sheep8521 clickhouse 数据库大数据
MergeTree作为家族系列最基础的表引擎，主要有以下特点：存储的数据按照主键排序：创建稀疏索引加快数据查询速度。支持数据分区，可以通过PARTITIONBY语句指定分区字段。支持数据副本。支持数据采样。总之适用于高负载任务的最通用和功能最强大的表引擎。可以快速插入数据并进行后续的后台数据处理。支持数据复制（使用Replicated*的引擎版本）、分区和其他引擎不支持的特性MergeTree系列
ClickHouse 二进制特征值怎么转化为字符串树下水月 clickhouse
要将二进制特征值转化为字符串，可以使用以下方法：1.使用base64编码base64是一种将二进制数据编码为ASCII字符串的方法。在ClickHouse中，可以使用函数base64Encode()来将二进制特征值转化为base64编码的字符串。例如：SELECTbase64Encode(feature)FROMmy_table;2.使用hex编码hex是一种将二进制数据转化为十六进制字符串的方法
ClickHouse安装与使用指南富艾霏
ClickHouse安装与使用指南clickhouseNodeJSclientforClickHouse项目地址:https://gitcode.com/gh_mirrors/clic/clickhouse项目介绍ClickHouse是由Yandex开发的一个用于在线分析处理(OLAP)的列式数据库管理系统(DBMS)。此开源项目位于https://github.com/TimonKK/click
【开端】clickhouse入门使用奋力向前123 数据库 clickhouse
一、绪论这两天使用clickhouse进行数据分析，在使用上和mysql等关系型数据库还是有区别的，在SQL语法上也有差别，所以这里总结一下使用。二、clickhouse入门使用ClickHouse介绍ClickHouse是俄罗斯的Yandex公司于2016年开源的列式存储数据库（DBMS），它使用C++语言编写，主要面向在线分析处理查询（OLAP），能够使用SQL查询实时生成分析数据报告。Cli
APO选择ClickHouse存储Trace的考量云观秋毫 apo clickhouse
OpenTelemetry生态已经很成熟，但对用户而言，选择OpenTelemetry仍然需要考虑以下几个问题：探针的成熟度海量Trace数据的存储和展示的问题本文重点讨论海量Trace数据的存储与展示问题，APO定位是一个OpenTelmetry的发行版，本文将重点讨论APO团队是如何考虑这个问题的。现有OpenTelemetry的Trace存储方案OpenTelemetry生态过于灵活，选择众
clickhouse安装教程 123 黑曼巴大数据
官网地址安装教程https://clickhouse.com/learn/lessons/gettingstarted/#1-installing-clickhouse
Clickhouse篇之数据的备份与恢复听说唐僧不吃肉 Clickhouse clickhouse 数据库
Clickhouse数据的备份与恢复要备份ClickHouse数据库中的数据表，你可以使用ClickHouse提供的BACKUP和RESTORE功能，或者通过手动备份文件系统中的数据目录来实现。以下是两种常用的方法：方法一：使用BACKUP和RESTORE功能从ClickHouse21.8版本开始，支持BACKUP和RESTORE命令。以下是备份和恢复的步骤：1.备份数据库备份整个数据库BACKU
click house学习路线——开篇 Fred3D Click house 数据库
clickhouse学习路线官方文档前提:最近要计算数据指标,开始使用olap列示存储的数据库,对clickhouse的使用进行了系统学习推荐阅读的书官方文档地址ClickHouse原理解析与应用实践(朱凯)占位后续更新…
Clickhouse 集群部署安装想当厨子的小章同学 Clickhouse linux 服务器运维
ClickHouse集群部署安装1、环境准备（1）、阿里云服务器两台集群节点信息192.168.5.13ch01192.168.5.14ch02（2）、修改/etc/cloud/cloud.cfg(所有节点)[root@iZbp1fsk0p3opmtlo52u91Z~]#vim/etc/cloud/cloud.cfg注释掉#manage_etc_hosts:localhost（3）、文件打开数调整
clickhouse集群部署林鸟鸟 clickhouse clickhouse 服务器
单节点设置为了延迟演示分布式环境的复杂性，我们将首先在单个服务器或虚拟机上部署ClickHouse。ClickHouse通常是从deb或rpm包安装，但对于不支持它们的操作系统也有其他方法。例如，您选择deb安装包，执行:sudoapt-getinstall-yapt-transport-httpsca-certificatesdirmngrsudoapt-keyadv--keyserverhkp
clickhouse-neighbor 坑爹的排序 [email protected] clickhouse
对于排序规则明显的数据集，使用neighbor来做分析，是一个非常强大的函数，能完成很多复杂的计算，例如高速公路分析车辆流量。高速公路截面流量一般是通过路面上的门架采集设备采集通行卡的信息和识别牌照组成，在路面行驶的车辆，受天气、车辆密集度、电子卡片、采集设备等因素影响，也不能100%准确采集到通行数据，如果仅仅以单一采集点来分析流量，准确度必然打折扣。不过，任何方法都不能说完全准确分析出数据，肯
【离线安装clickhouse集群】 eddianliu bigdata clickhouse centos
离线安装clickhouse集群clickhouse介绍Clickhouse是俄罗斯yandex公司于2016年开源的一个列式数据库管理系统，在OLAP领域像一匹黑马一样，以其超高的性能受到业界的青睐。特性：基于shard+replica实现的线性扩展和高可靠采用列式存储，数据类型一致，压缩性能更高硬件利用率高，连续IO，提高了磁盘驱动器的效率向量化引擎与SIMD提高了CPU利用率，多核多节点并行
clickhouse集群搭建颍天 clickhouse 数据库
文章目录安装clickhouse修改集群配置文件启动clickhouse集群测试集群的可用性安装clickhouse本次用了4台服务器搭建clickhouse集群，使用rpm安装方式在4台服务器上安装clickhouse，步骤如下：sudoyuminstall-ycurlcurl-shttps://packagecloud.io/install/repositories/altinity/clic
k8s上的clickhouse集群部署并创建分布式表（附详细参数说明和参考链接） KirutoCode 开发技能
k8s上的clickhouse集群部署并创建分布式表制作docker镜像创建configmap创建clickhouseservicepod创建clickhouseclientpod创建Service创建分布式表部署总体参考：https://blog.csdn.net/tototuzuoquan/article/details/111305125clickhouse的配置文件相关解读：https:/
Clickhouse和MySQL的区别以及适用业务场景听说唐僧不吃肉 Clickhouse MySQL clickhouse mysql 数据库
Clickhouse和MySQL的区别ClickHouse和MySQL是两种不同类型的数据库管理系统，它们在设计理念、数据处理方式和应用场景上有着明显的区别。区别和特点1.设计目标ClickHouseClickHouse是一种面向分析的列式存储数据库，旨在处理大规模数据的高性能查询和实时分析。它专注于快速的数据插入和复杂的分析查询。MySQLMySQL是一种传统的关系型数据库管理系统(RDBMS)
从零到一建设数据中台 - 关键技术汇总我码玄黄数据中台数据挖掘数据分析大数据
一、数据中台关键技术汇总语言框架：Java、Maven、SpringBoot数据分布式采集：Flume、Sqoop、kettle数据分布式存储：HadoopHDFS离线批处理计算：MapReduce、Spark、Flink实时流式计算：Storm/SparkStreaming、Flink批处理消息队列：Kafka查询分析：Hbase、Hive、ClickHouse、Presto搜索引擎：Elast
clickhouse自定义函数的困惑 [email protected] clickhouse
近期遇到一个困惑的问题，自定义函数中，如果出现查询语句，则传递的参数，不能传递字段名，只能传递常量或者表达式，文档中也没有找到对应的解决办法。需求其实比较简单，查询的时候，要做一个“少数服从多数”的决定，在一行记录中，存在多个字段值是String类型，使用哪个字段值，取决于字段内容出现的频率次数最高的字符串，注意，这里是一行记录，可以理解成，一个数组字段类型，常规想法就是selectgroupby
【Hadoop】使用Scala与Spark连接ClickHouse进行数据处理音乐学家方大刚 Scala Hadoop hadoop scala spark
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域，ApacheSpark是一个广泛使用的高性能、通用的计算框架，而ClickHouse作为一个高性能的列式数据库，特别适合在线分析处理（OLAP）。结合Scala语
ClickHouse副本节点数据损坏恢复旺仔_牛奶 ClickHouse clickhouse 数据库 java
参考链接：https://blog.csdn.net/qq_42082701/article/details/127771766参考链接：https://kb.altinity.com/altinity-kb-setup-and-maintenance/suspiciously-many-broken-parts/#背景CK配置为1分片2副本#配置参数,这里我们将max_suspicious_br
ClickHouse存储引擎之ReplacingMergeTree引擎小枫@码大数据运维 clickhouse
一、ReplacingMergeTree作用ClickHouse中最常用也是最基础的表引擎为MergeTree，在它的功能上添加特定功能就构成了MergeTree系列引擎。MergeTree支持主键，但主键主要用来缩小查询范围，且不具备唯一性约束，可以正常写入相同主键的数据。但在一些情况下，可能需要表中没有主键重复的数据。ReplacingMergeTree就是在MergeTree的基础上加入了去
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n