syyyyyyyyyyyyyyh

OLAP之ClickHouse讲解

前言

首先Clickhouse在大方向上属于OLAP，列式存储，MPP。也就是指这三者的基础概念，属于前置知识，如果未曾了解，那么关于接下来对ClickHouse的认知与学习则事倍功半。
固穿插一部分前置知识，如果已经有所了解则跳过。

OLAP

OLAP与OLTP

提到OLAP，总是会与OLTP做比较。

OLTP联机事务分析

联机事务分析，强调事务性，并发。微量查询，每秒钟的查询次数较多，数百个甚至过千。SQL语句提交频繁，强调ACID。大多应用于传统的银行证券交易行为，针对某行数据的增删改查。

数据块变化频繁，随着数据量的增长以及计算型的函数参与SQL，消耗大量的CPU时间。

强调三范式。

一定程度上OLAP分析的数据都是由OLTP所产生的。

OLAP联机分析处理

OLAP又分为ROLAP与MOLAP与HOLAP

ROLAP关系型联机分析

关系型联机分析，以关系数据库为核心，以关系型结构进行多维数据的表示和存储。R即表示关系型（Relational）。

比较经典的有Doris，百度开源的产品，已经捐献至apache

将分析用的多维数据存储在关系数据库中，将常用的，频繁需求的直接封装入视图。减少了数据冗余，同时提高了应用的灵活性，模型轻量化。
######Doris

MOLAP多维联机分析

多维联机分析，所用到的多维数据物理上存储为多维数组的形式，形成"立方体"的结构。

kylin，Druid就是最经典MOLTP，核心理念空间换取时间。

主要通过一些软件工具或中间软件实现，维的属性值被映射成多维数组的下标值或下标的范围，而总结数据作为多维数组的值存储在数组的单元中。

缺点是配置过程繁琐(需要专业程度较高)，需要配置模型设计，并配合适当的“剪枝”策略(kylin中的强制维度等)，以实现计算成本与查询效率的平衡。

HOLAP混合数据模型

对于查询频繁而稳定但又耗时的那些SQL，通过预计算来提速；对于较快的查询、发生次数较少或新的查询需求，像ROLAP一样直接通过SQL操作事实表和维度表。
目前似乎没有开源的OLAP系统属于这个类型

列式存储

列式存储与行式存储

行式存储

所谓行式存储，顾名思义，数据在磁盘上的存储以行为最小单位。适应场景，也就是数据按行读写。

Mysql，Oracle为其中典例

行式存储，列数是固定的，字段没有数据，也就是空行，依旧会占用空间。每行数据的类型也不一致，所以压缩的效率不会太高。

适用于随即查询，通常行式存储也就是关系型数据库，都提供二级索引，在整行的读取上，效率较优。

缺点是，范围读取性能不佳，如果只取某几个字段则需要全表扫描。应用于BI的场景，如果不设计视图，效率注定不佳。

列式存储

所谓列式存储，也就是在磁盘上的数据按列存储，按列读写。更像一个Map，K,V。

国内知名度较高的有HBase，国外知名度较高的有Cassandra。

字段中没有数据，不会占用空间。每列的数据类型基本是一致的，所以压缩的效率极高。

适用于范围查询，批量查询，大规模数据的聚合操作。

例如HBase，弱化了列的概念，但并非完全不要求结构，列族需要提前定义。

缺点是，顺序读写效率低，表关联关系较为复杂。

Cassandra数据结构

HBase数据结构

MPP

大规模并行处理系统

多个SQL数据库节点搭建的数据仓库系统。执行查询的时候，查询可以分散到多个SQL数据库节点上执行，然后汇总返回给用户.

比较经典的有Impala，Clickhouse，GreenPlum

每个节点都有自己独立的CPU，内存和磁盘资源。任务执行能力强，充分发挥本地计算的能力，数据无共享，无IO冲突，无锁资源竞争，计算速度快

缺点是，如果某个节点的计算迟迟无法完成，就出现短板效应。

Clickhouse

易观针对目前市面上OLAP所作报告满分5分

ClickHouse特性之数据压缩

数据压缩支持标记压缩，列级压缩。也就是指可以针对不同的列，采用不同的压缩，较为灵活。创表时实现。

create table database.db_name(
		security_id String CODEC(LZ4),
		gross_profit float64 CODEC(Gorilla,LZ4),
		rang_pc float32 CODEC(T64,LZ4),
	    trade_date Date CODEC(DoubleDelta,LZ4)
 )
 ENGINE = ReplacingMergeTree
PARTITION BY toYYYYMMDD(trade_date)
ORDER BY (security_id,
 trade_date)

编码方式

LowCardinality

不多于1万个值的字符串(低基数的)，且字符串长度越长，效果提升越好

Delta

时间序列增量编码存储连续值之间的差值。这种差异通常具有较小的字节大小和基数，特别是对于序列来说。以后可以使用LZ4或ZSTD有效地压缩它

DoubleDelta

通过这种编码，ClickHouse存储了连续增量之间的差异。对于缓慢变化的序列，它给出了更好的结果。用物理上的类比，Delta编码速度，而DoubleDelta编码加速。

Gorilla

灵感来源于，facebook的文章，对于不经常变化的值，Gorilla编码非常有效。它既适用于float数据类型，也适用于integer数据类型

T64

这种编码是ClickHouse独有的。它计算编码范围的最大值和最小值，然后通过转置64位矩阵(T64名称的来源)剥离较高的位。最后，我们得到了相同数据的更紧凑的位表示。对于整数数据类型，编码是通用的，并且不需要数据中的任何特殊属性，只需要值的位置

压缩方式

None

支持完全不压缩，好处是对cpu没有任何性能影响，压缩与解压消耗大量CPU，缺点是占用C盘空间太多。

LZ4

高效的压缩算法，压缩与解压的效率都很高，但是压缩比不太乐观，适用于日志压缩

LZ4HC

LZ4的高压缩率压缩算法，是LZ4的高压缩比改进版，更适用于非字符串类型，但写入的效率降低。可选压缩级别。level默认值为9，支持[1,12]，推荐选用[4,9] LZ4HC(6)

ZSTD

与LZ4相比，对String类型的效果更好，解压和压缩的效率较低，但是压缩比提升将近30%，释放大量空间。可选压缩机别，level默认值为1，支持[1,22]。

全局配置

结论

LZ4HC(6)与ZSTD(15)，编码LowCardinality，在部分公司表现最佳。

ClickHouse特性之磁盘存储

设计之初ClickHouse被设计用于工作在传统磁盘上的系统，它提供每GB更低的存储成本，但如果可以使用SSD和内存，它也会合理的利用这些资源。

ClickHouse支持在建表时，指定将数据按照某些列进行sort by。
排序后，保证了相同sort key的数据在磁盘上连续存储，且有序摆放。在进行等值、范围查询时，where条件命中的数据都紧密存储在一个或若干个连续的Block中，而不是分散的存储在任意多个Block，大幅减少需要IO的block数量。

Clickhouse特性之多核心并行处理

单机情况下

ClickHouse将数据划分为多个partition，每个partition再进一步划分为多个index granularity，然后通过多个CPU核心分别处理其中的一部分来实现并行数据处理。
在这种设计下，单条Query就能利用整机所有CPU。极致的并行处理能力，极大的降低了查询延时。

分布式情况下

ClickHouse会自动将查询拆解为多个task下发到集群中，然后进行多机并行处理，最后把结果汇聚到一起。
在存在多副本的情况下，ClickHouse提供了多种query下发策略：

1.随机下发：在多个replica中随机选择一个；

2.最近hostname原则：选择与当前下发机器最相近的hostname节点，进行query下发。在特定的网络拓扑下，可以降低网络延时。而且能够确保query下发到固定的replica机器，充分利用系统cache。

3.in order：按照特定顺序逐个尝试下发，当前一个replica不可用时，顺延到下一个replica。

4.first or random：在In Order模式下，当第一个replica不可用时，所有workload都会积压到第二个Replica，导致负载不均衡。first or random解决了这个问题：当第一个replica不可用时，随机选择一个其他replica，从而保证其余replica间负载均衡。另外在跨region复制场景下，通过设置第一个replica为本region内的副本，可以显著降低网络延时。

ClickHouse特性之多服务器分布式处理

分片，副本的概念，较为灵活。shard与replica

一个三分片双副本的配置信息


    
        
        
            
            

                1
            
                true
                

                    192.168.0.81
                    9000
                
                

                    192.168.0.102
                    9000
                
            
            
            
                1
                true

                
                    192.168.0.102
                    9100
                

                
                    192.168.0.103
                    9000
                
            
            
              
                1
                true

                
                    192.168.0.81
                    9100
                

                
                    192.168.0.103
                9100
                
            
        
    


    
        ::/0
    

    
    
        
            192.168.0.81
            2181
        
        
            192.168.0.102
            2181
        
        
            192.168.0.103
            2181
        
    

    
    
        
            10000000000
            0.01
            lz4

ClickHouse特性之支持SQL

在许多情况下支持标准SQL，但相关子查询以及窗口函数等等暂不支持。并且连接查询性能也欠佳。

ClickHouse特性之向量引擎

向量化与SIMD

ClickHouse实现了向量执行引擎（Vectorized execution engine），对内存中的列式数据，一个batch调用一次SIMD指令（而非每一行调用一次），不仅减少了函数调用次数、降低了cache miss，而且可以充分发挥SIMD指令的并行能力，大幅缩短了计算耗时。向量执行引擎，通常能够带来数倍的性能提升。

什么是向量化与SIMD

为了实现向量化执行，需要利用CPU的SIMD指令。SIMD的全称是Single Instruction Multiple Data，即用单条指令操作多条数据。现代计算机系统概念中，它是通过数据并行以提高性能的一种实现方式 ( 其他的还有指令级并行和线程级并行 )，它的原理是在CPU寄存器层面实现数据的并行操作。

在计算机系统的体系结构中，存储系统是一种层次结构。存储媒介距离CPU越近，则访问数据的速度越快。

ClickHouse特性之实时的数据更新

对于MergeTree引擎，ClickHouse表的主键（Primary Key）和排序键（Order By Key）相同。但是采用了汇总合并树引擎（SummingMergeTree）的表可以单独指定主键

主键定义了记录在存储中排序的顺序，允许重复。并且写入的过程中不会存在任何加锁的行为。所以数据可以持续不断地高效的写入到表中。

MergeTree 的order by语句

ClickHouse特性之索引

只有MergeTree系列的表引擎才支持主键索引，数据分区，数据副本，数据采样这样的特性，只有此系列的表引擎才支持ALTER操作

标准的MergeTree创表语句

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] ,
    name2 [type2] ,
    ...
    INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
    INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
) ENGINE = MergeTree()
#分区
[PARTITION BY expr]
#排序 默认与主键相同作用
[ORDER BY expr]
#主键 默认与排序相同作用
[PRIMARY KEY expr]
#抽样表达式，或者说采样表达式，如果配置，则需要在主键中同样声明
#SAMPLE 0.1 意味着抽样十分之一的数据，假设结果求count() 手动乘十
#SAMPLE 100000000 意味着至少抽样这么多行数据
#SAMPLE 0.5 1/2 意味着从后一半取一半的数据
[SAMPLE BY expr]
#存活时间
[TTL ]
#配置项 
#index_granularity=8192 意味着间隔8192行生成一个索引
#index_granularity_bytes = 1010241024 根据大小(10M)生成索引
[SETTINGS name=value, ...]

一级索引

除SummingMergeTree引擎外，一级索引就是主键也就是排序字段，根据稀疏索引，也就是SETTINGS来控制。

二级索引

MergeTree支持二级索引，也叫做跳数索引，是由数据的聚合信息构建而成。根据索引类型的不同，其聚合信息的内容也不同，但它的目的和一级索引是一致的，都是为了帮助查询时减少数据扫描范围

新版本中默认开启，允许使用，旧版本不够成熟，所以默认关闭。

一张表支持多个跳数索引。

INDEX sample_index (u64 * length(s)) TYPE minmax GRANULARITY 4
INDEX sample_index2 (u64 * length(str), i32 + f64 * 100, date, str) TYPE set(100) GRANULARITY 4
INDEX sample_index3 (lower(str), str) TYPE ngrambf_v1(3, 256, 2, 0) GRANULARITY 4

minmax

记录了极值，也就是最大最小值，超过范围认为不存在.

CREATE TABLE table_name
(
    u64 UInt64,
    i32 Int32,
    s String,
    ...
    INDEX a (u64 * i32, s) TYPE minmax GRANULARITY 3
) ENGINE = MergeTree()

set(max_row)

存储指定表达式的不重复值（不超过 max_rows 个,max_rows=0 则表示『无限制』）。这些信息可用于检查数据块是否满足 WHERE 条件

set 索引会对所有函数生效

CREATE TABLE table_name
(
    u64 UInt64,
    i32 Int32,
    s String,
    ...
	#表示set索引值会取u64的值乘以s的长度当作唯一值，每个索引内最多有1000条记录
    INDEX b (u64 * length(s)) TYPE set(1000) GRANULARITY 4
) ENGINE = MergeTree()

ngrambf_v1

ngrambf_v1(n, size_of_bloom_filter_in_bytes, number_of_hash_functions, random_seed)

n – 短语长度。

size_of_bloom_filter_in_bytes – 布隆过滤器大小，字节为单位。（因为压缩得好，可以指定比较大的值，如 256 或 512）。

number_of_hash_functions – 布隆过滤器中使用的哈希函数的个数。

random_seed – 哈希函数的随机种子。

tokenbf_v1

tokenbf_v1(size_of_bloom_filter_in_bytes, number_of_hash_functions, random_seed)

跟 ngrambf_v1 类似，但是存储的是token而不是ngrams。Token是由非字母数字的符号分割的序列

bloom_filter

bloom_filter(bloom_filter([false_positive])
为指定的列存储布隆过滤器

可选参数false_positive用来指定从布隆过滤器收到错误响应的几率。取值范围是 (0,1)，默认值：0.025

支持的数据类型：Int*, UInt*, Float*, Enum, Date, DateTime, String, FixedString, Array, LowCardinality, Nullable

ClickHouse特性之在线查询

意味着在没有任何预计算的情况下，保持即席查询
单单在count(*)上效率就极高

ClickHouse特性之近似计算

在允许牺牲数据精度的情况下对查询进行加速的方法
比如上文讲过的抽样表达式SAMPLE
uniqCombined(id)，代替 count(distinct id) 根据哈希值来做近似计算。对string做64位哈希，其他的类型做32位哈希。
官网提到的medians与quantiles指的是同一函数，不同别名。分位数函数

ClickHouse特性之数据复制数据完整

上文讲到过的副本策略。通过zookeeper进行数据同步，znode中保留sql语句，等待执行。中间视图

ClickHouse特性之角色的访问控制

通过对user.xm配置文件控制用户的访问权限，指定用户可以访问某些库，可操作某些库。

ClickHouse常用引擎之日志引擎

顾名思义，Log引擎，也就是常用于日志，所以支持的条数不会太多，为少于一百万行的场景而开发。

日志引擎之Log引擎

最轻量级的引擎，多用于演示或测试。标记的小文件与列文件存放在一起，并且含有便宜了。支持并发读，写入时将阻塞读操作。不支持索引，写入失败则表损坏。

日志引擎之TinyLog

最简单的表引擎。数据都存放在磁盘之中，写入时文件写入末尾。适用于一次写入，多次读取。单线程不支持并行查询。

日志引擎之StripeLog

将所有列存储至一个文件中对每一次 Insert 请求，ClickHouse 将数据块追加在表文件的末尾，逐列写入。数据文件与标记文件，标记文件中存储偏移量。查询时多线程工作。

ClickHouse常用引擎之集成引擎

可以集成MongoDB，RabitMQ，Kafka，Mysql，Postgres，jdbc，odbc，hdfs

ClickHouse常用引擎之核心引擎合并树家族

支持主键，分区，副本，分片，抽样。
最核心，最常用。MergeTree以及MergeTree的变种，或者延展。

MergeTree
ReplacingMergeTree
SummingMergeTree
AggregatingMergeTree
CollapsingMergeTree
VersionedCollapsingMergeTree
GraphiteMergeTree

基本的建表语句

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
    ...
    INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
    INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
) ENGINE = MergeTree()
ORDER BY expr
[PARTITION BY expr]
[PRIMARY KEY expr]
[SAMPLE BY expr]
表达式中必须存在至少一个  `Date`  或  `DateTime`  类型的列，比如：
 `TTL date + INTERVAl 1 DAY`
[TTL expr [DELETE|TO DISK 'xxx'|TO VOLUME 'xxx'], ...]
[SETTINGS name=value, ...]

合并树家族之MergeTree

适用于批量插入数据，而不是非常频繁地插入单行
数据的存储按主键分块。
MergeTree在写入一批数据时，数据会以数据片段的形式写入磁盘，且数据片段不可修改。为了避免片段过多，ClickHouse会通过后台线程，定期合并这些数据片段，属于相同分区的数据片段会被合成一个新的片段。

合并树家族之ReplacingMergeTree

该引擎和MergeTree的不同之处在于它会删除排序键值相同的重复项
使用ORDER BY排序键，作为判断数据是否重复的唯一键
数据的去重只会在数据合并期间进行。合并会在后台一个不确定的时间进行
删除重复数据，是以数据分区为单位。同一个数据分区的重复数据才会被删除，不同数据分区的重复数据仍会保留

合并树家族之SummingMergeTree

合并SummingMergeTree表的数据片段时，ClickHouse 会把所有具有相同主键的行合并为一行，该行包含了被合并的行中具有数值数据类型的列的汇总值。
ENGINE = SummingMergeTree([columns])

合并树家族之AggregatingMergeTree

ClickHouse 会将一个数据片段内所有具有相同主键（准确的说是排序键)的行替换成一行，这一行会存储一系列聚合函数的状态.

CREATE TABLE agg_table(
    id String,
  city String,
  #code,value是聚合字段，等同于`UNIQ(code), SUM(value)`
  code AggregateFunction(uniq,String),
  value AggregateFunction(sum,UInt32),
  create_time DateTime,
)ENGINE = AggregatingMergeTree
PARTITIION BY toYYYYMM(create_time)
#字段id, city 是聚合条件
ORDER BY (id,city)
PRIMARY KEY id

通常会新建一张物化视图用于操作

CREATE MATERIALIZED VIEW agg_view
ENGINE = AggregatingMergeTree()
PARTITION BY city
ORDER BY (id,city)
AS SELECT
    id,
    city,
    uniqState(code) AS code,
    sumState(value) AS value
FROM agg_table basic
GROUP BY id,city

副本引擎之ReplicatedMergeTree

只有 MergeTree 系列里的表可支持副本

ReplicatedMergeTree
ReplicatedSummingMergeTree
ReplicatedReplacingMergeTree
ReplicatedAggregatingMergeTree
ReplicatedCollapsingMergeTree
ReplicatedVersionedCollapsingMergetree
ReplicatedGraphiteMergeTree

创建副本(本地)表

CREATE TABLE table_name `ON CLUSTER xxxxx`
(
    EventDate DateTime,
    CounterID UInt32,
    UserID UInt32
) ENGINE = ReplicatedMergeTree('/clickhouse/tables/{layer}-{shard}/table_name', '{replica}')
PARTITION BY toYYYYMM(EventDate)
ORDER BY (CounterID, EventDate, intHash32(UserID))
SAMPLE BY intHash32(UserID)
##由这部分替代

    05
    02
    example05-02-1.yandex.ru

操作副本表

Distributed
分布式引擎本身不存储数据, 但可以在多个服务器上进行分布式查询。
读是自动并行的。读取时，远程服务器表的索引（如果有的话）会被使用。
分布式引擎参数：服务器配置文件中的集群名，远程数据库名，远程表名，数据分片键（可选）

#cluster 数据库 表明 分片键 根据哪个字段的hash分片
Distributed(logs, default, hits[, sharding_key])

ClickHouse特殊引擎之 Buffer

缓冲数据写入 RAM(主存，是与CPU直接交换数据的内部存储器) 中，周期性地将数据刷新到另一个表。在读取操作时，同时从缓冲区和另一个表读取数据
buffer 表没有索引
如果需要改为表结构，推荐先删除 Buffer 表，再改变目标表结构，再重建 Buffer 表
如果机器异常重启，则 Buffer 表内容会丢失
向 Buffer 表写数据时，这个 Buffer 区将会加锁，这时读请求会有延迟

CREATE TABLE merge.hits_buffer AS merge.hits ENGINE = Buffer(merge, hits, 16, 10, 100, 10000, 1000000, 10000000, 100000000)
创建了16个缓冲区。如果已经过了100秒，或者已写入100万行，或者已写入100 MB数据，则刷新每个缓冲区的数据；或者如果同时已经过了10秒并且已经写入了10,000行和10 MB的数据。

你可能感兴趣的:(clickhouse)

clickhouse分布式表插入数据不用带ON CLUSTER 时时刻刻看着自己的心 clickhouse 分布式
向分布式表插入数据时，通常不需要使用ONCLUSTER，因为分布式表的写入操作会自动将数据分发到底层表（bm_online_user_count_part）的对应节点。但对于DDL（数据定义语句，例如ALTERTABLE）操作，在分布式环境中修改底层表时，建议使用ONCLUSTER，以确保所有相关节点上的表结构和数据同步。区分DDL和DMLDML（数据操作语句，例如INSERT）向分布式表插入数据
ClickHouse高频面试题野老杂谈数据库
ClickHouse高频面试题1、简单介绍一下ClickHouse2、ClickHouse具有哪些特点3、ClickHouse作为一款高性能OLAP数据库，存在哪些不足4、ClickHouse有哪些表引擎5、介绍下Log系列表引擎应用场景共性特点不支持6、简单介绍下MergeTree系列引擎7、简单介绍下外部集成表引擎ODBCJDBCMySQLHDFSKafkaRabbitMQ8、ClickHou
clickhouse数据库表和doris数据库表迁移starrocks数据库时建表注意事项总结积跬步，慕至千里软件安装及程序错误解决方案集数据库 clickhouse
目录零、前言一、clickhouse数据库表在starrocks数据库建表时问题总结1.1数据类型类问题：1.2数据导出阶段：二、doris数据库表在starrocks数据库建表时问题总结2.1properties不支持的属性（直接删除）：2.2properties需修改属性2.3properties：doris建表语句分区明细，starrocks数据不需要明确设定，会自动更新2.4分桶设置问题2
KingbaseES 到 Apache Doris 实时同步实践｜国产数据库数据入仓解决方案数据库
国产数据库加速进入核心系统，传统同步工具却频频“掉链子”。本系列文章聚焦OceanBase、GaussDB、TDSQL、达梦等主流信创数据库，逐一拆解其日志机制与同步难点，结合TapData的实践经验，系统讲解从CDC捕获到实时入仓（Doris、StarRocks、ClickHouse等）的完整链路构建方案，为工程师提供切实可行的替代路径与最佳实践。本篇任务：KingbaseES→ApacheDo
Flink ClickHouse 连接器：实现 Flink 与 ClickHouse 无缝对接 Edingbrugh.南空大数据 flink flink clickhouse 大数据
引言在大数据处理领域，ApacheFlink是一款强大的流处理和批处理框架，而ClickHouse则是一个高性能的列式数据库，专为在线分析处理（OLAP）场景设计。FlinkClickHouse连接器为这两者之间搭建了一座桥梁，使得用户能够在Flink中方便地与ClickHouse数据库进行交互，实现数据的读写操作。本文将详细介绍FlinkClickHouse连接器的相关内容，包括其特点、使用方法
ClickHouse【理论篇】01：什么是ClickHouse
ClickHouse是一款开源的列式数据库管理系统（Column-OrientedDBMS），专为高性能实时数据分析（OLAP,OnlineAnalyticalProcessing）场景设计。它由俄罗斯搜索引擎公司Yandex开发（2016年开源），目前由独立基金会ClickHouse,Inc.维护，广泛应用于大数据分析、日志处理、用户行为洞察等领域。一、核心定位：OLAP场景的“性能标杆”传统关
ClickHouse【理论篇】02：ClickHouse架构和组件做一个有趣的人Zz ClickHouse clickhouse 架构
ClickHouse的架构设计深度适配OLAP（在线分析处理）场景，通过列式存储、向量化执行、分布式分片与副本等核心技术，实现了对海量数据的高效分析与实时查询。以下从核心存储引擎、查询处理流程、分布式架构、元数据管理、复制与分片等维度详细解析其内部架构与关键组件。一、核心存储引擎：MergeTree系列ClickHouse的存储引擎是其性能的核心，其中MergeTree系列引擎（如MergeTre
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？ SeaTunnel bug SeaTunnel 开源数据集成大数据
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
ClickHouse 导入数据报错愿与狸花过一生 ClickHouse clickhouse
报错信息ERROR:Thereisnolinefeed."�"foundinstead.It'slikeyourfilehasmorecolumnsthanexpected.Andifyourfilehastherightnumberofcolumns,maybeithasanunquotedstringvaluewithacomma.ClickHouse导入csv文件中发现多了一列导致报错解决方
SeaTunnel 社区月报（5-6 月）：全新功能上线、Bug 大扫除、Merge 之星是谁？数据库
在5月和6月，SeaTunnel社区迎来了一轮密集更新：2.3.11正式发布，新增对Databend、Elasticsearch向量、HTTP批量写入、ClickHouse多表写入等多个连接器能力，全面提升了数据同步灵活性。同时，近100个修复与优化PR合入，涵盖Spark引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
Clickhouse源码分析-Replicated Database创建流程
前置准备DDL：CREATEDATABASEmy_replicated_dbENGINE=Replicated('/clickhouse/databases/my_replicated_db','{shard}','{replica}');这里需要你提前启动1个clickhouse，1个clickhouse-keeper。源码分析断点：bInterpreters/DDLWorker.cpp:146
ClickHouse：在 CentOS7.4 中编译 ClickHouse
目录一、环境准备二、创建编译使用的脚本三、编译ClickHouse一、环境准备1.1、CentOS版本为7.4.17081.2、从githubcloneClickHouse源码，checkout到tagv21.2.6.1-stable。cloneClickHOuse代码的时候需要把依赖的子项目也都clone下来，命令如下：gitclone--recursivehttps://github.com/
CentOS 7 编译ClickHouse 24.8完整指南
前言在CentOS7上编译ClickHouse24.8可能会遇到一些挑战，主要是因为CentOS7的默认软件版本较旧。本文将详细介绍从零开始构建ClickHouse24.8的完整过程，包括依赖安装和环境配置。准备工作首先确保系统已更新到最新版本：yumupdate-y1.安装CMakeClickHouse需要CMake3.1.7以上版本，我们安装3.25.3：wget--no-check-cert
gorm 配置数据库三金C_C go 数据库
介绍GORM是Go语言中最流行的ORM（对象关系映射）库之一，基于数据库操作的封装，提供类似DjangoORM/SQLAlchemy的开发体验。特性描述支持多种数据库MySQL、PostgreSQL、SQLite、SQLServer、ClickHouse等自动迁移自动根据struct生成数据库表结构CRUD操作简洁简洁直观的增删查改接口支持事务内置事务管理预加载一行代码加载关联数据（Preload
Clickhouse数据库的探索与安装 PerterTingle 华为云+Ubuntu操作系统 spring boot java 华为云数据库
以下是一个简洁的教程，指导你在Ubuntu系统上通过Docker下载并运行ClickHouse（一个开源的列存储数据库，专为在线分析处理OLAP设计），并确保其支持远程访问。教程基于官方文档和相关资源，适用于初学者。使用Docker部署ClickHouse教程前提条件Ubuntu系统（本教程以Ubuntu22.04为例）。已安装Docker和DockerCompose（若未安装，见下方步骤）。具有
clickhouse安装日记唯独不开心 clickhouse 数据库
#下载安装包下载地址：Indexof/repos/clickhouse#安装rpm-ivh*.rpm错误：依赖检测失败：libcrypto.so.10()(64bit)被clickhouse-compressor-1.1.54236-4.el7.x86_64需要libicudata.so.50()(64bit)被clickhouse-compressor-1.1.54236-4.el7.x86_6
信创 CDC 实战｜国产数据库的数据高速通道：OceanBase 实时入仓 StarRocks 数据库
国产数据库加速进入核心系统，传统同步工具却频频“掉链子”。本系列文章聚焦OceanBase、GaussDB、TDSQL、达梦等主流信创数据库，逐一拆解其日志机制与同步难点，结合TapData的实践经验，系统讲解从CDC捕获到实时入仓（Doris、StarRocks、ClickHouse等）的完整链路构建方案，为工程师提供切实可行的替代路径与最佳实践。本篇任务：OceanBase→StarRocks
Python实现MySQL建表语句转换成Clickhouse SQL weixin_30777913 python mysql clickhouse sql 数据库
主程序：**main_converter.py**importreimportjsonimportargparsedefload_config(config_path:str)->dict:'''配置管理模块:加载JSON格式配置文件'''withopen(config_path,mode="r",encoding="utf-8")asf:returnjson.load(f)classBaseCo
大数据学习（141）-分布式数据库 viperrrrrrr 大数据学习分布式 clickhouse hdfs hbase
在分布式数据库中主要有hdfs、hbase、clickhouse三种。HDFS（HadoopDistributedFileSystem）、HBase和ClickHouse都是处理大数据的分布式系统，但它们的设计目标、架构和适用场景有所不同。一、HDFS（HadoopDistributedFileSystem）HDFS是Hadoop生态系统的一部分，是一个高度容错的系统，适合存储大量数据。它被设计为
PostHog 的核心原理草明运维 PosHog op
“事件驱动的数据采集+本地部署的分析系统+全栈可观测能力”下面是对PostHog工作原理的详细拆解，从架构层次到数据流转流程，并涵盖其核心模块。架构总览PostHog通常由以下几个关键组件构成：用户前端→PostHogJSSDK/API→IngestionPipeline→Kafka（事件队列）↓PostgreSQL/ClickHouse（事件存储）↓后端处理服务+插件系统+分析引擎↓WebUI/
Python实现高效导入Excel数据到ClickHouse weixin_30777913 python 开发语言 clickhouse excel pandas
设计一个从Excel文件导入Clickhouse表的程序流程，并用Python来实现。单进程读取Excel文件，分批读取，每批读取1000条，使用INSERT的语句带多组值来写入数据库，比如100组值，可以创建多个列表来缓存这些插入数据库的语句，实现连续读取数据不中断，创建单个进程来读取顺序这些列表来写入表，读取完列表的数据之后，清空列表以便下一次再写入插入数据库的依据，我希望读取和写入数据库的操
数据库选型之路YMatrix与Clickhouse对比星*语数据库数据仓库时序数据库
背锅我们是被迫的数据库问题‘触发’越来越频繁了，开发、业务人员也一直抱怨数据库不行，作为运维人员，天天各种处理问题，还被其他部门喷，有问题矛头全部指向数据库。刚上任的部门领导整天也是压力山大，内部会议分析了当前的情况，最终解决方案是架构变更。当前的生产系统运行在Mysql上，从开始的保留半年的数据，到现在缩减到保留不足三个月的数据，全量数据实时同步到Hadoop，随着业务的发展，Mysql和Had
Clickhouse统计指定表中各字段的空值、空字符串或零值比例 weixin_30777913 clickhouse 运维数据仓库
下面是一段ClickhouseSQL代码，用于统计指定数据库中多张表的字段空值情况。代码通过动态生成查询语句实现自动化统计，处理逻辑如下：从系统表获取指定数据库（替换your_database）中所有表的字段元数据根据字段类型动态生成对应的空值统计逻辑使用sum聚合函数统计空值记录数计算空值占比百分比结果包含数据库名、表名、字段名、字段类型、空值计数、总行数和空值占比SELECTdatabase,
dbeaver 查询clickhouse，数据库时间差了8小时 Sayai 大数据数据库 clickhouse oracle
️调整步骤修改DBeaver连接配置在DBeaver中右键点击ClickHouse连接，选择“编辑连接”。切换到“驱动属性”选项卡，找到以下参数并修改：use_server_time_zone：设置为true（强制使用服务器时区）。use_server_time_zone_for_dates：设置为true（日期字段同步服务器时区）。use_time_zone：设置为目标时区（例如Asia/Sha
硬核实战 | 3分钟Docker部署ClickHouse列存数据库
本文来自「大千AI助手」技术实战系列，专注用真话讲技术，拒绝过度包装。ClickHouse作为OLAP领域性能标杆，其列式存储引擎比传统数据库快100倍以上。本文将用Docker实战部署，并解析关键配置：安装# 拉取最新镜像（当前版本23.8）docker pull clickhouse/clickhouse-server# 运行容器（关键参数解析）docker run -d \ --name=
开源夜莺支持MySQL数据源，更方便做业务指标监控了开源运维监控sremysql
夜莺监控项目最核心的定位，是做一个告警引擎，支持多种数据源的告警。这个版本的更新主要是增加了对MySQL数据源的支持，进一步增强了夜莺在业务指标监控方面的能力。之前版本的夜莺主要聚焦在Prometheus、VictoriaMetrics、ElasticSearch等传统监控数据源上，从上个版本引入ClickHouse开始，夜莺开始支持更多样化的数据源，本次版本迭代则引入了MySQL数据源的支持，给
ClickHouse在数据库领域的多租户架构设计数据库管理艺术 clickhouse 数据库 ai
ClickHouse在数据库领域的多租户架构设计关键词：ClickHouse、数据库、多租户架构、资源隔离、数据安全摘要：本文深入探讨了ClickHouse在数据库领域的多租户架构设计。首先介绍了多租户架构在数据库领域的背景和重要性，接着阐述了ClickHouse多租户架构的核心概念与联系，包括其原理和架构示意图。详细讲解了实现多租户架构的核心算法原理和具体操作步骤，并给出了相应的Python代码
我借鉴了 PHP PDO 对象预处理的方式，设计并开发一个组件 php组件设计
在KK集团工作期间开发过一个组件，至于为啥要开发这个组件，每家公司业务不一样，当时是用于从Elasticsearch和ClickHouse两个数据源里面查询数据，代码实现并不复杂，我自豪的是设计思路，分享一下。因为我看过也用过PDO的预处理，所以借鉴了其预处理思路，文档地址https://www.php.net/manual/zh/pdo.prepare.phpPDO的好处是，SQL语句只解析一次
开源夜莺V8.Beta11发版，支持CK告警、事件Pipeline等运维监控开源开源监控软件
这个版本来得迟了一些，主要是新功能加的多，下面简单介绍一下新功能，下下周也计划做一次直播讲解。支持ClickHouse告警夜莺最重要的定位是告警引擎，所以会持续增加各类数据源的告警支持，ClickHouse之后还有Doris、MySQL、Postgres等。开源版主要是支持告警，不会支持看图可视化，实在是做不过来，答疑也答疑不过来。引入事件Pipeline告警引擎根据告警规则产生告警事件之后，会有
jemalloc环境变量介绍小卡丘性能优化 c++
jemalloc环境变量详解与设置方法jemalloc是一款高性能、可扩展的通用内存分配器，广泛应用于Redis、MySQL、ClickHouse、Facebook等高并发场景。合理配置jemalloc的环境变量，可以更好地控制内存分配和调优程序性能。本文将详细介绍jemalloc常见环境变量的含义及其设置方式。一、环境变量作用jemalloc支持通过环境变量调整其运行时行为，涵盖内存分配策略、统
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

OLAP之ClickHouse讲解

前言

OLAP

OLAP与OLTP

OLTP联机事务分析

OLAP联机分析处理

ROLAP关系型联机分析

MOLAP多维联机分析

HOLAP混合数据模型

列式存储

行式存储

列式存储

Cassandra数据结构

HBase数据结构

MPP

Clickhouse

易观针对目前市面上OLAP所作报告 满分5分

ClickHouse特性之数据压缩

编码方式

LowCardinality

Delta

DoubleDelta

Gorilla

T64

压缩方式

None

LZ4

LZ4HC

ZSTD

全局配置

结论

ClickHouse特性之磁盘存储

Clickhouse特性之多核心并行处理

单机情况下

分布式情况下

ClickHouse特性之多服务器分布式处理

一个三分片双副本的配置信息

ClickHouse特性之支持SQL

相关子查询与非相关子查询

ClickHouse特性之向量引擎

向量化与SIMD

什么是向量化与SIMD

ClickHouse特性之实时的数据更新

MergeTree 的order by语句

ClickHouse特性之索引

标准的MergeTree创表语句

一级索引

二级索引

minmax

set(max_row)

ngrambf_v1

tokenbf_v1

bloom_filter

ClickHouse特性之在线查询

ClickHouse特性之近似计算

ClickHouse特性之数据复制数据完整

ClickHouse特性之角色的访问控制

ClickHouse常用引擎之日志引擎

日志引擎之Log引擎

日志引擎之TinyLog

日志引擎之StripeLog

ClickHouse常用引擎之集成引擎

ClickHouse常用引擎之核心引擎合并树家族

基本的建表语句

合并树家族之MergeTree

合并树家族之ReplacingMergeTree

合并树家族之SummingMergeTree

合并树家族之AggregatingMergeTree

副本引擎之ReplicatedMergeTree

创建副本(本地)表

操作副本表

ClickHouse特殊引擎之 Buffer

你可能感兴趣的:(clickhouse)

易观针对目前市面上OLAP所作报告满分5分