click house索引

稀疏索引

click house索引_第1张图片

好处: 范围查询过滤比较快
弊端: 不适合点对点查询 索引必须依赖物理存储顺序
排序字段a,b,c 索引字段 a, ab ,abc
索引字段必须是排序字段的前缀

语句级多线程

由于一条数据 不适合高qps的高频短查询,更适合低频的大数据复杂查询 优点:
ClickHouse将数据划分为多个partition,每个partition再进一步划分为多个index
granularity(颗粒),然后通过多个CPU核心分别处理其中的一部分来实现并行数据处理。
在这种设计下,单条Query就能利用整机所有CPU。极致的并行处理能力,极大的降低了查询延时。

弊端:
clickhouse即使对于大量数据的查询也能够化整为零平行处理。但是有一个弊端就是对于单条查询使用多cpu,就不利于同时并发多条查询。所以对于高qps的查询业务,clickhouse并不是强项。

创建二级索引

用法:

	create table t_order_mt2(
    uid UInt32,
    sku_id String,
    total_amount Decimal(16,2),
    create_time  Datetime,
	INDEX a total_amount TYPE minmax GRANULARITY 3 //跳数索引
 ) engine =MergeTree
 partition by toYYYYMMDD(create_time)
   primary key (uid)
   order by (uid,sku_id)

字段说明:

1,GRANULARITY N 是设定跳数索引对于一级索引粒度的个数
2,minmax GRANULARITY 3 的含义就是为 每3*8192行数据计算一对该列的最大最小值,
3,当扫描行扫描到该区间时,会对比最大最小值,如果不在该范围,就可以直接跳过该区域的扫描。
4,PRIMARYKEY不同,跳数索引可以在建表后,即使已经存储数据后,即时添加,如下:

ALTER TABLE t_order_mt
    ADD INDEX skipIdxAmount total_amount TYPE minmax GRANULARITY 3

查看一个表是否为二级索引表

1sql语句:show CREATE TABLE t_order_index2;
2,进入/var/lib/clickhouse/data/default/t_order_index2/20200602_2_2_0查看文件

click house索引_第2张图片

你可能感兴趣的:(Clickhouse,big,data,大数据,数据库)