ClickHouse库表结构与结构文件

基于上面一篇博客:ClickHouse集群环境下的分布式建库建表,插入/查询数据,自定义CSV文件数据导入

继续来学习~~~yum安装的ClickHouse创建的数据库和表默认在:/var/lib/clickhouse/data 下。

ClickHouse库表结构与结构文件_第1张图片

数据库和表层级都是一个文件夹,列数据是一个个.bin文件,一列存在一个文件里面,存储压缩后的数据吗,三条数据分了三个文件夹,每个文件夹下面就一条数据,如果是MergeTree引擎的数据表,命名规则用日期类型分区,表文件夹下的数据文件夹就是类似于:20201214_2_2_0

在这里插入图片描述

继续进入到其中某个数据分区的文件夹中看:

在这里插入图片描述

这里很多文件,它们分别的作用是:

(1)checksums.txt:检查分区数据总数
(2)columns.txt: 可查看该分区的数据列信息,包括名称和类型
在这里插入图片描述
(3)count.txt : 该分区文件夹下的数据条数,我这里三条数据分了三个区,就是一个文件夹下面一条数据而已。
(4)data.bin : 每一列具体的属性,当然是压缩后的~
ClickHouse库表结构与结构文件_第2张图片
(5)data.mrk :索引的偏移量
(6)minmax_date.idx :最小最大数据的记录,这里记录的也是分区规则的那一列的那个值,如果一个分区下只有一条数据,那么最大和最小的记录索引都是它自身
在这里插入图片描述
(7)partition.dat:分区信息,记录着对应分区规则的那个列的那个值,例如下面是按照User_code分区的~
ClickHouse库表结构与结构文件_第3张图片
(8)Primary.idx : 主键,如果没指定主键,则为空,一般情况下order by 的话就会自动把order by后面的字段当作主键

希望自己用过的技术都能熟练掌握,不断学习,菜鸡也有春天!

你可能感兴趣的:(ClickHouse,数据库)