ClickHouse

ClickHouse

ClickHouse最初设计的目标是服务公司的一款web流量分析工具。基于前方探针采集到的行为数据,进行一系列的数据分析。在采集数据的过程中,一次页面click(点击),就会产生一个event(事件),整个系统的逻辑就是基于页面的点击事件流,所以ClickHouse的全称是Click Stream,Data WareHouse。

ClickHouse适用场景

基本能够胜任各种数据分析类的场景,非常适用于商业智能领域(BI领域),能够被广泛应用于广告流量,web,app流量,电信,金融,电子商务,信息安全,网络游戏,物联网等。

ClickHouse不适用的场景

不支持事务
不擅长根据主键按行粒度进行查询
不擅长按行删除数据

ClickHouse的核心特性

ClickHouse_第1张图片

压缩的本质是按照一定步长对数据进行匹配扫描,当发现重复部分的时候就会进行编码转换, 数据中的重复项越多,压缩率越高,压缩越高数据体量越小,数据在网络中的传输越快
同一列字段的数据最可能具备重复性,因为他们拥有相同的数据类型和现实语义
ClickHouse_第2张图片
数据存储媒介距离CPU越近,访问数据的速度越快。
从上图中可以看到,从左向右,距离CPU越远,数据的访问速度越慢。从寄存器访问数据的速度,是从内存访问数据的300倍,是从磁盘访问数据的3000万倍,所以利用CPU向量化执行的特性,对于程序的性能提升意义非凡。

你可能感兴趣的:(ClickHouse,big,data,大数据)