认识一下 ClickHouse

认识一下 ClickHouse

ClickHouse 画像速览

ClickHouse 是面向列的数据库管理系统,主要应用于OLAP业务范畴,用于在线分析处理查询,可以使用SQL查询实时生成数据分析结果。列式存储的好处就是当我们对列进行聚合操作时,效率会大大优于行式存储,而且由于每一列的类型都是相同的,所以对于数据更容易进行压缩,并且可以对不同类型的列选择更合适的压缩算法,以来节约磁盘资源,以及磁盘IO。

随着大数据时代的到来,对于OLAP,列存储模式或者说nosql模式比传统意义的行存储模式可能更具优势。

注点:
  • OLTP即联机事务处理,就是我们经常说的关系数据库,增删查改就是我们经常应用的东西,这是数据库的基础;主要是执行基本日常的事务处理,比如数据库记录的增删查改。比如在银行的一笔交易记录,就是一个典型的事务,实时性要求高。

  • OLAP即联机分析处理,是数据仓库的核心部心,所谓数据仓库是对于大量已经由OLTP形成的数据的一种分析型的数据库,用于处理商业智能、决策支持等重要的决策信息;数据仓库是在数据库应用到一定程序之后而对历史数据的加工与分析,读取较多,更新较少,实时性要求不是很高,,比如最常见的应用就是天级更新数据,然后出对应的数据报表,数据量大。

ClickHouse 使用场景

  • 数据量较大。
  • ck的请求大多数都是读请求。
  • 宽表。
  • 查询相对较少。
  • 对于简单的查询,允许50毫秒的延迟。
  • 列中的数据相对较小,多为数字和短字符串。
  • 在处理单个查询时需要高吞吐量(单服务器每秒数十亿行)。
  • 事务不是必须的。
  • 对数据一致性要求低。
  • 每个查询都有一个大表。
  • 查询结果明显小于源数据。

你可能感兴趣的:(大数据,clickhouse,数据仓库,数据库)