列式存储和行式存储的区别

目录

列式存储

行式存储 

列式存储的好处


以下表为例:

列式存储和行式存储的区别_第1张图片

列式存储

采用列式存储时,数据在磁盘上的组织结构为:

可以看到每个字段的值都是按顺序扎堆存储在一起的,

好处:如果想查所有人的年龄只需把年龄那一列拿出来就可以了,例如 select age from xxx

行式存储 

采用行式存储时,数据在磁盘上的组织结构为:

好处:想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。

列式存储的好处

  1. 对于列的聚合,计数,求和等统计操作原因优于行式存储。
  2. 由于某一列的数据类型都是相同的,针对于数据存储更容易进行数据压缩,每一列选择更优的数据压缩算法,大大提高了数据的压缩比重。
  3. 由于数据压缩比更好,一方面节省了磁盘空间,另一方面对于 cache 也有了更大的发挥空间。

你可能感兴趣的:(大数据学习,数据库,列式存储,存储格式,行式存储)