SQL Server 2014新聚合columnstore索引介绍

在SQL Server 2012中,开发者有创建columnstore索引的选项。这些索引拥有提供10x性能提升和超过传统表7x压缩的潜力,但是随之也带来了大量的限制。这其中最重要的是他们将基本表送入只读模式的事实。

SQL Server 2014中的这个新存储引擎克服了这些限制。该引擎被称为聚合columnstore索引,它允许高度有效的列有序的数据,同时还允许表在执行DML操作(例如INSERT、UPDATE和DELETE)的时候正常运作。

就像正常的聚合索引一样,聚合columnstore索引定义了数据在磁盘上是如何物理存储的。columnstore支持的表首先会被组织成称为行组(rowgroup)的片段。每一个行组保存102400到1048578行数据。在行组被识别出来之后,它就会被打碎成列片段(column segments),然后对这些列片段进行压缩,并将结果插入到实际的columnstore中。

在处理少量数据(这里的少量指小于10万行数据)的时候,这些数据会被组织到一个称为deltastore的部分。一旦这些数据达到了deltastore能够将其排出的最小大小,那么它们就会被处理为一个新的行组。你可以从下面的MSDN图表中查看这个过程:

SQL Server 2014新聚合columnstore索引介绍_第1张图片

在deltastore进行转换的时候它会被关闭。但是无论如何这并不是一个全表阻塞操作。在当前的deltastore因为锁的原因不能访问的时候,会为给定的表创建一个额外的deltastore。如果表是分区的,那么每一个区都会有它自己的deltastore集。

术语上的注意:Microsoft现在使用“rowstore”表示按照行和列安排的传统表。deltastore实际上是一种类型的rowstore。

和之前版本的columnstore索引不同的是,聚合版本必须包含表中的所有列。这是因为对于剩下的行而言没有其他的堆或者聚合索引去依赖。事实上,聚合columnstore索引根本不能和其他类型的索引结合。

查看英文原文:Introducing SQL Server 2014's New Clustered Columnstore Indexes

你可能感兴趣的:(SQL Server 2014新聚合columnstore索引介绍)