kylin的工作原理之度量和指标

依据的理论:多为立方体分析



在多维立方体之前要先理解维度(Dimeension)和指标(Measure)

维度是观察数据的角度,是比较离散的值。比如日期,性别,地区,学校,不可做聚合运算(加减乘除)。指标是可以按照相同的维度计算的,比如,成绩,年龄,GDP等。

那么在SQL中如何区分维度和指标呢?有一个巧妙的方法,那就是group by后面的字段都是维度,在select到from之间即包含指标也包含维度。


kylin的工作原理之度量和指标_第1张图片
维度和指标

在明白何为指标,何为维度之后,我们看下cube和cuboid:给定一个数据模型,对于所有维度进行组合,举个例子,假如一个数据模型有4个维度,所有的组合可能性达到2的4次方个维度,也就是16个可能性。对于每一种可能的维度再针对于指标做聚合运算。然后把这16种运算结果物化视图,那么对应的16个物化视图就成为cuboid,所有的cuboid加起来被称为cube.


kylin的工作原理之度量和指标_第2张图片
原理图

工作过程:

1.制定好维度指标

2.预计算cube计算所有的cuboid保存为物化视图

3.执行查询操作,读取cuboid.

你可能感兴趣的:(kylin的工作原理之度量和指标)