- 维(Dimension):人们观察事物的视角,如时间、地理位置、年龄和性别等,是单一角度概念。
- 维的层次(Lever of Dimension):表示维度概念基础上进一步的细分,如时间可以细分为年、季度、月三个层次。
- 维成员(Member of Dimension):表示维不可再细分的原子取值,如时间维的成员可以是2019年1月10日。
- 度量(Measure):表示在这个维成员上的取值。
3. 操作
参考博客https://blog.csdn.net/xwc35047/article/details/86369465中图片
4. 下探或者叫钻取(Drill down):
维度是有层次的,下探表示进入维度的下一层,将汇总数据拆分到下一层所在细节数据信息,如下图从第二季度下探到看4、5、6月的明细数据。
简单来说,就是查看数据的更详细数据,所以叫下探
上钻(Roll up):
下探的反向操作,回到更高汇聚层的汇总数据。
简单来说,就是对数据做归纳和汇总,得到更进一步的数据。类似把一本书总结为几句话。
切片(Slice):
切片可以理解成把立体按某一个维度进行切分,就可以看两维数据,如图中按电子产品4切分,看到的是时间和地理位置关系的二维数据。
简单来说,就是根据某个标准进行数据划分,例如家产是否大于一个亿,是就是有钱人,不是就是穷人。
切块(Dice):
相对于切片是按一个点切分,切块就是按一个范围(区间)来做切分。
简单来说就是,切块是按照一个区域范围来划分数据的,例如家产在100万到1个亿之间,普通人,低于100万的是穷人,大于1个亿的是有钱人。所以我需要努力挣钱,争取泡面自由,。
旋转(Pivot):
维的行列位置交换,换一个视角分析数据。
简单来说,类比一个二维坐标,把x和y轴调换,有时候就会得到不一样的数据视角。换个角度看问题。
涉及到分类,就可以有很多分类标准。按照存储器数据格式划分,可以分为ROLAP、MOLAP和HOLAP。
以多维数组(Multi-dimensional Array)存储模型的OLAP,是OLAP发源最初的形态,某些方面也等同于OLAP。它的特点是数据需要预计算(pre-computaion),然后把预计算之后的结果(cube)存在多维数组里。
基于关系模型存放数据,一般要求事实表(fact table)和维度表(dimensition table)按一定关系设计,它不需要预计算,使用标准SQL就可以根据需要即时查询不同维度数据。
业界还没有一致的定义,它是MOLAP和ROLAP类型的混合运用,细节的数据以ROLAP的形式存放,更加方便灵活,而高度聚合的数据以MOLAP的形式展现,更适合于高效的分析处理。公司使用HOLAP的目的是根据不同场景来利用不同OLAP的特性。
Cognos Powerplay, IBM家的,性能可以,但价格大家都懂的。https://www.ibm.com/support/knowledgecenter/en/SSEP7J_11.1.0/com.ibm.swg.ba.cognos.pps_install_config.doc/c_pps_integration_with_ca.html
Oracle Database OLAP Option, Oracle家的,性能很好,不过价格就
随时担心会收取高额费用,瑟瑟发抖。https://www.simba.com/blog/oracle-database/
MicroStrategy, 微策略(Microstrategy)成立于1989年,是全球最大的独立BI(Business Intelligence)公司(NASDAQ:MSTR)。该公司自成立以来保持了20年的持续增长, 年营收超过5亿美金, 主要来自BI软件和服务。 该公司高度重视中国用户的产品体验, 在华研发员工总数超过300人。Microstrategy 一直是GartnerMagicQuadrant评鉴中列为领先的前五大BI工具和服务厂家。http://www.microstrategy.cn/cn
Microsoft Analysis Services, 微软家的,https://azure.microsoft.com/zh-cn/services/analysis-services/。
Essbase, Oracle家的,https://www.oracle.com/business-analytics/essbase.html
TM1, IBM家的技术,https://www.ibm.com/cn-zh/products/planning-analytics?p1=Search&p4=43700052974990686&p5=1&cm_mmc=Search_Baidu--1S_1S--CN_CN-_-tm1_1&cm_mmca7=71700000065639752&cm_mmca8=%7btargetid%7d&cm_mmca9=CNCY2tjBuOsCFREgvAodlHoF2A&cm_mmca10=37366801656&gclid=CNCY2tjBuOsCFREgvAodlHoF2A&gclsrc=ds
Jedox ,https://knowledgebase.jedox.com/jedox/how-jedox-works.htm
icCube,https://www.iccube.com/
下载链接:https://www.iccube.com/download-page/
Vertica、https://www.vertica.com/
Amazon Redshift、https://docs.aws.amazon.com/zh_cn/redshift/latest/mgmt/welcome.html
Google Dremel、不开源,apache支持了一个dremel的开源实现项目,drill(http://drill.apache.org/)
Hulu Nesto、可以参考这篇博客https://blog.csdn.net/hulu_beijing/article/details/107538103
实际使用组合技术,也可以达到多维查询的效果,如Hive从HBase或者其他数据库中读取结构化数据再把SQL转换为mapreduce代码,达到实时查询的效果
ClickHouse, 异军突起,直接突破了Hadoop的生态,从分布式数据存储到数据处理全部解决,并且性能在传统的数据库解决方案的100–1000倍及以上。大量在应用
https://clickhouse.tech/
重点重点,这是开源方案,不要钱
PS: