思迈特软件Smartbi:数据库、多维数据库及数据仓库的关系

第一阶段

企业信息化达到一定程度之后,一定会有报表的需求,此时直接从业务系统的数据库进行查询。

第二阶段

直接查询业务系统数据库,很容易对业务系统造成影响,这时可能会将数据抽取出来,放在一个镜像数据库里进行查询。

第三阶段

当数据规模越来越大,报表与数据分析的需求也随之增多。开始对数据进行系统化的规划与管理时,数据仓库的雏形也已建立起来。

关系型数据库的星形(或雪花型)结构是数据仓库的常见形式之一,但不是唯一的形式,只要能做到将数据有序管理,基本上就可以称之为数据仓库。

当建立起心形或雪花型的数据仓库的时候,已经可以做一些基本的数据分析了。但是会有一些弊端。星形或水上行结构虽然模拟了多维数据模型,但是其本质上还是关系型数据库的表字段以及数据行的模型。无法做到真正意义上的面对业务时的数据分析。而且这种直接建立在关系型数据库之上的模型,很难让业务人员自主进行数据分析。

第四阶段

基于关系数据库星型或雪花型结构所建立的数据仓库,虽然可以进行数据分析,但分析能力不强。

星型或雪花型结构虽然模拟了多维数据模型,但其本质上还是关系型数据库的表及字段模型,无法做到真正意义上面向业务的数据分析,而且这种直接建立在关系型数据库之上的模型,很难让业务人员独立进行数据分析。

第五阶段

由于多维数据库维度既业务的特性,所以基于多维数据库所建立的数据体系的分析能力要强很多,而且也能将让业务人员自主分析这一目标落地实现。

多维数据库向外提供维度与数据集市模型,数据的实际物理存储则对外屏蔽。关系型数据库可以作为多维数据库的一种底层实现,当然还有其他的方式,比如数据块文件、分布式存储等。

关系型数据库的星型(或雪花型)结构容易与多维数据库的维度与数据立方体结构产生一些混淆,主要是由于以下两点原因:

多维数据库可以使用关系数据库作为数据实际存储方案;

多维数据库的MDX与关系数据库的SQL在语法结构上的类似。

以上两点原因使得在关系数据库的星型(或雪花型)模型上使用SQL进行查询被误认为是可以进行多维分析的,实际上这是非常错误的认识,原因在于表及字段模型和维度及数据立方体模型本质上的区别。

以上是思迈特软件Smartbi的分享,更多行业干货可关注我们下一期的分享。思迈特软件Smartbi是知名国产BI品牌,专注于商业智能BI与大数据BI分析平台软件产业的研发及服务。经过多年持续自主研发,凝聚大量商业智能最佳实践经验,整合了各行业的数据分析和决策支持的功能需求。满足最终用户在企业级报表、数据可视化分析、自助探索分析、数据挖掘建模、AI智能分析等大数据分析需求。

现个人版提供全模块长期免费使用,有兴趣的小伙伴可登陆官网免费试用~

你可能感兴趣的:(数据挖掘)