在最近,无论是在和客户还是在培训活动中,都会问到建模的相关问题。什么是建模?建模是指建立数据分析模型的过程,在很多实践当中,不少客户和同学都会忽略这个过程,直接从数据源获取数据后,利用Power BI来去做相关的分析和展现。但是,我想告诉大家,从企业的角度出发,数据分析模型的建立过程必不可少!
所以,仅利用DAX写出复杂的计算公式,并不是建模的全过程。而恰恰相反,DAX应当写的越简单越好。也就是说,DAX并不是建模。
真正的数据分析建模过程,是根据企业的业务逻辑,而创建的数据表之间关联的过程,常用的建模思路通常有雪花型和星型,而在设计数据分析模型的过程中,常常会根据实际情况将雪花型和星型并用。最后,有了这样的模型,再配合DAX进行度量值的计算。一套完整的数据分析模型即可完成。
当然,有同学会仍然会有一些疑问:
问题一:为啥一定要有数据模型?我没做模型不也能用Power BI做出好的仪表板啊。
相信目前很多使用Power BI的用户都会有这样的疑问,在这里,我想分享给大家的是,作为一名好的商业分析师,能做出好的仪表板并不是终点,合理的架构和分析的思维同样重要。
问题二:复杂的业务逻辑也可以通过DAX的计算实现,我只要会写DAX,就不需要做数据建模了。
其实通过DAX来计算复杂的业务逻辑将大大影响性能,甚至有可能是几何倍数的性能延迟和计算工作量。这样的做法可以说完全失去了性能,有可能几万行的数据就让你的Power BI仪表板变成了“死缓”。而一个好的数据分析模型将轻松承载海量数据,再配合迭代的DAX计算方式,才能将Power BI的强大功能发挥到极致。否则,你的Power BI仪表板将毫无意义。
问题三:如果说数据模型是指数据表之间的关联过程,那它和数据仓库有什么区别?
他们最大的区别是业务与技术,数据模型是从业务逻辑出发来设计的,而数据仓库则是从数据的规范定义出发来搭建的。
好了,今天的分享也快结束了。本系列旨在帮助大家在使用Power BI成为商业分析师的道路上少走弯路,而在本篇文章中可能有一些地方或者概念一带而过,并没有详细介绍,如果大家感兴趣,可以留言给我们,大家一起探讨和研究。谢谢大家!