作者 | 李谦恒
数据工程师。逻辑重于代码,高效胜过勤奋。崇尚life work balance。
本文主要面向对象是,对 BI 完全不了解,或只是初步了解的人。
从宏观角度介绍了 BI 的基本信息,并附以大量的图表作为说明。期望能帮助大家对BI有更深层次的理解。
如有不同见解,也欢迎在评论补充。
至于 BI 中更深层次的东西,笔者将会在未来逐一进行介绍。
首先引用百度百科的定义:
商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。
通俗一些的解释:
BI 并不仅仅只是一个分析软件,而是一套完整的数据分析解决方案:它将不同数据源(如 ERP、CRM、OA、HIS、EXC 等数据文件)的数据,在整合清洗——保证数据准确性后,进行针对性的数据分析和处理,最终为企业提供报表展现与可视化图表分析,从而为企业提供决策支持。
在数据化建设较差的公司,也会将 数据可视化与 BI 直接划上等号。
以下是一些经典的 BI 展示:
不得不承认,BI 给人的第一印象,的确是漂亮的图表。
在实际开发中,整合数据源、清理数据等步骤往往并非由 BI 进行处理,具体分工见下图:
正如上图所示,BI 往往与数据仓库技术、olap 引擎有着直接的上下游关系。其中数据仓库主要起到统一数据源、保证数据准确度的作用;而 OLAP 引擎则帮助 BI 加速查询。它们组合在一起,最终使用户获得良好的数据分析体验。
BI 对企业的作用是通过两方面实现的,业务方面和技术方面。
数据呈现
我们可以通过 BI 直观、全面的展现企业日常业务的情况;无论是从整个集团的视角出发、还是从业务线或者部门的角度出发。
下图即为一个标准的 数据呈现(大屏)BI。决策层可以通过该图表快速、直观的了解到目前公司的会员数量和相关的销售额——这也往往是决策层最关心的两个指标
为了保证数据更新的实时性和展示的美观性,纯粹的数据呈现往往并不支持联动、下钻、上卷等 BI 常见操作。
联动、下钻、上卷都是 BI 的专业术语,未来会逐一介绍。
异常监测
专业的业务人员会有一些核心指标来监控业务,我们完全可以将其通过 BI 实行可视化监控;
下图即为 某在线教育对每日课程销量的监测,运营人员通过 BI 可以迅速发觉异常变化,从而及时作出调整。
智能预测
在大数据的基础上,BI 也能基于简单的统计学,提供一些拟合线,来帮助业务人员进行相关分析。
下图即 对某超市销售额进行预测。
特定建模分析
特定的建模分析通常是由精通业务的业务人员提出,通过合理的建模找出业务中可能存在的问题,将其反映出来并最终回归到业务,形成闭环决策并不断优化的一个过程。
业务建模可简单,可由一个或多个图表组成,也可复杂,通过一组或多组数据图表支撑。
如下图,即为对客户销售额建立的模型。通过该模型,业务人员能够快捷的了解到目前 CRM 的客户情况。
帮助业务进行快速智能分析
尽管 BI 能满足大部分常见需求,但资深的业务人员总会有一些突如其来的灵感。这种灵感稍纵即逝,如果等到数据部门提供数据再进行分析——可能为时已晚。如果有BI的话,业务人员可以立刻基于业务数据进行灵活分析,从而验证想法。
减少人工处理,提升工作效率
某些指标对每家公司都是非常重要的,无论该公司是否存在 BI、数据部门。
例如 毛利、成本、客户。
在没有 BI 的情况下,如果公司想要收集汇总这些指标信息,大多数时候都需要业务人员手动从各个系统提取数据,然后在 exc 上汇总——这个过程无疑是冗长、枯燥且毫无价值的。同时,还容易产生以下问题:
如果有了 BI 和对应的数据底层,就可以自动化生成相关报表。
智能报表 也属于广义上的 BI
数据准确性无法保证:手工计算,就有可能出错。无法避免
数据及时性无法保证:手工计算的效率由使用者决定,无法控制
修改复杂:任何业务的新增、修改。都需要对复杂的 exc 公式进行修改。
结果倒逼,统一指标口径
成熟的公司必然有一套统一的指标口径;但在其野蛮生长中,指标、维度可能会缺乏统筹规划,从而产生一些遗留问题。
举个例子:库存、销售、运营口中的"销售额"往往不是同一个"销售额"。
最常见的口径不一致问题,就是时间口径不同;销售额可以依照 下单时间,支付时间,发货时间,收货时间,完成订单时间 等不同角度进行分析。在没有统一口径的情况下必然会出现误解。
BI 的使用者必然包括决策层。因此,指标必然会以决策层认可的口径为主,从而消除争议。
整合信息孤岛,统一分析平台
数据仓库是每家公司都应有的东西,但实际上大部分公司并不完善;但分析、统计的需求并不会因为没有数仓而停滞。这个时候,BI 就可以启动汇总数据源进行统一分析的效果
并不推荐长久使用 BI 作为数据汇总层。
正如上述描述,BI 更多的是从业务方出发,帮助业务解决问题。它将繁杂的数据库底层进行整理汇总,形成有效的指标维度,让 BI 使用者可以直观、清楚地看到他所关注的数据,从而帮助整个企业更好的发展。在数据的自由探索中找到原因,避免“拍脑袋”式的决策。这就是 BI 的作用,而非仅仅的数据报表呈现。
BI 应用场景广泛,以下逐一枚举。
大屏
大屏就是我们在 街头、展览会上常见的超大屏幕,其上大多充满了含义不明的图表。举几个例子
大屏的最大特点 就是炫。据笔者观察,其上的数据大多都是“虚荣指标”——除了好看外一无是处。但换个角度,对外宣传时,需要的就是好看。
设想一下,假设超市、医院、 会议室能有一个大屏。会吸引多少目光的注意力;增加多少回头客。
大屏的开发,有以下几点需要注意:
因为展示效果等问题,大屏相比其他 BI,缺少交互性,无法进行联动、钻取等操作。
硬件成本较高——大屏很贵
BI 开发成本较高——需根据硬件实际大小进行反复调试,才能保证最终结果的展示。
数据 要求较高——主要是指数据的实时性;
因为面向对象主要为企业高层,因此驾驶舱的数据准确度、美观度一般都是最高的。相对而言,开发成本也是最高的;
相比大屏来说,驾驶舱可以自由下钻到任意主题的详细看板中。分析性更强
驾驶舱则要注意这些:
数据准确性非常高——它不像大屏,错了也没有人知道。驾驶舱对接公司决策层,不允许有任何的数据误差。
美观度——领导要看的东西,你自然要花点功夫去精心调试。
看板
看板(dashborad)即为最基础的 BI 展现方式。
相比 大屏、驾驶舱而言,dashboard 并不那么浮夸,它的主要使用对象为一般的管理人员和运营人员。一般来说,看板也可以自由的钻取、联动。从而帮助业务人员进行更好的分析。
移动端
部分 BI 产品也支持移动端展示,内容一般为核心指标。
移动端开发时,需要特别注意不同手机的适配度。必要情况下,可以拿用户的实际手机款式做针对性调整。
自助分析
并非所有的仪表板,都一定由数据部门来开发完成。有能力的业务人员更希望自己可以随时进行制作,而不受数据部门的约束。因此在数据部门提供数据底层的情况时,业务部门也会亲自上阵进行开发。
BI 的开发,与常见的项目开发并无两样
确认需求——需求分析——指标维度梳理——源数据和数据质量确认——结果表设计——ETL 开发——可视化实现。
有几个重点需要注意:
第一步要确定 BI 的最终使用者,直接与使用者沟通会节省大量的时间。
需求分析结束后,一定要与最终使用者进行文档确认,确保双方理解一致。
不要轻易相信源头提供的数据,获取到数据后自己一定要初步检查,确保数据质量。
demo 先行——尽早确定使用者想要的BI样式,免得反复调试浪费时间。
Tableau 毫无疑问的市场王者,也是目前全球最易于上手的报表分析工具,并且具备强大的统计分析扩展功能。它能够根据用户的业务需求对报表进行迁移和开发,实现业务分析人员独立自助、简单快速、以界面拖拽式的操作方式对业务数据进行联机分析处理、即时查询等功能。
但 Tabealu 也有自己的缺点:最大的缺点就是价格过于昂贵。对于大部分公司来说,如此昂贵的 Tableau 性价比并不高。
帆软是目前国内最大的 BI 厂商,合作厂商也相当多;产品线也遍及大屏、移动端、智能报表。可以说是最适合中国中小型企业的 BI 了。
FineReport 本是一个智能报表软件,但由于集成了大量图表,相比其他 BI 开发效率虽然稍慢,但是自由度更高。
Superset 是一款由 Airbnb 开源的“现代化的企业级 BI (商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。
Superset 的缺点就比较多了
没有提供图表的下钻功能
不支持多图表间的复杂联动
处理大数据集时容易暴毙
权限管理和图表管理的功能设计基本为0
但它是开源的——你无法要求一个东西又免费又好用,因此技术能力较强的公司可以考虑。
正如开题所言, BI 并非简单的数据可视化,而是一套极度复杂的商业解决方案;
如何做到企业数据化?数据驱动业务?数据治理?
仅凭几个EXC是远远不能满足的——只有建立起良好的 BI 生态体系,企业才能真正迈入数据化。
另一方面,BI 的表象是可视化分析报表的呈现,但它的本质还是业务问题、管理问题。
如何通过 BI ,使得业务、管理能够不断优化,这才是值得我们深度思考的。
全文完
以下文章您可能也会感兴趣:
缓存的那些事
Java 并发编程 -- 线程池源码实战
Lombok Builder 构建器做了哪些事情?
WePY 2.0 新特性
SSL证书的自动化管理
聊聊移动端跨平台数据库 Realm
苹果在医疗健康领域的三个 Kit
响应式编程(下):Spring 5
响应式编程(上):总览
Web 与 App 数据交互原理和实现
我们正在招聘 Java 工程师,欢迎有兴趣的同学投递简历到 [email protected] 。