随着物联网、大数据的快速发展,数据价值的发掘与应用被企业开始重视,如信息化建设一样,企业开启了新一轮数字化转型,物联网、业务融合、大数据平台建设如火如荼的进行。那么在数字化转型中,决定企业成败的核心是什么呢?Gartner在《Data and Analytics Leadership Vision for 2017》报告中指出“数据和分析是一个数字业务平台的核心”。
数据分析平台渗透到所有的数据平台中,数据分析平台为各个业务系统的数据提供描述性、诊断、预测等数据洞察力。那么一款合适、实用的“数据分析平台”决定了企业数字化业务转型的成败。
纵观市面上相关的工具,从功能来看主要可以分为两大类:
1、数据可视化——新一代BI
新一代BI是相对于传统BI工具而言,Gartner定义新一代BI平台支持BI的分散和双模式管理数据发现方法,以满足来自业务用户和分析师对访问自助服务功能的日益增长的需求,而不是依靠专门的能力中心和/或IT团队来提供访问 分析。 新一代BI平台支持来自各种数据源的更高可访问性,敏捷性和分析洞察力的组织需求。
新一代BI工具降低了传统BI工具的部署和应用成本,以业务用户和分析师为对象,较少了数据分析过程中对于企业IT的依赖,让数据分析更贴近企业业务需求。
代表工具有:Tableau、Qlik、PowerBI、永洪BI、帆软BI等工具。
2、数据挖掘工具——机器学习/高级分析
高级分析平台,Gartner将高级分析平台定义为“一个或一组软件应用程序,允许数据科学家,统计人员和公民数据科学家以独立或一致的方式进行以下活动:数据导入,建模(例如, 预测,分类,聚类,关联分析,模拟和优化)和模型部署。
高级分析平台,是基于机器学习算法应用的工具,通过复杂数据建模,解决复杂的数据数据关系探索。同时也是大数据环境下,简单基于数据的描述和统计的“数据可视化工具”已经不能满足企业的分析需求,而对于预测分析、规范分析等复杂的分析应用需求在业务中不断迫切。
代表工具:SAS、RapidMiner、KNIME,开源工具R,Python等。
企业用户在数据字化转型中,如何选择一款合适的功能呢?个人认为需要考虑以下三点:
第一:功能满足
功能满足,即能够满足企业不同层次人员,不同类型的业务分析需求。比如快速的数据可视化分析和展现,同时还能支持复杂业务中高级分析的应用,利用数据分析解决业务问题。这是企业选择此类工具的基础。
第二:与现有业务数据系统的充分融合
数据分析平台承担的不仅是一个“分析工具”,还是各个业务数据平台交互融合的核心与关键,是企业数字化业务平台构建的枢纽和中心,那么与企业现有信息化系统的充分融合是重中之重。数据分析平台不能是一个独立承担分析业务的单独工具,二是联通企业业务数据价值的桥梁。
第三:操作简单
数据分析并不是一个新的产物和新概念,从“啤酒与尿布”的关系人们就知道了数据分析的作用和价值。但是数据分析技术不能被广泛应用的原因就在于其较强的专业性。市面上大多数数据分析工具的操作难度和学习周期都比较长,并适用于企业内部广泛使用。如果不想让数据分析还是集中在企业少数的人手中,哪些工具的易用性是必须考虑的问题。
综合以上内容,从企业数字化转型的角度考虑,面对复杂多样的业务需求,集合数据可视化分析(敏捷BI)与数据挖掘(高级分析)功能为一体,能够与现有业务系统无缝融合,操作简单的数据分析平台才是企业级用户的最终诉求。
而纵观市场,虽然很多企业都在宣传自己具备一体化分析功能的工具,尤其是国产工具,但是仔细研究,大多还是偏向于可视化分析和BI工具,操作难度确实降低了,数据挖掘、高级分析方面并不具备。今天推荐两款工具,一是SAS Viya,它是一款集可视化分析与挖掘分析为一体的数据分析工具。
正如它宣传一样,它是构建了一个大的平台,同时可运行多款SAS子产品。能够解决企业从数据治理、数据可视化到挖掘分析的全流程工作。但是在操作难度上降低的不是很多,而且租用付费的模式,多款工具同时采购会给企业带来很大的成本压力。
另一款工具是国产的一款大数据分析工具“Tempo大数据分析平台”,它重点为企业提供BI、数据挖掘包含自然语言处理的一体化分析方法的工具。
从功能上看,能够为企业提供多种不同分析方法和应用模式。BS的架构让它与企业现有的信息化系统能够更好融合。它也是Gartner评选的2017大中华区数据分析领域的入选产品,入选理由就是自助式数据分析和高级数据分析探索能力。相信Tempo大数据分析平台一定是具有自己的优势,否则怎么能得到Gartner咨询顾问的青睐。
数据字化转型和建设关乎企业未来的发展和命运,所以企业在工具、供应商选择时一定要从企业自身实际出发,选择一款最实用、最有效的数据分析工具。