现在,“数据中台”这个概念越来越火,但是数据中台到底是什么,服务对象是谁,目标又是什么?
数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享,并在 2018 年因为“腾讯数据中台论”再度成为了人们谈论的焦点。
——CSDN:VIP_CQCRE:【到底什么是数据中台?】
数据中台是对既有/新建信息化系统业务与数据的沉淀,是实现数据赋能新业务、新应用的中间、支撑性平台。
——百度百科【数据中台】
确实,数据中台只是近些年火起来的名词。而且“数据中台”这个词语,听起来就像是和“数据”和“中”有很大的关系,似乎就是中间件+大数据。虽然目前还没有一个定义来确定这个词语到底是指代什么,但是很明显的是,这个词语就是为了数据和中间处理而存在的。
既然这个技术涉及数据,那么这个技术将不可能外包给其他的什么公司或者个人。虽然非常无奈,但是物理隔绝确实能保证秘密不会被传播。所以,比起SpringCloud
、Odoo
、GoodERP
等这些个框架,还是不能够随意售卖、转让或者开源。
那么数据中台到底是什么?
数据中台是一套可持续“让企业的数据用起来”的机制,一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建一套持续不断把数据变成资产并服务于业务的机制。
——知乎:Alan:【数据中台(一)什么是数据中台】
数据中台是在政企数字化转型过程中,对各业务单元业务与数据的沉淀,构建包括数据技术、数据治理、数据运营等数据建设、管理、使用体系,实现数据赋能。数据中台,是新型信息化应用框架体系中的核心。
——百度百科【数据中台】
中台是一种经营理念;中台是一种组织形式;中台是“平台思维”的自然演进
——节选自第十届全球软件开发大会:菜鸟数据中台的演讲
看起来还是有点深奥。而且越来越多的专业词汇让你感觉到更摸不着头脑了!
让我们来看看知乎:Alan:【数据中台(一)什么是数据中台】中附上的图片:
到这里,基本上就对数据中台有一个概念了:
数据中台实际上是企业在对用户行为进行分析时,为了将用户数据最大化利用的平台。
那么,什么是最大化利用?(注:因为科技能力限制,所以每个时代都有每个特定的最大化限制)
在很早之前,甚至电商还没有起步的时候,你的小蛋糕店(La Soleil)都是通过你自己的大脑记住常客的偏好来选取顾客最喜欢的口味。
但是,你的猫娘女仆们实在太可爱了,为你吸了大量的粉,生意很快做起来了,不光是为了蛋糕,还有为了猫娘慕名前来的顾客,甚至还有预定的顾客,你越来越忙不过来了。所以,你用你超强的代码能力,做了个推荐系统出来。用户注册之后,系统便会记录每一次下单的偏好特点,并制作适当的模型进行预测。用户再次下单时,就能看到自己的偏好摆在首页上,非常方便。
这时,你的妹妹(这即视感太强烈了啊喂)当起了你的蛋糕店的公关,开始推广、联动,甚至积极出周边,很快做出了蛋糕店以上的很多服务。你的小蛋糕店规模现在已经不得了了,甚至歪果仁都慕名而来,推荐系统的日活甚至超过了10万。于是,你决定将小作坊升级为大企业。这个转变并不容易,所以你想到了数据中台。你希望数据中台为你完成这些任务:
听起来这完全就像是一个很普通的ERP
系统?不不不,远没有这么简单。细心的你应该能注意到这些事情:
通过ERP
和大数据的结合,也就是具有灵魂的业务加上能力超强的工具,就成了。听起来这个普通得不能再普通的ERP
系统瞬间就变成了一整个生态,包括了企业员工、企业设备、企业自己、合作企业、蛋糕客户、手办客户等等在内所有的数据整合在一起,通过数据挖掘、数据分析、标签化、智能调度、可视化、监控告警等等技术,完成企业方方面面的管理和经营;作为总经理的你面对每一个问题时都能够从数据中台中找出对应的源数据和经过分析后的数据来进行决策。这听起来就像是世界500强的作风啊!
看了以上很长一段对于数据中台运行生态和运行机制,我们接下来再讨论数据中台的能力和目的。
数据中台应当具备三个能力:
1、在中台能力及资源充足的情况下(包括业务知识、技术能力、人才积累),提供数据产品、数据服务。
2、在中台业务能力及人力资源不充分、但体系相对成熟的情况下(包括数据体系、技术体系),提供平台级别的能力,包括数据平台能力、技术平台能力、建模平台能力等,甚至是数据本身。
3、在中台人力资源和对业务领域知识理解不充分,平台级别能力也无法满足要求的情况下,作为算力基础平台提供服务。
——知乎:帆软:【一文详解数据中台,别再跟数据平台搞混了!】
说白了,这三个目的旨在应对三个不同的场景:
GoodERP
对Odoo
进行二次封装之后卖其他的中小型企业,并根据需求进行二次开发和部署;简直就像游戏的难度分级一样:从简单到困难,再就是噩梦难度;从不需要太苦思冥想的简单重复劳动,到需要动点脑子针对特殊的业务进行特殊的编码实现,最后到时时刻刻都需要认真思考,针对每一个细节进行最大的优化。如果真的要做到这一步,我们将会更详细地要求:
决策支持类:主题报表(月度/季度/年度/专题)的大屏数据可视化展示
数据分析类:
BI
、商业智能、OLAP
分析、数据挖掘、数据驱动的机器学习数据检索类:全文检索、日志分析、数据血缘分析、数据地图
数据共享开放类:实时数据订阅、离线数据接触、数据
API
接出——知乎:帆软:【一文详解数据中台,别再跟数据平台搞混了!】
这些就都是只有具有超强算力的大型公司才能够完成的任务了。
不难发现,数据中台甚至都包含一定的业务能力,如果我们放入鸡蛋、面粉和糖(代指源数据),出来的可就是蛋糕(代指最终成果)了;而普通的大数据平台只不过是分析数据的工具而已,如果单纯的放入鸡蛋、面粉和糖,可能就只有一团白色的浆糊(代指半成品、中间变量),剩下的烘焙、成型、涂奶油还得我们另外寻找其他办法;再深挖一些,大数据平台中使用的Hadoop集群,就更是完全没有任何其他功能的数学分析工具而已,放入鸡蛋、面粉和糖,它甚至只能在你混在一起之后巧妙地重新分为三类(Hadoop真的是物理意义上毫无感情的机器)。
是不是有点能理解了?