2019年9月26日,我应邀参加了中国信息协会主办的“2019(第二届)中国互联网+产业创新合作发展论坛”,并作了《数据中台促进“互联网+”产业创新》的主题报告。会后,很多朋友对我的观点很感兴趣,希望获取发言PPT。这里通过微信公众号刊发,并希望能够得到更多人对这个问题的关注。
ppt图片后有演讲文字解读
摘要:当前我国电子商务(互联网)企业掀起的(数据)中台战略仍然具有重要意义。这表明,我国互联网企业已经走出“复制模仿”的困境,开始独立思考自己的业务系统规划了。
Supercell,芬兰移动游戏巨头,成立于2010年,拥有《部落冲突》、《卡通农场》、《海岛奇兵》、《皇室战争》和《荒野乱斗》等全球热门游戏。
据说,2015年12月马云亲自率队到Supercell公司进行商务拜访。马云对Supercell的高效运营无比感慨,将其经营秘密概括为中台战略,要求阿里巴巴按照“大中台、小前台”的组织原则进行公司架构改革。
不管上述“中台”的马云说是否属实,但“中台”的概念确实在近年来不断发酵并从去年开始流行起来,日益成为行业共识,尽管大家对如何认识这个共识还没有达成一致意见
当前关于“中台”问题研究存在诸多问题。
定义不清。从上面这些定义来看,人们对于中台的解释还是很不一致的。有的定义甚至还谈不上是严格的定义,充其量只能说是对其某方面属性的简单描述(如定义3以及玄雄有关中台的访谈观点),还谈不上是对其本质属性的界定。
缺乏明确的架构模型。阿里巴巴共享业务事业部的架构图也被阿里的人看作是解读阿里中台战略最常用的一个图,讨论阿里中台战略的时候都要用到,但这个图也不是太清楚,比如说
“共享业务事业部”并没有具体描述各模块的数据流转关系,其8大模块颗粒度并不一致。oppo公司发布的针对公司内部的数据中台的架构,还有一个是袋鼠云数据中台战略,是一家脱胎于阿里云技术架构的一个技术公司,专门给阿里云提供技术服务的企业,这家企业也算是阿里系的一个部分,他们对于中台的认识和oppo存在着很大的不同,特别是对业务、技术、方法是有差别的。
无法区别“中台”与平台、前台-后台、大数据等概念之间的相互关系。从某种意义上讲,如果能够科学合理地设计后台并有效地处理业务和数据之间的衔接关系,也就不会有所谓的中台的存在了。因此,所谓的中台战略,必须说清楚中台是如何从后台分离出来以及分离之后的中台与后台的联系和关系。不过,从目前众多的文章来看,我们无法得到满意的答案。上述众多中台的定义与大数据关联不够。当前人们将“中台”划分为业务中台、技术中台、组织中台和数据中台等几类,并从模块化、组件化、通用性等几个核心特征去界定其各自属性。但是,光有“模块化、组件化、通用性”等特征是不够的,无法深入地分析“数据中台”的独特性。所谓的“数据中台”与“业务中台”之间有着本质的不同,不应该简单地以“模块化、组件化、通用性”去模糊、掩盖其相互间的巨大差别,而“数据中台”的这种独特性只有从大数据中去寻找。
我们应该怎么样认识数据中台?我列了几个原则:
一、应该遵循数据管理科学发展的基本规律
数据中台作为单独出现的一个新认识架构,或者说是新的技术产品和方法,我们就应该有一个科学合理的认识体系,这个体系怎么来?我想是要遵循这些年来在数据科学发展的基本规律,我把数据分为四个阶段:
1、数据库从业务系统建设中分离出来,结果就是出现了独立的信息资源中心,数据中心或容灾备份中心。
2、信息资源分化出基础信息与业务信息,出现了独立的基础信息管理中心。
3、元数据与数据库中结构化或非结构化数一的分离,元数据成为数据库与业务应用之间的又一交换平台。
4、作为特定的元数据的具象化,主数据从元数据中独立出来,主数据库成为实现数据资源共享交换的独立基础数据库。
我们要讨论数据中台,应该是在这样一个历史的轨迹下进行科学合理的建构。
我们都知道随着信息化业务的应用越来越复杂,人们对于问题的认识考虑的要素也越来越多,如何科学合理地对这些复杂的现象,各个部分之间的关系进行科学地区分,我们一般都喜欢用信息架构去表述,去理清各方面的关系。第一张图是企业信息化三大架构,第二张图是每个联邦政府组织架构,这张图也是我们经常讨论信息架构的时候用到的美国政府在用信息架构的技术方法去思考美国联邦政府电子政务的总体架构的图形,这是我们讨论架构理论对我们数据管理科学的基本概括。
二、数据中台是中台思维的核心
刚才在介绍美国FEA关于联邦政府组织信息架构里分五个层面,一个是绩效参考模型,第二个是业务参考模型,第三个是服务构件参考模型,第四个是数据参考模型,第五个是技术参考模型。我抽出了绩效参考模型、业务参考模型和数据参考模型,最后一个是技术参考模型,随着时间的推移有相应的要求,这两者相对来说好区分,我们平常就是三个问题,一个是业务参考模型、绩效参考模型和技术参考模型,对我们构建数据中台有密切的关系。
业务参考模型和服务构件参考模型其实在逻辑上具有很紧密的关系,大家如果能看到,服务构件参考模型是指每个政府机构内部都存在,都需要的共性的业务模块,从整个架构来说把每个部门都抽出来共同统一地开发和管理,方便整个电子政务架构的设计,服务构件参考模型就是业务中台的部分,数据参考模型是作为前面无论是业务参考模型还是服务构件参考模型数字化具体实现。
现在所有的业务都要落实到数字化层面,数字化层面表现为数据以及对数据的处理,也就是数据参考模型要完成的工作。但是在数据参考模型里并没有说数据中台是什么,数据参考模型是指对于整个电子政务架构数据的基本认识。数据中台我们没有办法从数据参考模型里分出来,没有办法像前面从业务参考模型里分离出服务构件参考模型,也就是业务中台的内容。
三、合理地借鉴现有创新
刚才也谈到了在电子政务领域,其实已经有了中台的思维以及中台的做法,刚才谈到的FEA关于服务构件参考模型,其实在中国的电子政务建设过程中,2002年的国家信息化领导班子关于加快建设电子政务的指导意见,2002年的17号文件专门谈到对共性的电子政务的建设思路,从现在来看也是一种数据中台的思维,
我们当前互联网企业大力倡导,热烈讨论的中台的思维,其实在20年前已经在电子政务领域大量地出现了,为什么会出现这种差别?这里面我是这么想的,政府更容易注重整体的架构,因为政府是一种相对稳定的存在,所以就容易发展出中台的思维,我国的工业企业无法发展信息化的架构,因为我们的工业信息化相对落后,根本讨论还没到建构中台的层次。我们的互联网企业,像BAT企业也是最近这些年做大做强了,变得复杂了,于是我们开始去反思我们应该做得更好,可以做得更好,怎么做得更好呢?我们的架构需要进行优化,我们的不合理的地方需要改革,这样才产生了中台的思路,我想这是我们谈中台的时候必须认识到的一个基本的发展背景。现在都谈论中台,就纯技术,没有认识到为什么这几年来中国的互联网企业这么热衷地讨论中台问题,和我们的历史发展阶段有一个基本的关系。
四、如何建构数据中台的理论架构
谈到FEA服务构件参考模型的时候,我们也谈到了FEA从业务参考模型里汲取出了服务构件参考模型,我把服务构件参考模型作为业务中台的内容,我们在数据参考模型里能不能也像前面构建出一样数据构件参考模型呢?我觉得这是我们思考数据中台的一个基本出发点,关键就在于如何认识大数据的管理属性,也就是如何认识小数据,我把小数据看作是对于大数据管理属性的数据,小数据非常符合人们对于中台思维的模块化、组块化、通用性等几个核心特征,所以关键就是怎么样围绕这几个特征构建我们对于小数据的认识。
我去年专门写了一篇关于小数据大价值的文章,我针对小数据做了一个深入的研究,我那篇报告和吴院士做了一个交流,吴院士对我的报告表示了赞赏。当前我们对小数据存在着很多不同的认识,但是我们认识小数据的时候应该明确几个问题。第一个就是我们采集架构处理海量数据同样都是具有某种目的的理性行为,我们说大数据不是说盲目的,肯定是为我们的业务所需要的,在这个业务里发生的各种各样的有意无意的数据。第二个就是要体现出某种价值,数据必须能够表达一个完整的信息,我这边的这张图,DIKW的模型就是表达数据、信息、知识、智慧的递进关系。第三个就是一条完整的信息应该包括一个完整的主体、客体和行为,所以我们在讨论小数据的时候,应该明确这几个基本的要求。
我们对小数据的属性做个界定,我这边说了五点,小数据应该与数据容量无关,应该包含特定的含义,应该是结构化的数据,当然也可以在结构化里引用非结构化的,小数据应该是对于大数据的数据之间的宏观描述,小数据和大数据也是形影相随的。小数据就是描述并管理大数据的数据属性的数据,我对于小数据做了一个区分,分为三大类,第一类是关于特定类型的大数据的数据属性的数据,第二是描述大数据终所包含的主体、客体的基本特征的管理数据,第三是描述大数据中星微过程特征的数据。第二种又包括两种,一种是对于大数据终所包含的主体、客体一般属性的规定,第二个就是满足某类主客体属性的所有对象的表述。
我们把分类形而上做进一步的抽象和提升,我们发现其实也是某一种元数据和主数据,我们讲这些小数据都是可以用现有的技术和框架去解决的,所以小数据并不是没有意义的东西,我们可以描述,表述的确定性的东西。
我引用DAMA国际出版的一本关于数据管理指示体系指南,有对元数据和主数据的认识,从元数据来看,元数据包括了很多我们对于数据的基本属性的认识,我们说什么是元数据,是关于数据的数据,这里有两张表,包括了16个领域,比如说业务分析、业务架构、业务定义、业务规则、数据治理、数据整合、数据质量、文档内容管理等,包括我们当前的信息架构建构的各个方面的内容。
主数据就不具体多说了,我对于主数据做了一个界定,什么叫主数据?是指满足跨部门业务协同需要的,反映核心业务实体状态属性的企业组织机构基础信息,现在我这个主数据的定义成了业内的共同接受的概念。
我对其他数据做了一个界定,主数据、交易数据、业务数据,这里面分成主数据和交易数据,交易数据就是每一次产生业务的时候是不一样的那些数据我分为交易数据,时间关系就不具体多说了。认识了小数据的属性之后,从刚才的介绍来看小数据就非常符合当前我们讨论数据中台的时候,对于中台理念的认识,所谓的数据中台,基于FEA的模型往下走,对数据模型往下细分就是数据构件参考模型,就是数据中台,这么理解数据中台我觉得是非常具有逻辑的合理性。
我们在建构数据中台架构的时候,或者说企业在开发数据中台产品的时候,我们说怎么样建构数据中台与整个企业大数据系统之间的关系,这两张图应该是我们基本的出发点,当前很多关于数据中台的产品白皮书介绍的时候,他们对于数据中台其实就是把整个企业的信息架构重新地说一遍,内容和以前的其实没什么差别,我们对数据中台的核心属性根本就没有认识清楚,如果从小数据的思路去理解,基于FEA,美国联邦政府组织架构的架构模型去建构数据构件参考模型理解数据中台,我想对于科学合理地建构一种有效的数据解决方案,我觉得应该是最科学合理的,特别是数据中台现在看作是我们中国人对于信息架构的理论的创新,既然是创新,那就不能含糊,一定要有科学的内涵,要有一个科学的理念,不能是含含糊糊的,前后矛盾的,或者和以前的挂羊肉卖狗肉的状况。
总结
当前我国电子商务(互联网)企业掀起的(数据)中台战略仍然具有重要意义。这表明,我国互联网企业已经走出“复制模仿”的困境,开始独立思考自己的业务系统规划了。这为“互联网+”产业创新提供了最好的土壤,不仅为我国开发自己的信息架构和信息化解决方案、设计自己的数据库产品提供了最好的条件,也将有力地促进我国软件产业的创新发展。从软件发展历史来看,信息架构理论的进步与软件产业发展相影随行、相互促进和提高,因此数据中台的建设也将有力地推进我国软件产业创新发展。
(本文根据国务院发展研究中心研究员李广乾在“2019中国互联网+产业创新合作发展论坛”上的演讲内容整理而成。文中涉及的有关数据中台问题的分析框架是目前国内最为理论化、体系化的数据中台问题分析框架,此外李广乾还提出了“数据中台就是小数据的治理机制”的观点。具体内容详见附件PDF文件。)
信息化观察网 2019年09月27日