2021年年底因为某客户要求将大数据中台做拆解,分拆设计考虑要可行性、合理性,目的是避免被某一家供应商绑架,由此有了一次很深的中台架构方面的思考,借此又深度思考了整个集团企业IT系统架构方面设计的重思考(客户系统包括N个客户受理系统、计费系统、网络系统、财务系统等等),有了一个整体构想,后和行业多个专家分别做了多次深度交流沟通。下文是和某资深架构规划朱博士的沟通,记录下这次对谈过程原因是:一方面记录人生经历了一次不同寻常的思考之旅,另一方面也希望可以给有缘人一点启发。
我:朱博士,我最近一直思考it 系统如何实现像造车自动驾驶那样的能找到类似的中枢大脑, 让其他环节只做执行,比如踩油门 踩这一个动作,有了一些想法想和你做个沟通,也不知道这会不会有点不切实际。
朱博士:嗳,老纪,你这个可能思考的很深,是吧,睡觉睡的时间挺晚的啊。对,其实你的这个想法应该是我们现在所说是所谓的自动化系统,假设在当前现实世界中找到有个对照、有关联关系的系统的话,应该就是数字孪生系统。
朱博士:数字孪生系统,比如说一个车就是一个孪生体,一个房子就是一个孪生体。这些孪生体中管理车,管理房子的系统,背后有对应的智能OS、智慧楼宇的这些系统,它应该就是做了到利用数据驱动机器实现自动化的这种形式。但是它是允许有个human的入口的,就是允许人在这个过程中能够干预,需要干预的时候可以一键停止,一键删除,或者一键某种操作的,也就是说是要给人留有可控制空间。人如果不操作的话,机器它就按设计好的流程来做,比如说温度高了,这个房子就可以自动降下温度,也可以自动调节这个温度,或者调节湿度等。
朱博士:当然也可以在动态情况下管理电梯的自动运行,比如上下楼、报警啊,这些类似的系统相当于一个叫智慧楼宇IT管理系统来管,它肯定是通过捕获各种信息来感知的,同时它还需要不停的逐渐的去升级,将来能够越来越精细化的感知,能够去做驱动现有的东西做决策,比如说是往楼里某单元户送东西,这个时候就要驱动一个自动驾驶的小车来送东西啊,还有一些其它决策类的事情。
朱博士:回过头来说,你说的这个IT系统,我们如果可以比较可以直接对应的话,在电信行业的比较直观的就是BSS和OSS系统。它们也是各负其责的,各负其责的话,它就不能是一个中枢大脑,它要是一个中枢大脑的话,这个太复杂,或者说是没法儿用一个大脑中枢去全部做,如果有的话,它应该是多个类似的中枢大脑,每类系统有一个自己的中枢大脑,然后的话,它们有一个更大的指挥系统去协调,这些之间的关系有点像人与组织一样,每个个体成员都有各自的精力,同时需要有一个中间组织来互相管理和协调的他们。
朱博士:这样,那我们现在可以看到有些系统慢慢地可以做成了自动化,类似于CEM系统的这种,对吧?CEM的话,客户的注册,客户的这些注册方式,通过语音,通过其他的方式能够去注册,注册了以后这个系统本身,而不是通过人,它能够利用机器学习的方式,或者是定时、定期的,按照人的这种模式,由系统它自己来联系与这个客户进行交流,那这个系统来做联系这些人的事呢,未来可能就是一个数字员工,对吧,未来会有不同类型的数字员工。
朱博士:那对应到运维系统,就有可能是这种IT自动化运维数字员工。数字员工它能够来去查找各类系统日志,它能够去用AIOPS的方式来去分析,特别典型的是在网络维护方面,慢慢地原来有很多有人工运维的方式转向由机器来自动去做运维。而且自动驾驶的网络,就是你刚才说的自动驾驶的车一样,就是Autonetwork,它的目标就是把网络能切片,网络的资源回收、网络运营这些事情,都是可以由这个自动驾驶网络的大脑来做这件事情。这个中枢系统呢,它肯定不适合别的像BSS里的受理这些东西了,所以应该是每个IT系统本身呢,它都会逐渐自动化,形成各种各样自动化的流程。
朱博士:而这些IT系统之间他们再交互的话,可能是在下一个阶段,它应该是有每个不同的阶段,所以它会有延续演进的状态。现在逐渐已经有一些it的流程在减少人的这种操作的事了,在自动化方面,有咱们现在有的类似于RPA自动化流程,一些流程自动化,在再加上这个数字孪生系统,再加上这个数字员工啊,这些不同的目标,最终都是朝这个方向的最终目标在发展。
我:朱博士,我在想这件事情的这个原因在哪儿呢?现在讲一个东西叫治理,我的想法是有没有一个好的方式,让系统它做啥,它就做啥,就是所有的想要做的事情,人为提前设定好输入给机器,然后机器去照着这个做就行了。比如说CRM系统里面,比如受理呀,它的整个逻辑环节里面假如都是无瑕疵的处理逻辑,然后去让系统去执行,执行完了之后,它就落地到后台嘛,落到后端会把这些CRM的数据,比如同步传给比如说计费的数据,同步传到数据中台等其它系统。
我:如果一切都能定义的好话,数据我想是不是其实可以不用治理的,因为设计已经告诉我咋做,我就照做完了。跟你前面讲的那个元宇宙里数字孪生这种场景一样,我一切都设计的很好,那我是不是就可以不用治理了。但是国外的人还出一本书(DMBOOK2),叫数据治理,然后现在国家\各个地方还都在提数据治理种现象。我再举个例子给你,听一下。
我:比如说我们现在行业讲做全域融合对吧?BOM拉通,那BOM拉通的时候,你拉通的是什么?拉通的是前端业务系统产生的事实数据,实际上是发生后的数据,并且它都是实例数据、这个实例数据关系也都落好了,然后你就把他拉通了(结果),但是结果不一定就是真相,比如我们在这个生活。生活中来说你有这个关系,但并不代表就是说你是真实的(比如婚姻关系下出轨问题),驱动我思考怎么样,就是说整个环节里面我不质疑的话,我是怎么样把这个环节都解决掉,这个意思。
我:我想找到本质,从本质解决。现在BOM拉通是拉的结果的关系,而不是本质上的源头。
朱博士:如果用从数据治理的这个角度来说的话,其实我觉得最关键的应该就是说是那个这个模型,就是这个模型是要统一和标准的,就是这种数据的模型对吧,你要是放在一个人上看,体重,身高呀,你对它有个全面的描述,这些东西是要有标准的,有了标准模型的话后面无非就是从源系统中Copy这些数据过来了,应该就是现在说的自动化采集,并且转换到这个模型中,甚至以后,就像你刚才说的以后这些模型呢,就是包括他这个怎么来表达一个什么叫客户啊,或者什么叫特征呀,这些东西都是统一的。
朱博士:这些东西是可以不需要治理了,对吧,那就不需要治理的原因是说明大家用同样的语言在说话,同样的语言在说话就是关键。这个以前这种不同系统中间呢,它的这些语言,或者说这种表示事物的方式,或者用数据来表达事物的这种方式呢,它是不统一的。那么一旦这个统一了以后的话,那你就基本上就是不太需要去治理的,仅仅就是需要收集更多的是数据的,用更多真实的数据的这种反应现实里的事实情况,有了这些东西就在它在产生的那时候,它就是一个完整的,对吧?问题是现在在产生的过程中是不完整,所以需要在中间治理,做补齐呀,纠偏呀,这些事情是需要去做的,当然这些事情现在也可以用人工智能的方法来做。
朱博士:这个它你从现实中反映就是把这个现实世界中相关的东西,它应该有个统一的模型定义好,那它们之间的就可以缩短大家之间的交互路径,缩短相互之间的翻译理解过程,这样的话本身效率是可以更高的,然后也可以更容易去洞察全局嘛,是吧。
我:还有一点就是在我们给运营商做系统有很多不同厂商对不对,比如数据中台客户也可能不想给一家去干,就说我切割功能模块的时候,我要找到比别人的优势在哪里,然后呢,我想拿别人做不到的事情,我做到了,那别人的话他后面的活就是照做,他做哪些按我要求的去做,有可能就是数据治理,它就是比如说他就是除了这个标准化的东西,它还有一个叫质量分析的模块,是吧,那就是说我想把这个东西呢,就是所有的一切都管起来,都弄起来。
我:那留给其它厂商做的,比如说入湖、分层加工、应用等不给我做啊,我认为都没有关系,你都拿走都没有关系,但就是一点,你想做什么东西都得经过我同意。
朱博士:那这个东西我觉得他应该不属于数据治理的范畴啊,它是属于这种洞察或者是分析的这种东西,就是这种自动化的去看这种东西呢,那就应该是相当于结合人的经验,再加上这个机器学习的方式,把这种异常,什么叫异常,那你这样一个不符合规律的,不符合以前的发展规律的东西,都可以用异常来定义,这些都是可以去发现的。这其实相当于是数据分析的过程,过来以后,它有一个实时分析的这样一个能力,这个能力实际上都是可以植入到系统中的。
朱博士:嗯,这里面你说的这个最关键的,我自己觉得也是这个,就是抓住这个模型定义的这种方式,就是标准化的这种方式。那么不管是原来传统的这种这种模型的定义,还是说以后本体论啊,就是像那种图数据这种模型,对吧,这种模型的方式呢,他可能为了更好地表达这个事物,或者表达这个。更好的去使用这个数据,它会变,但是这个标准化是非常关键的,而且的话是希望通过这个标准化要求前台新建的系统,它就应该就是说是要利用这些标准完整的这种东西。
我:我在那个研究DAMA数据管理知识体系指南。我们可以看一下那个数据治理它是放那个位置的呢,它是放在圆圈中间的,那就是说数据治理是跟数据生命周期各环节都有关系,对吧?你洞察分析也好,我是不是可以把它划为质量分析,那数据质量分析,它也是属于那个数据治理体系的一部分嘛。以前人家说的数据治理,其实就是说这个数据不准么,指向数据分析前面数据不准什么的是吧。我是想说的是数据治理,“治||理”这两个字是怎么理解,我认为“治”是后向的,“理”是前向对不对,我这里要强调一下这个“理”字,你要理我啊,就是这个意思,我就必须要其它人应当理我这个意思,我要把这个说明白。
朱博士:那这个其实就是,是就是你刚才开始说的,就是说是如果你这个是定义完整清楚了,大家就是用同样的语言在说话,那前台的任何系统CRM,或者说是是某些这种系统,它要用的这种,嗯,比如说是姓名年龄啊,或者是什么,这些数据的表示都是一样的,都是必须要从你这儿拿这个标准,他才能做业务系统。就是说就是说嗯,先有这种模型的标准,你业务系统和分析系统,其实都是同样的那个,啊类似这样一个表达,不存在这个数据的转换对吧,只是不存在数据的治理,只是需要的时候呢,就是用这样的数据进行分析就行了。
我:对,其实我们理解的都差不多,然后驱动我再去思考这个问题的时候,就是怎么呢?比如说华为要造车,造车,这个华为造车,他呢,华为他干啥,他哪些干,哪些不干,对不对,他他就干那个自动,就比如说他那个车的智能驾驶,或者就自动决策,或者就是中枢神经那个东西啊,其他的呢,他可以给别人干(硬件车轮、方向盘),他都是干最有价值的活。那我是想着我,其实我就想达到这种目标,或者换个词儿,比如说智慧,什么鬼东西这样的。
朱博士:这个数据治理可能你不能把它放划的太大,这个可能不能包括数据分析,但是数据质量肯定是在其中的,它应该就是基本上就是说,让大家理解,或者是说然后这个数据的值准确性阿,就是高质量的,并且是容易懂的,这个是治理有统一标准的,这个是治理的关键嘛,但是是有了这些后,就说是信息质量完整的这些,这些数据的话,我怎么来用它,我用它来判断,到底是客户体验不好,还是网络这个运行的不好,这个东西呢,实际上是归属于数据分析环节了。
我:数据质量我知道啊,就是就是有一个东西叫规则配置这种东西是吧,那规则配置他如果说规则配置,它在不掌握数据本身的话啊,规则配置工作是掌握在做数据加工的人的手里对吧,那你如果说这两个分开吗?打个比方,就是这是两个厂家做的,那你要想就是说我可能提供结果给他就是让他过来配,其实我对这个环节,我只是能做自动校验的一个过程而已,是吧。但是规则,其实可以说规则就类似于法律这个东西是吧,但你这个法律之外的东西,它都不叫犯罪,对吧,但是确确实实有很多这种违背人常理行为发生,最好只能受到道德的谴责,但这种问题是有的嘛,我是想就想到这种这这种这种现象,想解决这个问题。
朱博士:这个东西我是觉得可能还是我刚才那个就是想法啊,就是这个可能是用原生的模型啊,就是说你比如说是一个网元、一个客户,或者是一个这个现实世界中的,或者是我们见到的一个这种对象对象,我能不能用本体的这种模型来把它准确的表达,那么本体的模型,他这个模型的定义和模型的这种。创建我就快速的,我就我根本就是说怎么做这件事情都不需要去说,是让大家都可以,就可以用自动的工具来生成,你比如是我,我以后做一个系统里边儿,涉及到几个对象,涉及到这个客户涉及到订单,或者说你做的这种网络这个系统。
朱博士:我们这个现成的这些,就是说类似于这种模型库表结构就直接是就在这个基础上用,就不允许你定义,你不能自已去定义对吧?你可以在上面儿去把这个数据标准存进去,可以取出来,可以去倒,那有些时你可能不用,没有呢,没有的话对你没用的话,你可以不存,对吧也也不取,但是你这个系统中,这个模型它是一致的啊
我:你说的这些呢,我也理解到了,其实我也get到这个点呢,就是管你这个元数据模型之类的,我还有一个问题就是要解决,这个要解决的问题就是就是你刚刚说了,比如说我后面的洞察分析是吧,出来一个问题,那这个问题就是我刚刚举了个例子:比如说这个小女孩儿,然后前面都是用了50块钱,然后呢,后面就变成那个1万块钱呢,我发现了。有这个问题,那发现这个问题的时候,我我可能判断一下,判断一下这个人这个人际关系啊,就是说用这个小女孩,实际使用应该是她妈妈打个比方哈,是吧,应该是她妈妈,那是我要描述真实的这个物理世界嘛,是不是那描述我真实物理的世界的时候。
我:就描述我真实物理世界的时候,那我是不是要求你中间层还是什么前面地方对吧,就是你做加工的时候,你在那个地方就要把这个问题搞分析出来了,对于中间层对它来说那它是不是个问题呢?我认为它也是个问题,也不是一个问题,对于CRM来说,它不是个问题,就是一个现状嘛;对于深层次来说它是一个问题,那你在那这个对于加工来说,他要不要解决呢?这就是我要表达的想要它要解决是这个意思。
我:我就想未来数字孪生场景吗,就最终呢,可以就是一个非常纯净的这种世界,他不需要治理,就是老子说的这种“无为而治”,自己真正的自己就是无为后,后来就是想了一下怎么实现呢,就是你设计定义好所有的东西,让机器按部就搬的产生结果,让它按部就搬去执行,一条条记录卡卡记录下来,然后你是把在这个物理世界里面,然后利用机器产生的数据去动啊,还是干啥呀做,怎么做呢?我,我就,我就想是不是在孪生世界能做到这件事情。
朱博士:现在也有这种系统发展趋势,就是把人类认知,或者说是这种知识吧,用这种方式在机器中表达出来,对吧,就是不管是法律法规,甚至是某一些推荐层面啊,这些东西逐渐实现数字化,逐渐用系统自动来做,就像让你开车,它让你自动驾驶,它做到比人开还更安全,它不会有这个酒驾呀,不会有这种情况,就大部分就逐渐的话,就是会变成这样,很多自动化系统中的数据人不可以再随意的改,就是按照它的标准去编程,也会导致这个数据的模型也都非常一致,对吧,这就越来越系统,越来越自动化。
朱博士:在这个系统自动化的情况下呢,很多东西比如这个规律,一种既定的这种东西在去运转,那这种东西就是我们先验(先前经验)知识,或者是大家共识的统一的知识认知的这些东西,把这些编程编到这个系统中,尤其是这种it系统,但是还有另一方面的事呢,它也要留有一定的余地,就是有很多东西呢,未必是我们以前知道的知识,或者说以前的知识未必是完全正确的,它还存在着这个演进的方向。这个就是呢它还会大量的采集数据,从这个数据,从这个里面去试图去发现新的规律,新的趋势,新的变化,那这个就相当于这种东西,它这个系统里的规则呢并不是说就是静止的。
朱博士:就是他会可能去不断的去调整或者去优化啊,就是这个意思。
朱博士:前面那一部分呢,就相当于我说的,就是由规则和知识图谱来定义的,这样的一个运转的这样的世界,那后面的这种数据驱动的方式,从数据中再去挖掘新的东西,那这块儿相当于人的左脑的理性的东西,就相当于刚才的规则,那是逻辑对吧?右脑的话,它还要基于数据在创新,或者发现这个还会让这个系统中给人有这种。能够在系统中的很多环节要能够干预,系统能够这个就是说人机结合的方式来让这个系统再去引进,再去人还可以把新的指令,还有一个新的这种,不能让这个完全自动化的系统控制这个世界吗?还是要有人干预的这种选项放在里头。
我:我大概能理解你的意思了,其实最终就是我,我想更关心的就是这个地方,就是说最终这个机器和人呐,就是可能机器之间协作需要人来定规则,知道吧,我是想是什么一帮人做这事,肯定是一些有实力的人嘛,对吧,回到我这个中台环节里面来说的时候,我就想我是不是有一个人可以做一件事情,这个中台的其它各个环节,如果说我把这个中台主要模块做好了,这个前提对吧?我把全流程数据有个东西叫数据生命周期是吧,数据生命周期从产生、销毁全过程上都有,对不对?那我打着这个旗号,就是说我如果说在这一点的时候,我做的比人家都好。
我:那就是我有这个有这个权力吗?就是我就有优势吗?就说对我们YX来说,它就有优势嘛,就是这个意思,现实世界也是一样的,就是你最后抓到那个点的时候,就是说这个生物链的这个最顶端的那些人,它就是掌握规则,制定规则和发现有优化空间这种规则是吧,就是如果说是这种,这这些人,他有一个监督机制还好,他如果说就是一个人说了算的话,那是不是那个人特别有优势是吧。
朱博士:这个肯定在最终都是做这种决策定义规则的,或者说是具备洞察分析趋势这一拨人,在任何企业中应该都属于主导的,或者说有话语权的。当然这个方面的话肯定得有这个监督机制的,社会不可能放任他让这个样子,比如监督审计你是否合理,对吧,就是说是这样才能够那个保证他现在你用的数据分析方式,数据分析的这些结果,或者说利用AI技术挖掘的这些东西,都是要讲究这个它的可解释性或者是道德的。(注:这也是为什么当下互联网巨头收到越来越重监管的理由吧,科技需向善)
倘若要转载,请联系作者,注明出处,谢谢!