一次关于软件架构设计层面深度讨论

2021年年底因为某客户要求将大数据中台做拆解，分拆设计考虑要可行性、合理性，目的是避免被某一家供应商绑架，由此有了一次很深的中台架构方面的思考，借此又深度思考了整个集团企业IT系统架构方面设计的重思考（客户系统包括N个客户受理系统、计费系统、网络系统、财务系统等等），有了一个整体构想，后和行业多个专家分别做了多次深度交流沟通。下文是和某资深架构规划朱博士的沟通，记录下这次对谈过程原因是：一方面记录人生经历了一次不同寻常的思考之旅，另一方面也希望可以给有缘人一点启发。

image.png

我：朱博士，我最近一直思考it 系统如何实现像造车自动驾驶那样的能找到类似的中枢大脑，让其他环节只做执行，比如踩油门踩这一个动作，有了一些想法想和你做个沟通，也不知道这会不会有点不切实际。
朱博士：嗳，老纪，你这个可能思考的很深，是吧，睡觉睡的时间挺晚的啊。对，其实你的这个想法应该是我们现在所说是所谓的自动化系统，假设在当前现实世界中找到有个对照、有关联关系的系统的话，应该就是数字孪生系统。
朱博士：数字孪生系统，比如说一个车就是一个孪生体，一个房子就是一个孪生体。这些孪生体中管理车，管理房子的系统，背后有对应的智能OS、智慧楼宇的这些系统，它应该就是做了到利用数据驱动机器实现自动化的这种形式。但是它是允许有个human的入口的，就是允许人在这个过程中能够干预，需要干预的时候可以一键停止，一键删除，或者一键某种操作的，也就是说是要给人留有可控制空间。人如果不操作的话，机器它就按设计好的流程来做，比如说温度高了，这个房子就可以自动降下温度，也可以自动调节这个温度，或者调节湿度等。
朱博士：当然也可以在动态情况下管理电梯的自动运行，比如上下楼、报警啊，这些类似的系统相当于一个叫智慧楼宇IT管理系统来管，它肯定是通过捕获各种信息来感知的，同时它还需要不停的逐渐的去升级，将来能够越来越精细化的感知，能够去做驱动现有的东西做决策，比如说是往楼里某单元户送东西，这个时候就要驱动一个自动驾驶的小车来送东西啊，还有一些其它决策类的事情。
朱博士：回过头来说，你说的这个IT系统，我们如果可以比较可以直接对应的话，在电信行业的比较直观的就是BSS和OSS系统。它们也是各负其责的，各负其责的话，它就不能是一个中枢大脑，它要是一个中枢大脑的话，这个太复杂，或者说是没法儿用一个大脑中枢去全部做，如果有的话，它应该是多个类似的中枢大脑，每类系统有一个自己的中枢大脑，然后的话，它们有一个更大的指挥系统去协调，这些之间的关系有点像人与组织一样，每个个体成员都有各自的精力，同时需要有一个中间组织来互相管理和协调的他们。
朱博士：这样，那我们现在可以看到有些系统慢慢地可以做成了自动化，类似于CEM系统的这种，对吧？CEM的话，客户的注册，客户的这些注册方式，通过语音，通过其他的方式能够去注册，注册了以后这个系统本身，而不是通过人，它能够利用机器学习的方式，或者是定时、定期的，按照人的这种模式，由系统它自己来联系与这个客户进行交流，那这个系统来做联系这些人的事呢，未来可能就是一个数字员工，对吧，未来会有不同类型的数字员工。
朱博士：那对应到运维系统，就有可能是这种IT自动化运维数字员工。数字员工它能够来去查找各类系统日志，它能够去用AIOPS的方式来去分析，特别典型的是在网络维护方面，慢慢地原来有很多有人工运维的方式转向由机器来自动去做运维。而且自动驾驶的网络，就是你刚才说的自动驾驶的车一样，就是Autonetwork，它的目标就是把网络能切片，网络的资源回收、网络运营这些事情，都是可以由这个自动驾驶网络的大脑来做这件事情。这个中枢系统呢，它肯定不适合别的像BSS里的受理这些东西了，所以应该是每个IT系统本身呢，它都会逐渐自动化，形成各种各样自动化的流程。
朱博士：而这些IT系统之间他们再交互的话，可能是在下一个阶段，它应该是有每个不同的阶段，所以它会有延续演进的状态。现在逐渐已经有一些it的流程在减少人的这种操作的事了，在自动化方面，有咱们现在有的类似于RPA自动化流程，一些流程自动化，在再加上这个数字孪生系统，再加上这个数字员工啊，这些不同的目标，最终都是朝这个方向的最终目标在发展。
我：朱博士，我在想这件事情的这个原因在哪儿呢？现在讲一个东西叫治理，我的想法是有没有一个好的方式，让系统它做啥，它就做啥，就是所有的想要做的事情，人为提前设定好输入给机器，然后机器去照着这个做就行了。比如说CRM系统里面，比如受理呀，它的整个逻辑环节里面假如都是无瑕疵的处理逻辑，然后去让系统去执行，执行完了之后，它就落地到后台嘛，落到后端会把这些CRM的数据，比如同步传给比如说计费的数据，同步传到数据中台等其它系统。
我：如果一切都能定义的好话，数据我想是不是其实可以不用治理的，因为设计已经告诉我咋做，我就照做完了。跟你前面讲的那个元宇宙里数字孪生这种场景一样，我一切都设计的很好，那我是不是就可以不用治理了。但是国外的人还出一本书（DMBOOK2），叫数据治理，然后现在国家\各个地方还都在提数据治理种现象。我再举个例子给你，听一下。
我：比如说我们现在行业讲做全域融合对吧？BOM拉通，那BOM拉通的时候，你拉通的是什么？拉通的是前端业务系统产生的事实数据，实际上是发生后的数据，并且它都是实例数据、这个实例数据关系也都落好了，然后你就把他拉通了（结果），但是结果不一定就是真相，比如我们在这个生活。生活中来说你有这个关系，但并不代表就是说你是真实的（比如婚姻关系下出轨问题），驱动我思考怎么样，就是说整个环节里面我不质疑的话，我是怎么样把这个环节都解决掉，这个意思。
我：我想找到本质，从本质解决。现在BOM拉通是拉的结果的关系，而不是本质上的源头。
朱博士：如果用从数据治理的这个角度来说的话，其实我觉得最关键的应该就是说是那个这个模型，就是这个模型是要统一和标准的，就是这种数据的模型对吧，你要是放在一个人上看，体重，身高呀，你对它有个全面的描述，这些东西是要有标准的，有了标准模型的话后面无非就是从源系统中Copy这些数据过来了，应该就是现在说的自动化采集，并且转换到这个模型中，甚至以后，就像你刚才说的以后这些模型呢，就是包括他这个怎么来表达一个什么叫客户啊，或者什么叫特征呀，这些东西都是统一的。
朱博士：这些东西是可以不需要治理了，对吧，那就不需要治理的原因是说明大家用同样的语言在说话，同样的语言在说话就是关键。这个以前这种不同系统中间呢，它的这些语言，或者说这种表示事物的方式，或者用数据来表达事物的这种方式呢，它是不统一的。那么一旦这个统一了以后的话，那你就基本上就是不太需要去治理的，仅仅就是需要收集更多的是数据的，用更多真实的数据的这种反应现实里的事实情况，有了这些东西就在它在产生的那时候，它就是一个完整的，对吧？问题是现在在产生的过程中是不完整，所以需要在中间治理，做补齐呀，纠偏呀，这些事情是需要去做的，当然这些事情现在也可以用人工智能的方法来做。
朱博士：这个它你从现实中反映就是把这个现实世界中相关的东西，它应该有个统一的模型定义好，那它们之间的就可以缩短大家之间的交互路径，缩短相互之间的翻译理解过程，这样的话本身效率是可以更高的，然后也可以更容易去洞察全局嘛，是吧。
我：还有一点就是在我们给运营商做系统有很多不同厂商对不对，比如数据中台客户也可能不想给一家去干，就说我切割功能模块的时候，我要找到比别人的优势在哪里，然后呢，我想拿别人做不到的事情，我做到了，那别人的话他后面的活就是照做，他做哪些按我要求的去做，有可能就是数据治理，它就是比如说他就是除了这个标准化的东西，它还有一个叫质量分析的模块，是吧，那就是说我想把这个东西呢，就是所有的一切都管起来，都弄起来。
我：那留给其它厂商做的，比如说入湖、分层加工、应用等不给我做啊，我认为都没有关系，你都拿走都没有关系，但就是一点，你想做什么东西都得经过我同意。
朱博士：那这个东西我觉得他应该不属于数据治理的范畴啊，它是属于这种洞察或者是分析的这种东西，就是这种自动化的去看这种东西呢，那就应该是相当于结合人的经验，再加上这个机器学习的方式，把这种异常，什么叫异常，那你这样一个不符合规律的，不符合以前的发展规律的东西，都可以用异常来定义，这些都是可以去发现的。这其实相当于是数据分析的过程，过来以后，它有一个实时分析的这样一个能力，这个能力实际上都是可以植入到系统中的。
朱博士：嗯，这里面你说的这个最关键的，我自己觉得也是这个，就是抓住这个模型定义的这种方式，就是标准化的这种方式。那么不管是原来传统的这种这种模型的定义，还是说以后本体论啊，就是像那种图数据这种模型，对吧，这种模型的方式呢，他可能为了更好地表达这个事物，或者表达这个。更好的去使用这个数据，它会变，但是这个标准化是非常关键的，而且的话是希望通过这个标准化要求前台新建的系统，它就应该就是说是要利用这些标准完整的这种东西。
我：我在那个研究DAMA数据管理知识体系指南。我们可以看一下那个数据治理它是放那个位置的呢，它是放在圆圈中间的，那就是说数据治理是跟数据生命周期各环节都有关系，对吧？你洞察分析也好，我是不是可以把它划为质量分析，那数据质量分析，它也是属于那个数据治理体系的一部分嘛。以前人家说的数据治理，其实就是说这个数据不准么，指向数据分析前面数据不准什么的是吧。我是想说的是数据治理，“治||理”这两个字是怎么理解，我认为“治”是后向的，“理”是前向对不对，我这里要强调一下这个“理”字，你要理我啊，就是这个意思，我就必须要其它人应当理我这个意思，我要把这个说明白。
朱博士：那这个其实就是，是就是你刚才开始说的，就是说是如果你这个是定义完整清楚了，大家就是用同样的语言在说话，那前台的任何系统CRM，或者说是是某些这种系统，它要用的这种，嗯，比如说是姓名年龄啊，或者是什么，这些数据的表示都是一样的，都是必须要从你这儿拿这个标准，他才能做业务系统。就是说就是说嗯，先有这种模型的标准，你业务系统和分析系统，其实都是同样的那个，啊类似这样一个表达，不存在这个数据的转换对吧，只是不存在数据的治理，只是需要的时候呢，就是用这样的数据进行分析就行了。
我：对，其实我们理解的都差不多，然后驱动我再去思考这个问题的时候，就是怎么呢？比如说华为要造车，造车，这个华为造车，他呢，华为他干啥，他哪些干，哪些不干，对不对，他他就干那个自动，就比如说他那个车的智能驾驶，或者就自动决策，或者就是中枢神经那个东西啊，其他的呢，他可以给别人干（硬件车轮、方向盘），他都是干最有价值的活。那我是想着我，其实我就想达到这种目标，或者换个词儿，比如说智慧，什么鬼东西这样的。
朱博士：这个数据治理可能你不能把它放划的太大，这个可能不能包括数据分析，但是数据质量肯定是在其中的，它应该就是基本上就是说，让大家理解，或者是说然后这个数据的值准确性阿，就是高质量的，并且是容易懂的，这个是治理有统一标准的，这个是治理的关键嘛，但是是有了这些后，就说是信息质量完整的这些，这些数据的话，我怎么来用它，我用它来判断，到底是客户体验不好，还是网络这个运行的不好，这个东西呢，实际上是归属于数据分析环节了。
我：数据质量我知道啊，就是就是有一个东西叫规则配置这种东西是吧，那规则配置他如果说规则配置，它在不掌握数据本身的话啊，规则配置工作是掌握在做数据加工的人的手里对吧，那你如果说这两个分开吗？打个比方，就是这是两个厂家做的，那你要想就是说我可能提供结果给他就是让他过来配，其实我对这个环节，我只是能做自动校验的一个过程而已，是吧。但是规则，其实可以说规则就类似于法律这个东西是吧，但你这个法律之外的东西，它都不叫犯罪，对吧，但是确确实实有很多这种违背人常理行为发生，最好只能受到道德的谴责，但这种问题是有的嘛，我是想就想到这种这这种这种现象，想解决这个问题。
朱博士：这个东西我是觉得可能还是我刚才那个就是想法啊，就是这个可能是用原生的模型啊，就是说你比如说是一个网元、一个客户，或者是一个这个现实世界中的，或者是我们见到的一个这种对象对象，我能不能用本体的这种模型来把它准确的表达，那么本体的模型，他这个模型的定义和模型的这种。创建我就快速的，我就我根本就是说怎么做这件事情都不需要去说，是让大家都可以，就可以用自动的工具来生成，你比如是我，我以后做一个系统里边儿，涉及到几个对象，涉及到这个客户涉及到订单，或者说你做的这种网络这个系统。
朱博士：我们这个现成的这些，就是说类似于这种模型库表结构就直接是就在这个基础上用，就不允许你定义，你不能自已去定义对吧？你可以在上面儿去把这个数据标准存进去，可以取出来，可以去倒，那有些时你可能不用，没有呢，没有的话对你没用的话，你可以不存，对吧也也不取，但是你这个系统中，这个模型它是一致的啊
我：你说的这些呢，我也理解到了，其实我也get到这个点呢，就是管你这个元数据模型之类的，我还有一个问题就是要解决，这个要解决的问题就是就是你刚刚说了，比如说我后面的洞察分析是吧，出来一个问题，那这个问题就是我刚刚举了个例子：比如说这个小女孩儿，然后前面都是用了50块钱，然后呢，后面就变成那个1万块钱呢，我发现了。有这个问题，那发现这个问题的时候，我我可能判断一下，判断一下这个人这个人际关系啊，就是说用这个小女孩，实际使用应该是她妈妈打个比方哈，是吧，应该是她妈妈，那是我要描述真实的这个物理世界嘛，是不是那描述我真实物理的世界的时候。
我：就描述我真实物理世界的时候，那我是不是要求你中间层还是什么前面地方对吧，就是你做加工的时候，你在那个地方就要把这个问题搞分析出来了，对于中间层对它来说那它是不是个问题呢？我认为它也是个问题，也不是一个问题，对于CRM来说，它不是个问题，就是一个现状嘛；对于深层次来说它是一个问题，那你在那这个对于加工来说，他要不要解决呢？这就是我要表达的想要它要解决是这个意思。
我：我就想未来数字孪生场景吗，就最终呢，可以就是一个非常纯净的这种世界，他不需要治理，就是老子说的这种“无为而治”，自己真正的自己就是无为后，后来就是想了一下怎么实现呢，就是你设计定义好所有的东西，让机器按部就搬的产生结果，让它按部就搬去执行，一条条记录卡卡记录下来，然后你是把在这个物理世界里面，然后利用机器产生的数据去动啊，还是干啥呀做，怎么做呢？我，我就，我就想是不是在孪生世界能做到这件事情。
朱博士：现在也有这种系统发展趋势，就是把人类认知，或者说是这种知识吧，用这种方式在机器中表达出来，对吧，就是不管是法律法规，甚至是某一些推荐层面啊，这些东西逐渐实现数字化，逐渐用系统自动来做，就像让你开车，它让你自动驾驶，它做到比人开还更安全，它不会有这个酒驾呀，不会有这种情况，就大部分就逐渐的话，就是会变成这样，很多自动化系统中的数据人不可以再随意的改，就是按照它的标准去编程，也会导致这个数据的模型也都非常一致，对吧，这就越来越系统，越来越自动化。
朱博士：在这个系统自动化的情况下呢，很多东西比如这个规律，一种既定的这种东西在去运转，那这种东西就是我们先验（先前经验）知识，或者是大家共识的统一的知识认知的这些东西，把这些编程编到这个系统中，尤其是这种it系统，但是还有另一方面的事呢，它也要留有一定的余地，就是有很多东西呢，未必是我们以前知道的知识，或者说以前的知识未必是完全正确的，它还存在着这个演进的方向。这个就是呢它还会大量的采集数据，从这个数据，从这个里面去试图去发现新的规律，新的趋势，新的变化，那这个就相当于这种东西，它这个系统里的规则呢并不是说就是静止的。
朱博士：就是他会可能去不断的去调整或者去优化啊，就是这个意思。
朱博士：前面那一部分呢，就相当于我说的，就是由规则和知识图谱来定义的，这样的一个运转的这样的世界，那后面的这种数据驱动的方式，从数据中再去挖掘新的东西，那这块儿相当于人的左脑的理性的东西，就相当于刚才的规则，那是逻辑对吧？右脑的话，它还要基于数据在创新，或者发现这个还会让这个系统中给人有这种。能够在系统中的很多环节要能够干预，系统能够这个就是说人机结合的方式来让这个系统再去引进，再去人还可以把新的指令，还有一个新的这种，不能让这个完全自动化的系统控制这个世界吗？还是要有人干预的这种选项放在里头。
我：我大概能理解你的意思了，其实最终就是我，我想更关心的就是这个地方，就是说最终这个机器和人呐，就是可能机器之间协作需要人来定规则，知道吧，我是想是什么一帮人做这事，肯定是一些有实力的人嘛，对吧，回到我这个中台环节里面来说的时候，我就想我是不是有一个人可以做一件事情，这个中台的其它各个环节，如果说我把这个中台主要模块做好了，这个前提对吧？我把全流程数据有个东西叫数据生命周期是吧，数据生命周期从产生、销毁全过程上都有，对不对？那我打着这个旗号，就是说我如果说在这一点的时候，我做的比人家都好。
我：那就是我有这个有这个权力吗？就是我就有优势吗？就说对我们YX来说，它就有优势嘛，就是这个意思，现实世界也是一样的，就是你最后抓到那个点的时候，就是说这个生物链的这个最顶端的那些人，它就是掌握规则，制定规则和发现有优化空间这种规则是吧，就是如果说是这种，这这些人，他有一个监督机制还好，他如果说就是一个人说了算的话，那是不是那个人特别有优势是吧。
朱博士：这个肯定在最终都是做这种决策定义规则的，或者说是具备洞察分析趋势这一拨人，在任何企业中应该都属于主导的，或者说有话语权的。当然这个方面的话肯定得有这个监督机制的，社会不可能放任他让这个样子，比如监督审计你是否合理，对吧，就是说是这样才能够那个保证他现在你用的数据分析方式，数据分析的这些结果，或者说利用AI技术挖掘的这些东西，都是要讲究这个它的可解释性或者是道德的。（注：这也是为什么当下互联网巨头收到越来越重监管的理由吧，科技需向善）

倘若要转载，请联系作者，注明出处，谢谢！

一次关于软件架构设计层面深度讨论

你可能感兴趣的:(一次关于软件架构设计层面深度讨论)