静安司的大数据建设离数据中台还有多远?|《长安十二时辰》

萌妹作为易烊千玺的女友粉,时下大热的《长安十二时辰》当然也是要追起来的。精良的制作,紧凑的剧情,以及各个老戏骨的精彩演绎,不辜负我等一众熬夜追剧党。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第1张图片

豆瓣评分已升至8.6

剧中「大案牍术」一词刚出现时,数据行业就有同学把大案牍术和当下最火热的“大数据”联系起来。

“马亲王”在原作小说中,这么描述大案牍术:

“他做不良帅那么多年,破案无数,深知很多事情并不需要搜考秘闻,真相就藏在人人可见的文卷之中,就看你能不能找出来——此所谓‘大案牍’之术。李泌特意在靖安司集中一批精干官吏,专事检校查阅,正适合应付眼下这局面,可见此人卓识。”


“凭借大案牍之术和祆教的户籍配合,他迅速地找出一个可疑之人。此人叫作龙波,来自龟兹,开元二十年来京落为市籍,同年拜入祆教,就住在怀远坊内,一直单身。供奉记录显示他最近半年来,给祆祠的供奉陡增,为此还特受褒奖。天宝二载底市籍有过一次清册重造,但龙波的户口仍是开元二十年。有一位户部老吏敏锐地注意到这个小纰漏。户籍上要写清相貌,若是旧册不造,则有可能冒名顶替。”

《长安十二时辰》马伯庸

根据“案牍”、“文卷”记载内容,以及其他部门的数据补充配合,大唐「数据科学家」——徐宾、李必或张小敬就可以抽丝剥茧,构建出疑犯基本画像,在通过对疑犯的“社交数据”和“行为数据”进行分析,基本就可以锁定疑犯关系网中和案件牵连的余等涉事人员。

大案牍术确实有大数据的雏形,这点萌妹非常认可。

但是,看到数据行业还有人把剧中静安司比作数据中台,我就觉得有点儿过于牵强附会了。

下面,萌妹就从数据中台建设的角度太谈谈,为什么静安司的“大数据”建设现状还根本谈不上是数据中台。

数据源

剧中静安司由当朝德高望重、人脉众多的何监、何执事(原型就是写出你我都会背的“不知细叶谁裁出,二月春风似剪刀”的唐朝著名诗人贺知章)一手所创办,由其学生、大唐神童、未来宰相李必(千玺饰演)负责,担任静安司司丞一职。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第2张图片

静安司创立者何监

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第3张图片

静安司司丞李必

从这一点来讲,静安司和数据中台倒有相通之处。我们讲企业进行数据中台的建设一定要是从战略层面重视,并给予足够的组织架构和资源上的支持。从何监和李必的配置来看,静安司的创立天生就拥有很大的光环,也是得到圣人(对应唐玄宗)的极大重视、肯定的。

说回静安司,长安技术宅、静安吏徐宾创造了高科技产品——“大案牍术”。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第4张图片

“大案牍术”发明者徐宾

所谓“无丝竹之乱耳,无案牍之劳形”,“大案牍术”的基础“案牍”指的就是古代办公用的文书。静安司拥有当时唐朝最丰富的各类“文书”,无论是人口增添、社会丧葬、男女嫁娶、官吏升迁降职、各类刑事、民事等案件均记录其中。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第5张图片

静安司拥有各部数据

类比如今我们所说的“大数据”,“数据库”,甚至“数仓”,其实对应的就是数据中台中的「数据源」部分。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第6张图片

但是,数据中台的“数据源”我们讲究“全”:将各个系统、各个部门、各个子公司的全域数据进行采集和统一存储。

虽然静安司的案牍确实很多,数据量也确实很大,已经看起来很丰富了,但实际上:无论是受限于存储成本(数据存储端——纸张短缺,价格高昂)还是因为“数据采集端”的不健全(数据采集端——录入吏也会因为种种原因未能如实详尽记录数据),静安司的数据仓库建设都无法从数据源上做到我们所说的“全”。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第7张图片

源头上数据的缺失、错误,空白,会从根本上不利于静安司数据中台的建设,即便同时也是「数据治理官」的徐宾花费再多心思,分门别类把“案牍”整理得再好,静安司的数据治理现状还是存在很大的问题,并会直接影响后续数据中台所讲的“通”和“用”,即我们所讲的数据资源经过数据治理变成数据资产,进行数据应用,发挥数据价值的整个数据供应链各环节。

徐宾已对静安司数据进行治理

图中徐宾正在查找所需文件


虽然静安司数据基础看起来并非相当健壮,但是在当时的时代背景下,确实静安司的数据基础确实也已经是相当领先了。

基于上述的数据基础现状,静安司也建设了一些数据应用,比如进行刑侦和查案的「大案牍术」,将整个长安各坊进行地理数据可视化的「沙盘」,进行数据传递和互通的「望楼」等等。

长安“沙盘”

“望楼”传信

萌妹当时看到这些高科技,真真是内心激动得不行,这,就是数据价值最好的体现。

但是,萌妹认为,如果李司丞能把下面这几个问题解决掉,那么静安司的大数据事业才真正做到了数据中台的最高标准。

数据安全

第一个,也是最重要的,就是数据安全的问题。

静安司相当于现在的国安局,负责查案,办案,拥有唐帝国最大的数据中心,消息最灵通,情报最丰富,理所当然,也是各方势力安插「暗桩」(即眼线和卧底)最多的地方。

目前已播剧情中已经暴露的暗桩就是负责往来传送望楼情报的通传陆三。

陆三作为反派的暗桩,将假的关单混入到文书里影响李必等人的判断,相当于制造脏数据,是一个既影响数据是否丢失,也影响数据是否准确,同事还会泄露数据的角色。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第8张图片

陆三将假的关单替换,假的关单相当于脏数据。

图为陆三怕身份暴露欲杀掉徐宾


除了陆三之外,右相在静安司安插的暗桩“三女”已知存在,但还无法得知究竟是谁,油腻的姚汝能、身世扑朔迷离的女主檀棋都有可能。

暗桩就像大数据世界里的黑客,人在暗处,窃取各种情报信息,篡改重要数据,对数据安全造成危险,静安司除了设计抓内鬼,实也无他法能知道暗桩是谁。所以暂且不谈暗处。

但其实就算在明处,静安司的数据传递也存在极大的安全隐患。

负责进行传递情报的“望楼”,其数据加密形式看起来就和摩斯密码一样,在整个长安城进行最及时的信号传递。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第9张图片

细节控剧方还自己设计了一套望楼密码系统。。。

但是!“望楼”使用的是明码传输,且只有一套密码本。。。一旦被得知密码本,就很容易被转译。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第10张图片

另外一个数据安全的问题则是,这些“案牍”到底有没有备份。。。

纸价那么高的话,想是应该没有备份的。。万一一把火烧了怎么办。。

即便没烧,有心人也可以轻易把案牍毁掉啊。。。

总之,静安司的数据安全,无论在完整性、保密性、准确性上面都存在很大问题。

团队数据能力培养

第二个,就是团队数据能力和素养的问题。

无论是徐宾还是陆三,都暴露了静安司团队整体缺乏数据能力和素养的问题。大案牍术是徐宾创立的,每一次使用大案牍术查案都要依赖徐宾个人,导致徐宾被怀疑是奸细时,原本一个人就可以做的事情,需要好几个静安吏才能完成,甚至根本无法完成。更别说万一徐宾真的被陆三掐死了,大案牍术真的就,起码很长一段时间内都凉凉了,后继无人啊啊啊。。

我们谈数据中台,强调数据运营团队的建设,从数据开发,数据分析团队到业务团队,需要一个数据运营团队在中间进行承接和需求转化,甚至必要时对员工进行数据能力的培训。阿里在2012年设置首席数据官的岗位,就是在建设自己的数据运营团队,并不断提高全集团的数据使用能力和素养,期望最终实现整个集团的数据驱动。

大数据平台

最后一点,工具。

静安司进行数据采集需要依靠大量的录入吏;

进行数据治理依靠徐宾个人设计的数据规范和标准;

进行数据安全保护则只能依靠相关人员的信仰和人品;

数据分析和挖掘要靠IQ最高的李必、或者是已经将数据内容都背下来的徐宾,每分析一次,则要消耗大量体力和脑力。

靠不靠谱是后话,人力成本、以及上面提到的存储成本等等门槛都无法支撑静安司数据中台建设的完整性、安全性、长期性。

数据中台的建设不可能依靠机械的人力劳动,成熟便利的工具和产品才能降低门槛,节省成本,使数据中台建设的过程举重若轻。

总结

以上是我对静安司的大数据建设离数据中台有多远的回答。但我们不能拿现在的标准来衡量1000多年前的技术,这太过于上帝视角了。

但是,对数据价值的理解,倒是值得我们每一个数据行业从业者学习的。

数据,不仅仅是数据。

静安司的大数据建设离数据中台还有多远?|《长安十二时辰》_第11张图片


-end-

你可能感兴趣的:(静安司的大数据建设离数据中台还有多远?|《长安十二时辰》)