从数据到价值

 统计之都

编辑部按:本文作者为北京大学王汉生教授,文章面向光华MBA学生系统梳理了从数据到价值的理念。作者简介:王汉生教授现任狗熊会会长、北京大学商务智能研究中心主任、北京大学光华管理学院商务统计与经济计量系副系主任。现为ISI, ASA, IMS, RSS, ICSA会士。

问题背景

这是一个最好的时代,移动互联网技术为从业者提供了无比丰富的数据。从人们的言行举止、社交关系、到地里位置无处不在。这些详细宝贵的数据,蕴含了巨大的价值!但是,这也是一个最坏的时代,面对汹涌而来的海量数据,绝大多数从业者却无可适从,无法从中发掘出有用的信息,难以实现从数据到价值的转换,这是何等的遗憾!如果这是一个从业者的遗憾,无需担忧,因为这是他的个人问题。谁让他不好好上一门王老师的《商务统计学》呢?嘿嘿:-) 如果这是两个从业者的遗憾,也可以高枕无忧,两个人没上《商务统计学》呗!但是,如果这是绝大多数人的遗憾,那么这就是整个行业和教育的遗憾,我们就需要检讨:这是怎么回事,问题出在哪个环节上?

 

如果尝试从媒体中寻找答案,那么五花八门。但是,背后的故事基本都是一样的。那就是需要一个爱因斯坦一样的天才,掌握着可乐配方一样神秘的算法,然后从一群垃圾都不如的数据中,产生了惊为天人的发现,造就了巨大的商业成功。人们管这样一群神奇的天才叫:数据科学家!“数据科学家”这个词汇是一个伟大的创举,它笼统地覆盖了计算机、管理科学、统计学、营销、经济学等众多学科。因此,每个学科都喜欢这个名词,都觉得和自己相关。但是,谁都给不出一个精确的定义。但是,这不重要,这不妨碍人们以各自的标准去寻找自己心中的那个“数据科学家”。因此,不少创业团队在创始初期,不惜血本,从拥有大量“数据科学家”的知名企业招揽人才。这些企业有哪些呢?谷歌系、阿里系、腾讯系、百度系等等。不管这批“数据科学家”在自己的专业方面是如何优秀(而事实上也确实极其优秀),他们是否会对这个新生的创业团队带来相应的价值?无论他们自己是创业者,还是创业团队的核心员工,还是普通员工,他们成功的概率几何?要让我赌一把,我一定是赌他:不成功(不一定失败,不成功的定义是其实际价值产出远远低于预期)。这里并不是看低这些优秀个体的个人能力。来自一个优秀企业的优秀员工,其自身在专业上的出色是毋庸置疑,值得尊敬,甚至崇拜的。但是,一个基本事实:这些优秀的员工在高端大气上档次的企业,如龙如虎,价值发挥淋漓尽致。但是,一旦到一个草根初期的创业团队,他们实现完全成功的概率极低。为什么?因为从企业到个人,都没有仔细思考过从数据到价值的过程,进而无法理解这些优秀的个体在各自的组织中,在当前这个创业阶段,可以起到什么样的作用。进而,对人对事都产生了错误的判断。

 

既然从数据到价值的转变那么重要,那我们一起尝试描绘一下这个过程:数据是如何演变成为价值的?我将其拆分成大概四个阶段。

 

阶段1:首先是数据的生产、采集、与整理的阶段

 

俗话说,巧妇难为无米之炊。没有数据,哪来的价值?对数据生产、采集、以及整理的需求催生了形态各异、内容丰富的信息技术。与其高度相关的是计算机技术的快速发展。例如:条形码技术的成熟产生了大量的超市扫描数据;企业ERP系统的广泛实施产生了详细的业务流程数据;商户CRM系统的成熟应用产生了大量客户的消费行为数据;地磁技术的应用产生了大量的交通路况监控数据;城市中铺天盖地的监控摄像头产生了海量的视频图像数据;GPS定位技术的发展产生了巨大的位置数据;以微博微信为代表的移动社交软件的普及产生了海量的文本以及社交关系网络数据。这是从数据到价值的第一个阶段。其意义在于,人类具备了详细刻画世界的能力。能够通过可存储的文档,详细记录个人以及社会的方方面面。什么是数据?凡是可以记录的就是数据。而以上所述的形态各异的记录都是数据!这是从数据到价值的一个基本起点。从这个角度就可以理解阿里巴巴对新浪微博的收购,可以理解为什么华为进军车联网领域。因此,在很多巨头的眼中,数据的生产、采集、与整理是一个具有战略意义的阶段。因此,是他们布局以及混战的重点。竞争惨烈!那么请问各位:你们是否一定要介入其中?这不是一个好回答的问题。

 

 

阶段2:定义和数据相关的业务问题

 

在数据生产、采集、与整理的基础上,人们开始思考:能从数据中挖掘什么价值。不过首先需要明确这个“价值”是为谁定义的?在大学科研机构中,价值是为研究学者定义的。而学者关注的价值,主要从科学兴趣的角度。只要是原创的,增进人们对自然世界、人类社会认知的,甚至纯粹有趣的,都可以称为“价值”。但是,本文关注的价值是面向企业的“价值”。面向企业的价值就不能以纯粹的“兴趣”为判断的标准,而要以企业的战略目标为标准,以企业的业务实践为标准,以企业的生存、营收、发展为标准。如果以这样的视角去看问题,你会发现:(1)市面上能够看到的和大数据相关的书,恐怕都是“兴趣”有余,“价值”不足;看得都很开心,但是细想对我的企业、我的业务有什么启发?很少!(2)对这些优秀的企业(例如:谷歌、脸谱、腾讯)有意义的“价值”很可能对我没有任何价值。也就是说,价值因企业不同而不同,因战略目标不同而不同。小心被高富帅带进沟里!(3)很多看似非常有意义的“价值”,但是在业务层面无法把成本控制在合理的范围内,无法通过用户友好的方式实现,继而也是没有“价值”。因此,什么是真正的面向企业的“价值”,不是非常容易定义。该定义受到:企业战略目标的影响,受到业务的限制,受到资源以及实现能力的约束。请问:这么复杂的一个问题,是不是“数据科学家”乐于思考的?可以思考的?在绝大多数情况下,他们不会思考,也无力思考这个问题。为什么?原因很简单:关我什么事情?你请我来做一个具体工作,我认真工作,然后拿工资回家。你这些“战略”问题,和我什么关系?你的公司第一天倒闭,我第二天换个工作就好了,反正这个世界非常缺乏“数据科学家”,我很好找工作的。这个刻薄有余的讽刺故事虽有点过分。但是也是想和创业者分享一个基本事实:从数据到价值的第二个阶段:定义和数据相关的业务问题,这是一个有关商业模式,或者业务模式的核心问题。只有企业的核心管理者,站在企业战略的高度,才可能关心该问题,才可能思考该问题。但是,能不能想得明白另说,而且目前看来,大概率想不明白。因此,永远不要有不切实际的幻想:请一个牛人,配备一个很牛的团队,然后一切就会翻天覆地的变化。清醒一下,不会的!这个翻天覆地的变化,应该怎么变,只有你才具备思考清楚的可能!

 

阶段3:数据挖掘与统计建模

 

如果我是一个车联网的管理者。我关心:从车联网的数据,能够产生什么价值?经过很痛苦的思考摸索,有一天我终于明白了,我需要建立一个从驾驶员的驾驶习惯到出险概率的关系。我希望通过深刻分析,产生对驾驶员有实际意义的指导,并通过用户友好的APP展示出来。我希望通过深刻分析,产生对保险公司定价有实际意义的指导,并通过风险评估的方式表达出来。那么,这个创业者顺利的完成了第二个过程。他清楚的知道:车联网数据里面到底要获得什么价值,是一个具体的从数据到业务的具体问题。在这个基础上,一个具备良好数据挖掘基础、统计学建模训练的专业团队,就可以接着往下干了。该团队可以通过尝试不同的、标准的统计分析方法、线型非线性模型去刻画该关系、预测驾驶员的出险可能性。因此,这是从数据到价值的第3个阶段。这个阶段是在清晰业务目的(第2阶段的产物)指导下的统计分析。如果没有第2个阶段清晰思考的指导,泛泛地告诉分析团队:我有车联网数据,请给我发现价值!大家可以设想,数据分析团队应该怎么做?能怎么做?所以,一个好的管理者,自己可以不懂数据分析,但是要有以下几点技能:(1)擅长做第2个阶段的工作,擅长于定义从数据到价值的具体业务问题;(2)擅长于督促鼓励自己的数据分析团队深刻理解业务。一个纯粹的统计分析或者数据挖掘团队是不可能做出好的成果的。设想一下,连业务都不理解的分析,能靠谱吗?常见的媒体常常把这一部分描绘得神乎其神。而我恰恰相反,我认为这是从数据到价值的转换过程中,最容易的一个环节。为什么?因为数据挖掘相关的计算机、信息技术、统计学专业是海内外各个大学现有的标准学科。也就是说:每年都有大量的人才产出。相应的统计分析模型也比比皆是。对绝大多数企业,能正确套用一个最普通的统计分析方法,往往效果就好的不得了。但是,如何做到正确套用?却需要在阶段2中把业务问题定义地清清楚楚!

 

阶段4:数据业务的实施

 

有了数据基础,想明白了从数据到价值的业务问题,也产生不错的统计分析模型。然后呢?然后就是业务的实施。有可能是一个新的业务流程,有可能是一个新的产品,有可能是一个新的算法。无论是什么,没有这临门一脚,前面的都白干了。业务的实施有无风险?有。有无成本?有。成本风险是否可以忽略?不好说。依赖于具体情境,非常不一样。我们常常乐道的,市面媒体中可以看到的大数据案例,如果把实施风险和成本考虑在内,估计很多都是没有价值的。我们能够看到的是,很多团队前面3步都做得很好,但是最后一步,或没有强有力的执行,或没有出类拔萃的产品设计,都功亏一篑。举一个具体的例子,很多朋友有网上银行账户,登录后可以实现查账、汇款、投资等多种业务行为。大家对各个银行的菜单界面设计感觉如何?我的感觉是:太专业了!我在过去至少10年里,一共用过不超过3种功能,但是我满眼看到的是几十个菜单选择。这背后是否可以有数据分析?看看人们的实际使用习惯是什么?这些习惯中的主要习惯是什么?如何把主要习惯和次要习惯平衡好?如何把这种平衡表达在产品的设计上,进而实现令人愉悦的用户体验?各位网上银行用户,我的体验你有相似的感受吗?这个问题分析相对简单,不就是看看人们的主要使用习惯吗。但是要完成最后的业务实施,难上加难!你发现我最常使用的功能是:查账和转账。请问:产品界面到底又应该如何改进呢?大家想想360的产品设计可以成为一个非常优秀的标杆。每天电脑开机告诉我:您的开机时间18秒,击败90%的同类型电脑。哇塞,我好厉害啊!于是,愉快的一天开始了。请问:这里面有什么了不起的分析?这些分析对错如何?鬼才知道。但是,360的产品设计,不服不行!

 

总结讨论

 

在以上4个阶段论的指导下,我们重新检讨一下自己企业在数据分析方面的实施情况。或成功,或不成功。人们常常把不成功归咎于:【阶段3】我没有人才啊!于是去谷歌、微软、腾讯、百度挖人才,达到预期了吗?;有时候会归咎于【阶段1】我没有数据啊!于是想做平台,做BD,做一切可以做的方法获得数据,然后呢?很少有人把自己的失败归咎于【阶段4】我没有出色的产品设计,没有流畅的业务流程,其实数据分析根本不在话下。更少数更少数的人,会把自己的不成功归咎于【阶段2】是我自己stupid,不懂得定义数据业务问题,手底下人没法干,大头苍蝇乱转!Guess What? 【阶段2】是我能看到的数据分析不成功的最典型的情形,是核心管理者自己不了解从数据到价值的转换过程,因此定义不出契合业务的数据问题。

 

这给商学院的教育带来什么启示?MBA的同学要认真学习《商务统计学》,尤其是王老师的《商务统计学》,呵呵!要深刻理解从数据到价值转换过程,能够准确清晰定义相关的业务问题。这才是MBA《商务统计学》学习的要旨!为此,要从三个方面努力:(1)深刻理解自己的业务,自己工作都不了解,做不好,啥能做好?(2)要拓宽视野,保持对数据源,尤其是新的数据源的敏感。具备一流的Vision!(3)要具备根据数据业务定义数据分析课题的能力,并根据该定义整合资源,最终实现从数据到价值的转换!

 

最后,请记住王老师的名言:“深刻理解业务,再会点回归分析,就可以搞倒一大片。”怎么不信?请试试看:-)

你可能感兴趣的:(数据)