樊登:前两天我拿到了一本书,题目特别好,叫作《数据思维》,副标题是从数据分析到商业价值。我觉得,未来的大数据会像电一样会成为我们的一个基础设施。所以,每一个在现代生活的人都得具备数据思维,否则的话你会吃大亏。
我就说一定要把这本书啃下来讲给大家听,结果翻了一下发现看不懂,因为里边好多数学知识。虽然我原来数学也不错,但是真的是已经远离了。好在这本书的的作者王汉生教授,他是北大光华管理学院的统计学著名的教授,也是我们樊登读书会的会员。他特别开心地来到我们作者光临,给大家讲讲最近的这本新书,叫《数据思维》,欢迎您王教授!
王汉生:谢谢樊老师,非常荣幸能到这儿来。因为我自己就是樊登读书的会员,我跟樊老师,还有很多朋友都讲过。我自己是个理科背景的人,尤其在宗教、美学、人文方面的素养特别差。樊老师给我分享了很多,我学习到很多特别好的东西。这次也是一个特别好的机会,所以来当面说声“谢谢”。
樊登:太开心了,能影响到北大的教授,我真是三生有幸。
前两天王教授写了一篇文章,里边写到在光华管理学院教统计学是一件非常困难的事,非常有挑战性。因为底下坐的都是些大佬,都是些企业家。他经过很多这样的商业的行为,老师们没有干过这事,所以经常会被底下的学生挑战。那您讲这个可以说有点枯燥、有点难懂的统计学,是怎么说服那些企业家能够开开心心地听下去的?
王汉生:这个是一个慢慢成长的过程,第一次上课的时候,自然是非常有挑战性的。我曾经跟我们的年轻老师们开过一个玩笑——因为我们有统计系,我是统计系的教员。我们还有营销、战略、组织行为、经济学、金融学等等。我说:“你们是没有吃过猪肉,但是至少见过猪跑的。”
这就是说,即使有一天,年轻的老师从来没有跟企业有真实的合作经验,那么,至少当你是学生的时候,当你读研究生的时候,你的老师会给你讲非常多管理学大师的经验和教训,有很多案例。我的背景从小到大是偏数学的,属于没有吃过猪肉,连猪长什么样都没见过的。
那对我来说,这自然是个很痛苦的、漫长的、历练的过程,经常讲着讲着挺高兴的——讲个啤酒尿布的故事。同学就举手说:“王老师你讲得好像很有道理,你干过没?”那很尴尬。
很客观地说,我就只能当场认怂,说“这故事我也是听来的,我也没有干过”。看人家怎么看这件事情就是了。
当时对我来说可能有两个选择,一个是这学生太调皮了,算了,以后换一个高大上的,把他糊弄住。另外一种就是我直面这个痛苦,我要解决这个问题,所以我就从2003年到光华,现在2014年,这11年中我非常近距离地看我们中国的数据产业是怎么样一个个变化起来的。
当然非常幸运,北大光华有一个特别好的平台,我们自己的MBA同学、EMBA同学、ExEd的同学都非常优秀,跟他们能学到很多东西。在这个过程中慢慢地去理解在中国的制度环境下,我们的数据是怎么样变成商业价值的。从这些我们合作中产生的案例,再到课堂上的时候,那就好太多了。
樊登:今天您的任务其实也挺挑战的。咱们只有不到一个小时的时间,您要给这么多的书友普及一下数据思维到底是怎么回事。那咱们就先从这个定义开始,您觉得什么叫数据思维?
王汉生:这是一个特别好的问题,先说我们如果在百度上搜“数据思维”四个字,那么会跳出一堆一堆的东西来,让人怀着无限的敬意。我想人家说的也是数据思维,但是可能跟我讲的不大一样,没有半点理由说,我说的就是对的,人家就是错的。那在我的脑袋里,数据思维关心一个核心问题——我常常问:同学们,我们为什么要做数据分析?是为了追求高大上吗?是为了追求茶余饭后讲点段子吗?
不是,在商业实践中,我们做数据分析的唯一的目的是要解决业务问题、创造商业价值。所以,数据思维在我这里,就是用了四个字总结了我这十几年摸索的一套方法论。什么方法论?让数据怎么变成商业价值,这是我说的数据思维所代表的核心的问题。
樊登:这是一个定义,那具体来讲数据思维有哪些方面?
王汉生:我把它总结成三个方面的内容。第一个就是我们要深刻地理解数据和价值之间的关系。这里的价值我指的是商业价值而不是科学价值。因为数据之于科学价值,可能是从亚里士多德到牛顿那个时代,大家都知道的,不言自明的。
但是商业价值很重要,为什么?我们如果说,不清楚数据与商业价值的关系的话,数据产业也许就是一个空谈,所以,第一个,我们要关心数据和价值之间的关系。
樊登:那这个关系的建立,您有没有一个案例?
王汉生:我们举一个特别具体的例子,中文的文本是不是数据,我们肯定会认为点评是数据对不对?那为什么跟中文文本相关的数据分析的产业和商业产品,是在过去的20年差不多也才兴起的,才变得热火朝天的?它跟我们技术的进步是有关系的。
樊登:按理说古代就该有,但是没有。
王汉生:那时候没有技术手段,所以,在我脑袋里我给了它一个非常狭隘的定义,但这个定义可能带着个人的偏见。但这个定义帮助我们比较轻松地理解数据的商业价值。
什么是数据?在我的脑袋里凡是可以被电子化记录的才叫数据。其他你也可以定义数据,但那种定义对于我理解数据产业的商业价值和它的发展帮助不大。从这个角度看,数据的定义有着非常强的时代特征。因为不同的时代赋予我们不同的技术手段,所以,1000年前图像不是数据,现在是了。1000年前可能文本声音都不是数据,现在都是了。
如果我们有一个这样数据的时代观的话,它自然而然产生的一个问题是:在未来什么东西会变成数据?那么,这应该是在投资和产业发展中很关心的问题。未来还不能扯太远,太远了没有意义,可能我们自己都已经不存在了。未来的四年到五年,这是一般的基金它要求回报的一个自然的周期。那么,在未来的四到五年里,什么样的东西正在变成数据,这是我们关心的一个特别要点。
樊登:就好像我们原来认为堵车这事不是一个数据,但是现在堵车可以非常完整地呈现出来;出租车过去是想往哪儿跑就往哪儿跑,现在有了滴滴以后它变成了数据;OFO把自行车数据化了。那将来还有什么可以数据化?
王汉生:这些全部都是依赖于我们技术的进步给它们提供了机会。樊老师您正好提到特别好的例子。我们现在说图像是数据,这好像已经是过去时了。那么,您提到OFO、提到了滴滴,这些都跟有一个基础的技术是相关的,就是跟我们的车联网、物联网的技术成熟相关。
我们自己的团队非常幸运的是亲自经历了这个过程。大概两到三年前,当我们谈到车联网的时候,我们可能还认为是一个理念,因为在国外的媒体上,我们能够看得到。
那么,在过去的两三年里,我们亲眼看到我们自己的中国有很多优秀的创业团队陆陆续续地起来,他们把技术做成熟了。现在无论是大卡车也好,小汽车也好,或者自行车也好,都能够大量地采集这样的数据了。
但为什么我说它是进行时,这条路似乎还没有走完?因为技术成熟之后,它的商业化还没走完,仍然是一个巨大的问号,我们看到的情形是在国外,比方说这种车联网数据的商业化的一个重要的手段,可能是这种保险,叫作Usage Based Insurance(驾驶行为保险)。
那么,在中国好像是这条路是挑战重重,未来的出路在哪里,我们都在拭目以待。这就是个特别好的例子,它的数据带有强烈的时代特征。
樊登:这就解释了为什么从数据能够变成价值,就是在保险业当中,只要我能够获取更加准确的信息,我的保费就可能会更低。
王汉生:有可能,而且你的利润率还更高。
樊登:或者对某些人我就得收更高的保费。因为你过去没法区分,所以造成了大量的社会交易成本,这是第一个方面的数据。