浅谈数据思维的商业价值

数据思维的定义是什么?我在百度和谷歌上没有找到一个比较满意的答案。那么数据思维究竟是什么,我理解的是:数据思维是关于数据认知的一套思维模型。一个具备很强数据思维的人,最重要的是要考虑到一个事物从起因到结果的发展过程中所产生的数据流,而这个数据流其实就是记录这个过程的最好证据。今天我通过5个和数据相关的例子来举例论证数据思维所产生的重要商业价值。



 一张失败公交卡的启发


早些时候,微软亚洲研究院做过一个很有趣的实验,是给经常坐公交的北京市和石家庄市居民免费发放上万张公交卡,里面预存了10块钱。参与实验的市民可以免费使用这些公交卡。通过对这些公交卡刷卡记录的数据进行分析,研究人员期望可以绘制公交流量的全景图,定量化分析公交线路和班次设计的合理性,并提出基于数据挖掘的优化建议。


实验过程很顺利,大概80%的卡的数据收回来了,但是打开数据的时候,惊讶的发现,北京的很多公交车的刷卡记录中完全没有正确记录该乘客上车的地点和下车的地点,有的各站之间的公里数都是明显错误的。而石家庄公交的乘客刷卡数据,每条线路的站名、站间距、乘客上车点和下车点、刷卡时间,等等,都有非常完整准确的记录。为什么石家庄做的很好的事情,北京却做不到?后来发现,因为北京公交车的费用和坐了几站、有多远没有什么关系,相关的工程技术人员只考虑收取费用的眼前需求,完全没有想过海量乘客在什么时间点,从哪个地方上了哪一路车,过了多长时间,到哪个站下车。


这些数据对于北京交通的情况的理解、建模和优化,有特别重要的研究价值。因此,企事业单位、政府机关、高效研究所,等等,在采集存储自己生产、经营、研究、管理过程中的数据,要有长远数据战略储备的眼光。


快递员通话记录蕴含哪些商机


运营商的数据很有价值,大家都知道。其中很重要的一块,就是用户的电话呼叫记录数据,运营商内部针对这些数据挖掘的价值维度很成熟。在这里,我重点聊聊通过对呼入、呼出电话记录的数据分析,找出北京从事快递行业的人员号码,有哪些价值和商机。


这些快递人员的号码,在众多号码中是很容易识别出来的。因为快递从业人员打出的电话非常多,但是接到的电话相对较少。另外,通过和轨迹数据结合起来分析,几乎可以找到所有快递人员。


找到这些所有的快递人员有什么用呢?价值大了去,通过他们的通话记录,可以找到一个城市里面几乎所有网络购物行为的消费者电话,并且知道他们的网购频率,同时还可以找到一些很好的渠道来推广可能的电子商务产品。不仅如此,还可以知道消费者手机号码背后的主人有没有买车、是哪家银行的客户,因为买车的人通常会给4S店或者维修厂家打电话,工商银行的客户,通常会打95588,或经常收到工商银行的短信。这些数据都是属于隐私信息 ,数据分析的过程一定会经过严格加密的,手机号码加密后是一串很长的乱码。


从行为数据预测学生考试成绩


在大学里,大学的考试基本上一个学期只有一次,所以如果一位同学在暑假迷上了网络游戏,开学后即使完全不学习,最早也得半年后等到学期期末考试成绩出来,才能够看出一些端倪。也就是说,考试作为对学生学业发展的一种评估手段,是静态和滞后的,并不能实时发现学生学习行为的异常。


那有没有可能通过收集学生在学校日常被动积累的数据,对这些数据做分析,早期发现学生学业发展中的异常情况,并进行预警和干预。大家一下子就能想到的与学生成绩有关的数据,包括学生历年的考试成绩、选课记录、教材与参考书的图书馆借阅记录,等等。这些数据固然有用,但是要做到精确的成绩预测,并且同时发现学习行为的异常,还远远不够的。在寝室待得越久,成绩是否越差?进图书馆的次数越多,成绩是否越好?去水房打水的次数越多,成绩是否越好?吃早饭越多、洗澡越规律,成绩是否越好?食堂打卡记录是否可以定位孤独人群以及他们心理状态的变化?这些数据维度,对于预测学生考试成绩,都会有很大的帮助。


但其实遗憾的是,绝大部分大学,这样的数据是没有被收集的,无法支持这么详细的研究。所以说,当前大学校园要建设大数据的一体化平台,其建设的宗旨是为了更好地辅助教育,最大价值的发挥教育数据的外部性,因为学生的行为数据蕴含着大量有价值的信息,而且这些数据是实时的,能够及时抓住当前学生的异常问题,避免“亡羊补牢,为时已晚”的悲剧。有人说,这么隐私的数据被收集和使用,会引发巨大的争议。但我认为,个人信息的适度开放,会帮助更好实现教育的宗旨。


 像播天气预报那样实时发布CPI指数


在宏观经济测度中,有一个非常重要的指数,叫居民消费价格指数(CPI),它是作为一个反映通货膨胀的重要经济指标。正是因为CPI的重要性,快速而准确地计算CPI指数,对于国家宏观决策有至关重要的价值。遗憾的是,CPI指数在实时性和准确性方面往往都不尽人意。


为了克服以上问题,阿里巴巴集团研究院发布了网络零售价格指数(ISPI),它综合反映了淘宝和天猫平台的网络零售交易商品和服务的一般价格水平。表面上,淘宝和天猫的消费只是整个国民消费的一部分,但由于阿里是全量采集的这些数据,比国家统计局通过抽样的方式获取到的数据要多得多。因此,ISPI指数是CPI指数的重要补充,能够快速和准确地提供价格信息,为相关决策部门提供决策依据。


有意思的是,另外一家叫做Premise的初创公司通过付费众包模式将大宗日常消费品的价格采集任务分派至当地居民身上,全球700多人须每日到特定便利店或者超市采集至少多250种特定商品的图片和价格信息,每采集一样商品可获得报酬5-15美分。一部智能手机加上700多名当地员工就能掌握全球的CPI指数变动信息,他们利用这些数据和许多消费品公司建立了长期合作关系,同时他们还为客户提供定制化的数据采集服务,比如自家感兴趣的产品或者竞品。当然,他们的采集也有不足之处,比如众包人员在数据采集过程中犯错误而导致数据的不准确。


 通过分析小区垃圾实现线下广告精准投放


线下媒体(尤其是楼宇电梯广告)如何做到精准和细分,让投放广告的广告主更有效锁定自己的目标受众,这对分众这样的广告公司来说是一个巨大的挑战。传统的方法,就是在和物业签约的时候,将物业提供的所有资料都录入到数据库当中去,同时还会向物业公司问更多的问题来补充为获取到的信息。但是这种传统的方法所获取到的信息维度不够丰富、不够具体和准确、也无法做到及时更新。


相比传统的方法,分众在全国的小区很早就建立了自己的垃圾分析网,通过对垃圾的分析来研究小区居民的用户画像和品类/品牌偏好。他们给小区卫生管理员配一把扫描枪,看见垃圾里的条形码就扫,扫到的数据会实时同步到数据库。这样就可以知道这个小区主要喝什么水、喝什么酒、用什么油.....通过这些数据,关联这些产品的价格信息,就可以洞察这个小区消费者的品类偏好、品牌偏好和消费水平。这种方法的变革,相比传统方法,很大程度上是在做通过大数据库积累形成的变革,随着这些垃圾数据的积累,基本上可以对小区居民做到精准的细分和洞察。



数据思维其实很早就有,但直到近几年,随着大数据技术的飞速发展,重新又回到了思维认识的高度。既然数据思维如此重要,那么如何提高数据思维,根据我的经验给出3条建议:首先,基础知识是思维能力的基础。数据领域涉及到的基本知识,大家要掌握扎实。其次,日常生活和工作中,要时常关注所看到的数据,对数据保持足够的敏感性。最后,多思考数据背后的东西,把数据转化成知识,让数据产生真正的价值。


你可能感兴趣的:(浅谈数据思维的商业价值)