大数据的最大价值不是在于揭示过去,也不是反映现在,而是预测未来。
大数据不是随机样本,而是全体数据,不追求数据的精确性而是混杂性。
大数据揭示的是相关性关系,而不一定是因果关系。人的固化思维是寻找因果关系,而忽略了相关性关系的价值。
案例一:Farecast 飞机票价预测系统
众所周知,同一个航班,在不同时间买的价格是不一样的。而实际中发现并不是越早买价格越低。那么在某个时点“买还是不买,这是一个问题”。
通过预测机票价格的走势以及增降幅度,Farecast票价预测工具能帮助消费者抓住最佳购买时机。从一开始的41天12000个价格样本基础的模型雏形发展到截止2012年超过十万亿条飞行价格记录,Facecast预测美国国内航班的票价准确度已高达75%,使用Farecast票价预测工具购买机票的旅客,平均每张机票可节省50美元。
ITA Software就为Farecast提供预测机票价格所需的数据,Farecast通过分析得到了数据大部分的间接价值,它把其中一部分价值以更便宜的机票的形式转移给了它的用户,而把这种价值带来的利润分给了它的股东以及员工。Farecast通过广告、佣金,最后通过出售公司本身获取利润(微软以1.1亿美元收购了Farecast公司)。
案例二:大数据智能零售-零售商的革命
《纽约时报》曾报到阐述Target公司怎么样在完全不和准妈妈对话的前提下预测一个女性会在什么时候怀孕。一个顾客怀孕后会改变消费观念,会光顾以前不会去的商店,会对新的品牌建立忠诚。Target通过顾客购物关联性研究,能够比较准确地预测预产期,这样就能在孕期的每个阶段给客户寄送相应的优惠券。
在零售行业,大数据应用非常广泛。沃尔玛通过要求供应商监控销售速率、数量以及存货,做到“Just in time”,实现零库存。同时拥有数据库记录不仅包括每一个顾客的购物清单以及消费额,还包括购物篮中的物品、具体购买时间,甚至购买当日的天气。通过分析大量数据,发现季节性飓风到来时,不仅手电销售量增加,蛋挞的销量也增加了。看似毫无因果关系的相关关系被发现,沃尔玛会把库存蛋挞放在靠近飓风用品的位置,来提高销量。
每位顾客原本没有什么价值的购物清单,开始发挥出另一份价值。除此之外,沃尔玛还尝试用Facebook好友喜好和Twitter流量与内容等外部数据分析来实现智能零售。
案例三:UPS大数据实践
UPS国际快递公司从2000年就开始使用预测性分析来监测自己全美60000辆车规模的车队,以及时的进行防御性修理。如果车在路上抛锚损失会很大,造成延误和格外的人力物力负担。若每两三年对车辆零件进行定时更换,则并不有效,很多零件并没有问题就被还掉。通过监测车辆各部位运行状况,只需要更换需要换的零件,从而节省了几百万美元。
UPS还利用地理定位数据优化行车线路,为货车定制最佳行车路径一定程度上是根据过去的行车经验总结而来。这一分析方式,在2011年使得UPS驾驶员少跑了近4828万公里路程,节省了300万加仑燃料,减少了3万公吨的二氧化碳排放量。系统还设计尽量少左转路线,因为货车左转需要等待更久,也更容易发生事故。
案例四:强大的“现实挖掘”
麻省理工学院媒体实验室人类动力学实验室主任Alexander “Sandy” Pentland和他的学生Nathan Eagle是“现实挖掘”的先驱。“现实挖掘”指的是通过处理大量来自手机的数据,发现和预测人类行为。在一项研究中,他们通过分析每个人去了哪里、见了谁,成功地分出了感染流感的人群,而且在感染者还完全不知道已经患病之前就作出了区分。如果出现非常严重的流感疫情,这将会挽救无数人的生命。
收集用户地理位置数据变得极其具有价值,根据他所居住的地点和要去的地方预测数据,可以提供定制广告,这些的信息汇集可能会揭示事情的发展趋势。比如向司机提供不同时段的最佳出行路线等。
无线数据科技公司Jana的创始人伊格尔,使用了来自100多个国家超过200个无线运营商的手机数据。他的研究既包括家庭主妇平均每周去几次洗衣店,也试图回答疾病如何传播和城市如何繁荣。还分析出非洲付费用户的位置信息和他们的账户资费金额,发现资费与收入成正比。
所有的附加信息都是源于手机提供的位置信息的间接利用。而随着应用的广泛,手机能记录的大量数据变得越来越有价值。目前已有不少互联网企业就运营商数据进行分析,以揭示部分商业规律,提供附加商业价值。
案例五:大数据思维FightCaster和FlyOnTime
并非只有本身拥有大量数据才能利用数据发现商业价值。大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。
FightCaster和FlyOnTime使得人们可以交互地判断恶劣天气使某一特定机场的航班延误的可能性有多大。他们利用政府提供的开放数据和互联网免费提供的官方天气预报来预测,充分体现了一个不收集或控制信息的实体单位是如何像搜索引擎或大零售商一样,能够获取数据并利用其创造价值。
案例六:数据中间商Inrix
本身不具备数据收集能力的公司也能通过汇集各方面数据来创造价值。
位于西雅图的交通数据处理公司Inrix,汇集了来自美洲和欧洲近1亿辆汽车的实时交通数据,这些数据来自宝马、福特、丰田等私家车和一些商用车。通过把这些数据与历史交通数据进行对比,再考虑天气和其他诸如当地时事等信息来预测交通状况。
Inrix是典型的独立运作大数据中间商,把各种渠道汇聚起来的数据能产生的价值远远超过他们被单独利用时的价值。而且随着数据量增加,预测数据会更加准确。分析交通情况并不会影响一个人是否购车,所以这些同行业的竞争者并不介意行业外中间商来汇聚他们的数据。
其实Inrix收集的数据比表面上看的更有用,它可以被用来评测一个地方的经济情况,因为其能提供关于失业率、零售额、业余活动的信息。甚至一些投资资金会对这些分析结果感兴趣。
大数据价值链上有过很多类似数据中间商,比如Hitwise、Quantcast、Health Care Cost Institute等公司或组织都通过汇集数据发现了其中的价值。
大数据能与物流业、制造业、零售业、医疗业、服务业、教育业等等大多数行业很好的联系在一起 ,在数据化的时代,生活和工作需要大数据思维,让我们以开放的心态、创新的勇气拥抱“大数据时代”,数据会给予你足够的惊喜。
Bingdata优网助帮汇聚多平台采集的海量数据,通过大数据技术的分析及预测能力为企业提供智能化的数据分析、运营优化、投放决策、精准营销、竞品分析等整合营销服务。
北京优网助帮信息技术有限公司(简称优网助帮)是以大数据为基础,并智能应用于整合营销的大数据公司,隶属于亨通集团。Bingdata是其旗下品牌。优网助帮团队主要来自阿里、腾讯、百度、金山、搜狐及移动、电信、联通、华为、爱立信等著名企业的技术大咖,兼有互联网与通信运营商两种基因,为大数据的算法分析提供强大的技术支撑。