从《大数据时代》谈起

《大数据时代:生活、工作与思维的大变革》这本书放在架上已有半年,这次因为工作将其读起。

一、什么是大数据?
百度百科是这样定义的:大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 大数据的4V点:Volume、Velocity、Variety、Veracity.

二、本书观点存疑部分
本书提出了大数据的三个原则,这三点分别是:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。

“数据使我们不再热衷寻找因果关系,而应该寻找事物之间的相关关系。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。”

关于这三点的争议,参加《故作惊人语的<大数据时代>》一文,已经阐述的非常清楚了。(http://book.douban.com/review/6192978/)
一句话概括就是 “作者把三个数据分析人员一直秉持的原则,当做全新的东西讲了出来。”

三、本书观点认同部分
1.大数据与云计算是一个问题的两面:一个是问题,一个是解决问题的方法。通过云计算对大数据进行分析、预测,会是的决策更为精准,释放出更多数据的隐藏价值。数据,这个21世纪人类探索的新边疆,正在被云计算发现、征服。

2.大数据的核心是预测,它是把数学算法运用到海量的数据上来预测事情发生的可能性。目前看来是这样的。书中举例的机票价格预测、Google Flu等等,都是基于对海量数据分析后的预测应用。现有的大数据应用也都是基于此。

四、基于大数据的思考
由此书做引子,我更关注于国内对大数据的应用已经发展到何种阶段。根据我的观察,目前国内的大数据应用如下:
1、最先应用的是金融和广告营销行业。没有大数据就没有互联网金融,精准营销更不必说。根据消费者的海量数据进行消费行为的预测已经做的很不错了。

2、百度的大数据引擎。根据大搜索的数据,加之百度大脑的智能分析,得出想要的结论。
例子:
1)“东莞迁徙图” “春节热力图”
2)根据搜索的热度分析出在即将来临的假期某景点的人流量,类似于Google Flu.
3)交通方面,已经可以部分改善交通灯的设置,缓解拥堵情况
4)医疗方面,与疾控中心合作,力求解决医疗资源分配严重不均衡的问题

3、更加垂直的应用。如阿里的数据魔方,明星衣橱,娱乐产业收视票房预测,在线教育的猿题库,相亲交友的匹配测试等等,大数据的应用已深入到生活的方方面面。

4、好玩的点子和想法
1)关于农业方面的大数据应用:每一年都会出现农民大面积种植某种作物到导致该作物价格低廉,农民一年的心血卖不出价钱。如果可以利用大数据预测出全国区域农作物的种植图,那么就可以错开种植,就解决了该问题。
2)这是阿里的朋友提到的,之前阿里打算做却没做出的约会魔方项目。用系统标签将约会对象仔细分类,根据大数据得出该对象喜好的约会方式、内容,得出全套约会方案。作为女生,我表示希望这个项目永远不要被做出来,感情变成工具可得。

关于大数据未来有无限可能,如何真正利用场景与场景之间的联系,如何更好的为人类服务,同时还能够保证人类的隐私,值得继续思考。

你可能感兴趣的:(从《大数据时代》谈起)