读《开放数据》——关于比肩互联网新机遇

最近偶然读到《开放数据:如何从无处不在的免费数据中发掘创意和商机》一书,书的作者乔尔·古林曾任美国白宫Smart Disclosure(智能信息披露)特别工作小组组长,《消费者报告》杂志编辑主任及执行副总裁、美国联邦通信委员会消费者和政府事务局局长,在数据挖掘、开放数据应用方面有丰富经验。从出版时间看这本书算是比较近期的出版物,是2015年出版的作品(Copyright 2015 by McGraw-Hill Education),中文版由中信出版社出版发行。看过内容后觉得我们在这方面的工作其实还挺与时俱进的,因为书中提及的很多理念和实践感觉在我们周遭的生产生活中并不陌生。读后印象相对清晰的有这样一些内容:

读《开放数据》——关于比肩互联网新机遇_第1张图片

一、什么是开放数据?

作者认为如果你收看天气预报、使用GPS定位功能、研究上市公司财报来选股票……那么,你就是在使用开放数据。开放数据是我们步入信息时代以来最具革命性的发展之一。不同于专业机构才能获取、分析、利用的“大数据”,开放数据是免费、定期发布、完全公开透明的,任何人都可以重复使用。并且作者进一步认为这是一个经常被我们忽略的巨大免费资源库,而这些免费数据中蕴含着无限商机。因为作者认为开放数据是公众、公司和机构可以接触到,能用于确立新投资,寻找新的合作伙伴,发现新趋势,做出基于数据处理的决策,并能解决复杂的问题,它不同于“大数据”,虽然它们的确有所重叠。开放数据的优势就是基于免费、开放的数据构建可行的商业模式。其对于企业没有任何的成本可言,而通过适当的利用则能为企业创造巨大的价值。比如Google Maps是“Google自己的数据”+“政府提供的GPS数据”结合开发出来的;美国The Climate公司,利用气象数据,销售气象保险,进行农业耕种革命。于是作者大胆判断:开放数据对企业完全开放,就像互联网给大家带来的机会一样巨大,毫无边界。

我觉得看到这里就容易让读者兴奋地浮想联翩了,因为互联网的兴起确实带来了巨大的机遇并造就了巨大的社会财富,然而随着互联网发展的深入,竞争格局的逐渐明朗、确定,其中留给公众和企业、机构的机会空间都不多了。这个时候要是突然有人跟你说有个和互联网一样巨大的机遇摆在面前并且还没有得到应有的重视或关注,你会不会有种提前站到了风口上的感觉呢?然而再深入揣摩一下,却也不难发现作者所言的这种开放数据发展存在的悖论。

二、开放数据的悖论

作者之所以说开放数据是一个可以比肩互联网的巨大机会关键在于这样一个前提——即公众、公司和机构可以免费、持续、重复地使用来自政府、企业、科学界、技术、零售、社交媒体等各种开放数据库的数据,并基于这些开放数据分析、发现社会需求、问题,然后在这个基础上进一步做决策、解决问题,构建可行的商业模式,最终实现共赢和良性运转。可是这里面让人感到困惑的是如果有公众或组织通过使用开放数据成功建构了商业模式,在解决一些问题或需求的基础上获得利益,那么这些开放数据的提供方——政府、企业、科学界等等是否会有足够的源源不断开放共享其所掌握的数据的动力?说白了,既然可以通过免费获得数据并加以利用的方式赚钱,那作为一个自带数据获得能力的参与方,为什么不直接自己做这件事呢?另外,政府、企业、科学界等这些有能力获得数据并选择是否开放数据的开放数据库本身在什么数据能开放且愿意开放,而哪些不能的问题上应该本来就有诸多复杂的标准和考量。这样一来,开放数据的“开放”前提本来就不是毫无障碍的,进而后面的利用开放数据构建商业模式创造价值的所谓巨大机遇也就不是完全理所当然的。这里确实存在一个悖论。

不过从事实上看,政府、企业、科学界、技术、零售、社交媒体等领域的开放数据库确实在不断地提供公开的数据,这些数据有的是需要主动开放的,比如前面作者所说的来自政府机构的GPS数据、气象数据之类,有的则是本身就具有公开属性的,比如海量用户在社交媒体平台上发布的各种信息。所以悖论虽然存在,但开放数据的发展之路也确实并没有被堵死,换而言之,每一个开放数据的玩家,如果单凭自身所掌握的数据,可能并不能顺利地分析并解决问题,并在此基础上构建起能够创造价值的商业模式。相反,只有更多掌握数据的机构将一些数据开放,然后才可能实现通过不同领域、维度的数据综合分析发现原来在单个领域或数据维度的分析中所不能发现的问题和需求,进而构建起能够创造社会价值的商业模式,最终实现共赢。从这个角度讲,要么大家都别开放数据,谁都别指望从别人的数据中得到好处;要么大家都开放数据共享,谁能从中发现需求和问题并解决掉来构建起商业模式就八仙过海各显神通。这可能也就是作者所表达的“开放数据”跟“大数据”虽然重叠又有所不同的地方:如果一个机构为了实现特定目标,自己就能够搞定从数据获得到分析、应用的一整个链条,那这种运转模式是“大数据”。如果在数据获得的环节需要其他数据供应方提供数据,那这种运转模式是“开放数据”。二者确实各有不同又有所重叠。在我看来,相同的是不管“开放数据”还是“大数据”,数据都已经越来越明显地成为了一种资源,而真正的竞争在于是否能够获得数据资源以及如何分析、应用数据资源的能力。至于在数据资源上的竞争,最终的可能则是要么大家免费共享,就好像自然界的空气,要么数据资源有不同的主人享有产权,就像自然界的矿产资源,而“开放数据”所要倡导的就是资源免费共享,以此激发全社会利用这种数据资源的创意和能力。

三、你的数据你做主

《开放数据》这本书里提到了一种个人数据库的应用,简单说即是通过网页或移动应用,个人可以搜集和获得诸如自己的购物记录、保险、贷款记录等个人数据并存储在安全的私人云端。同时,个人可以自己决定如何使用这些数据,特别是可以决定可以让这些数据通过付费获得的方式提供给想要这些数据的商家。通俗地说,现在消费者信息买卖泛滥且消费者自己不知情,(相信很多消费者都在各种节日促销的时候收到过各种促销短信,又或者接到过各种不同机构打开的营销电话)如果这样一个个人数据库的应用建立和完善起来,那么消费者可以自己觉得要不要把这些个人数据卖给商家和卖什么价格,而不是被人卖了也不知道。尽管这种个人数据库的建立在数据采集和保护方面还有诸多困难,但听起来确实还是一个挺不错的idea。

另外本书还谈及关于开放数据在教育、医疗、金融、能源和消费者服务、科研创新等领域的应用,基本上是介绍加举例的方式,对于不同行业的从业者或许有不同启发。

你可能感兴趣的:(读《开放数据》——关于比肩互联网新机遇)