一、什么是大数据
大数据已成为互联网等新兴领域促进业务创新增值、提升企业核心价值的重要驱动力,成为国家重要的基础性战略资源,正引领新一轮科技创新。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
在众多定义中,比较有代表性的是3V定义,即认为大数据需满足如下3个特点(3V):
规模性(Volume):数据量应为PB级,甚至EB级别。 1EB=1024PB 1PB=1024TB
多样性(Variety):数据的种类是多样的,除了结构化数据以外,还包含半结构化数据以及非结构化数据。
高速性(Velocity):实时分析数据,并获取需要的信息。
二、大数据的重要性
1.数据已成为一种资源,能为社会经济服务。
淘宝网:推出了淘宝平台上的大数据应用解决方案——数据魔方服务。通过这一服务,商家可以了解淘宝平台上的行业宏观情况、自己品牌的市场状况、消费者的行为情况等,并可以据此作出经营决策。
亚马逊:建立了在线分析引擎,通过在海量交易数据中定位客户和获取客户反馈。 在此过程中,亚马逊发现数据量越大,分析的结果越好,带来的利润越高。
2.大数据与国家发展战略息息相关
2012年3月,美国奥巴马政府公布了“大数据研发计划”(Big Data Research and Development Project)。 该计划将大数据称为“未来的新石油”,美国联邦政府下属的六个部门和机构宣布投资2亿美元,合力研发核心技术、整合相关应用人才,大力支持协同创新。 已经把大数据研究上升为国家发展战略。
气象数据为理性救灾指明道路:大数据对地震等“天灾”救援已经开始发挥重要作用,一旦发生自然灾害,通过大数据技术将为“理性救灾”指明道路。抓取气象局、地震局的气象历史数据、星云图变化历史数据,以及城建局、规划局等的城市规划、房屋结构数据等数据源,通过构建大气运动规律评估模型、气象变化关联性分析等路径,精准地预测气象变化,寻找最佳的解决方案,规划应急、救灾工作。
数据的开放共享是建立开放型、服务型、现代型政府的开始。通过以上案例可见,各国加快数据开放已成为必然趋势,在行政领域围绕大数据与时俱进大有文章可做。通过数据开放,政府正在成为“数据资源化”的带头人,并引导数据更深层次渗透,成为滋养全社会福祉的重要源泉,成为推动信息和经济发展的重要依靠。
三、大数据处理技术
大数据的处理流程:
1.数据抽取与集成:将来自不同数据源以及不同种类的数据进行有效的组织。
2.数据分析:对数据进行有效的分析,发现其中有价值的信息或者知识。
3.数据解释:以一种易于理解的方式将分析结果呈现给用户。
关键技术:云计算
大数据的基础平台和支撑技术。 如果将各种大数据的应用比作一辆辆“汽车”,那么支撑起这些“汽车”运行的“高速公路”就是云计算。 正是云计算在数据存储、数据管理与数据分析等方面的优势,才使得大数据有用武之地。
大数据时代已经到来,大数据是继云计算、物联网之后,IT产业又一次颠覆性的技术革命,对国家治理模式,企业决策、组织和业务流程,以及个人生活方式等都将产生巨大的影响。 对大数据进行合理的分析和管理必将推动科技的进步、企业的发展,同时也会为社会提供更多的利益和创新性成果。
在大数据时代,必须从基础研究做起,增强学科内、学科之间以及学术界和工业界之间的合作与交流,群策群力解决大数据时代面临的新挑战,获取大数据所蕴含的巨大价值。