你已经有拥有了的工具和能力来捕捉大数据,但搞清楚你想从中得到什么以及最终如何提取它,才是决定性的挑战。

数据网络和存储的进步表明企业组织正捕捉着越来越多的数据。

企业CTO可以弄清楚全部数据存储部分——他们有着到位的MongDB云数据库,或者他们从Cloudant租DBaaS。但一个企业究竟如何处理所有这些非结构化数据呢?

首先,是要明确企业想要的是什么。如果企业不清楚自己的大数据需求,它可能得自求多福了。

明确大数据需求

大数据分析,就像所有IT行业,是由业务需求决定的。企业必须在处理大数据之前弄清楚自己的需求。

世界上没有两片完全相同的树叶,企业同理。因此,需求总是发展变化的。IT部门可能会收到如下需求:

  • 为即时报告处理数据;

  • 飞行中解码遥感;

  • 在巨大数量的信号中大海捞针;

  • 在巨大数量的信号中发掘常规操作模式。

分析是服务导向的领域,因此CTO可以只是完成他自己的工作并将其余的外包出去。如果他决定“自力更生,不接受外援”,则需要做另外一些事情。

获取一些分析应用程序

分析应用有助于将大量数据集转变为商业价值。企业使用分析工具来处理有利于应对非结构化数据的困难的工作。

数据分析产品是大数据技术之一并活跃于数据专家的工具箱。分析产品通常不提供现成的商业价值。

当企业购买分析应用时,它们必须为培训预算留出充足的资金,因为复杂的工具并不直观。

写大数据方针

管理大量数据集是项棘手的工作。大数据管理者有大量的移动部分去配置,以迎合如下需求:

  • 保留原则是什么?数据池的什么部分可以被删除?什么时候删除?剩余的历史数据又会怎样?

  • 数据保护原则是什么?谁去查看数据?法律限制是什么?

  • 数据存储在哪里?如果云供应商控制着数据,如何拿回它?

  • 需要什么样的元数据?如何确定大数据存储的目的?

  • 有多少数据集?它们如何被混合?

集结一支分析团队

首先,构建一个团队是与业务执行和IT赞助合作。两者都需要!

企业可能有数据仓库和数据挖掘,但很可能没有数据专家。可以通过几种途径获得:

  • 雇佣专家。

  • 雇佣有合适能力的人,并让他们学习。

  • 洞察企业中有潜力的统计员。

依然存在一些缝隙

一些大型企业或组织,像电信公司和全球零售商,已经是常年与分析的问题作斗争。它们有专门的团队、本地工具和多年的经验。

大数据和商品化的数据分析的华丽新世界正浮出水面,路漫漫其修远兮。

  • 企业宁可对已有数据集做着一些新的事情,也不愿搜集新数据。

  • 现有大量大数据工具,但准备好为商业用户使用的是少之又少。

  • 全球许多地方的企业或组织尚未开始开发大数据。

  • 需要更好的机器学习来从噪音中提取信号。

从大数据获得价值,需要统计、技术和业务专家,即便有分析工具,都得为业务需求而定制——这不是一个放之四海而皆准的世界。