国外专家支招:实施大数据分析项目,企业如何避免失败?

毫无疑问,大数据分析为企业提供了新的洞察力,可以帮助其更好的应对竞争对手,同时,也为企业带来了新的收入增长点。然而,如果数据分析项目失败了,也可能会给企业带来巨大损失,特别是大量资金和时间的浪费。

如何避免数据分析项目失败?从企业管理角度出发,有一些基础准备工作是必须的:首先,一定是由公司的管理层推进并购买相关服务或工具,以确保能够获得足够的技术和资金支持;另外,企业需要对员工进行专业技能培训。如果这两项基础工作没有做好,那么其他一切都无从谈起。

假设这些基础工作已经完成,而您正打算选择一款数据分析工具部署到业务系统中,这时,需要注意哪些问题呢?以下是 Computerworld 特约撰稿人 Bob Violino 给您的六条忠告,希望对准备使用大数据分析产品的小伙伴有所帮助。

谨慎选择数据分析工具

国外专家支招:实施大数据分析项目,企业如何避免失败?_第1张图片

任何供应商都会将“大数据”或“高级分析”一词放在他们的产品介绍中,试图利用这些术语进行炒作。但往往很多产品在功能和效率上有着很大的不同。即便选择一款功能强大的产品,它也未必能够满足你的需求。

几乎所有的大数据产品都会有一些基本特性,比如数据转换和存储架构(想想 Hadoop 和 Apache Spark),但在数据分析方面,还是有很多不同,比如在数据挖掘、预测分析、实时分析、人工智能以及智能仪表盘等方面。

在决定购买任何大数据分析产品或存储平台之前,你需要真正了解公司的业务体系和需求,以便选择能够有效解决问题的产品。

比如,如果有处理大量的复杂数据(文本、音频、视频等)的需求,那么你需要选择一款能够分析非结构化数据的产品;反之,你只需要一款性价比较高的产品就足够了(大部分数据分析产品都支持结构化、标准化数据)。此外,在进行产品选型时,至少需要对比两种产品,还要注意该产品是否可以与企业内部的系统进行对接。

每款大数据分析产品都会在系统中建立数据模型,这也是项目实施过程中最重要的环节,而此环节必须确保是由供应商和企业业务负责人共同完成,尽管这会浪费一些时间,但绝对没错。

另外需要注意的是,优秀的产品会将数据分析结果呈现并翻译成“商业语言”,业务人员可以完全看明白,从而根据这些信息改进业务流程或寻找新的商业机会。

确保分析工具简单易用

大数据分析是一项非常复杂的技术,但是对于企业业务人来说,根本无需知道产品是如何访问并分析数据的。企业所需要的就是一款简单高效、用于数据采集、分析以及可视化的工具。

“找到合适的数据分析工具确实很困难”,域名注册商 GoDaddy 负责 BI 分析的 Sharon Graves 表示,“它必须简单并可以快速可视化,而且还能够进行深度分析。”

此外,更重要的是,一定不要向非技术人员(业务人员)提供“程序员”级别的工具,他们会疯的!

国外专家支招:实施大数据分析项目,企业如何避免失败?_第2张图片

项目、数据与实际业务需要相结合

正如之前所提到的,数据建模环节需要由软件供应商与企业业务负责人共同完成。Experian 首席科学家、高级副总裁 Shanji Xiong 博士也认为,“导致数据分析项目失败的一个重要原因就是,企业最终并没有解决业务中所存在的真实问题。关键在于,在项目早期一定让具有专业背景的数据科学家参与进来。”

据 Shanji Xiong 博士介绍,之前 Experian 公司在做数据分析项目时就碰到了一个这样的例子。“当时,我们需要一套数据分析解决方案来打击身份欺诈,其中存在两个技术挑战:第一是分析客户姓名、地址和 PII(社会保障号)等这些个人信息;第二是分析客户申请贷款的相关信息。”最初 Experian 认为这两种情况可以被看过同一个问题去解决,但实际上,它们需要创建不同的数据分析模型。

建立数据湖泊,千万不要“吝惜”带宽

过去,很少有企业可以存储如此多的数据,更不要提进行有效的组织和分析了。而在今天,不管是在云端还是本地,高性能存储和大规模并行处理技术已经被广泛应用。

但是,光靠存储还远远不够,你需要能够处理不同类型的数据,从而再进行大数据分析。这也就是 Hadoop 的最大优势,它支持存储和处理巨大的不同类型的数据集,这些数据集我们称之为“数据湖泊”。真实的湖泊会包含许多种动植物,而数据湖泊则包括众多数据源,以及不同类型的数据。

“数据湖泊绝不是堆积数据的场所,你需要考虑如何以有价值的方式聚合数据、扩展其属性。创建数据湖泊,并进行采集、索引、标准化,是大数据分析策略中非常重要的一环。”亚利桑那州立大学计算研究主任 Jay Etchings 说。

“同样,拥有足够的带宽也至关重要。否则,会严重影响数据湖泊从数据源提取数据的速度,以及业务人员进行数据分析的流畅度。” Jay Etchings 认为,“从社交媒体趋势到交通状况,都非常依赖实时分析,而这就要求你的数据湖泊要有足够的带宽。”

每一个环节都要考虑安全性

国外专家支招:实施大数据分析项目,企业如何避免失败?_第3张图片

大数据分析让企业拥有了从数据中获取有价值信息的能力,“但有一个问题是,系统管理和安全会变得更加复杂”,Jay Etchings说。在大数据分析系统等关键任务上,如果未采取足够的防护措施,那么无疑会产生大规模问题。

众所周知,企业采集、存储、分析和共享的大部分数据都是客户信息——其中一些信息更涉及到个人隐私,如果这些数据落入他人之手,结果将是:企业可能会面临法律诉讼和监管部门罚款、品牌和声誉受损以及客户的不满。

对于准备部署大数据分析的企业来说,安全措施不仅要包含一些基本的工具,例如实时数据加密、身份和访问管理、网络安全等,还应包括对员工进行如何正确访问和使用数据的相关培训。

数据管理和质量是“头等大事”

良好的数据管理和质量控制,已成为所有大数据分析项目成败的关键因素。企业需要确保数据的及时更新,准确并实时进行传送。

在 GoDaddy 公司的大数据分析项目中,如果数据更新延迟或失败,系统都会自动报警并通知给系统管理员。此外,系统也会对针对一些关键指标进行数据质量检查,如果出现不符合预期的指标,系统也会发送警报。

为确保数据管理和质量控制,企业最好雇佣专业的数据管理人员(数据管理总监)或由管理层人员进行监督。

注:本文由 DataHunter 编译自 Computerworld《How to avoid big data analytics failures》,作者Bob Violino。

你可能感兴趣的:(国外专家支招:实施大数据分析项目,企业如何避免失败?)