启路科技|2018数据环境中的 3 大思维转变

近年来出现了大量的新数据源,它们生成了前所未有的庞大输出量,并且输出内容通常结构化程度不高甚至没有任何结构,这可能是现代数据环境中存在的最大障碍。从点击流、服务器日志和社交媒体源到机器和传感器读数,来自这些渠道的巨量数据简直令人不知所措。从经济和性能视角来看,传统企业数据仓库 ( EDW ) 根本无法满足这一波数据浪潮带来的需求。

这促使人们全面重新思考数据捕捉和分析策略,最终开发出新一代数据存储解决方案,这种解决方案致力于实现无架构数据捕捉、硬件可扩展性,以及将计算能力提升到接近(如果无法超越的话)数据存储本身的层级。


IT 团队除了必须在当前任务中克服重重障碍,维护一个健康的数据环境之外,他们还需要确保用户可以随时从云应用程序中获取数据。许多组织都将 Google Analytics、Salesforce、Netsuite、Zendesk 等云解决方案用作其基础架构的核心部分。它们生成的数据对于组织报告至关重要。整合来自这些云解决方案的数据并使它们可供公司访问,已然成了一个对 IT 的标准要求。

由于自助式分析已成为各种规模组织的惯常做法,越来越多的非技术用户(未接受过正式的 It / 数据培训)将进行数据发现和报告,甚至包括数据准备和高级分析。采取此举措的企业通常会看到这样的结果:极大地减轻乃至完全去除 IT 团队开发分析工具的职责。对于采用数据驱动思维模式的组织而言,尽管这一转变对组织的整体成功至关重要,但也为 IT 团队带来了新的压力,因为他们需要提供更广泛的数据访问。此外,还需确保技术满足业务部门需求,以及 IT 对安全性和管控的需求。


为应对这些新的挑战,许多 IT 组织都竞相采用新技术和新方法,大数据解决方案、云数据集成以及自助式分析都可用来解决更大的技术难题,但为了能够在组织中有效部署这些技术方案,IT 需要改变工作方法。


3 大思维转变,IT负责人需要了解这些转变,才能支持组织制定数据驱动决策。


现代数据环境中的 3 大思维转变

1用“管道”思维代替“数据桶”思维


企业数据仓库并未被弃用,只是多了一些朋友。从 Hadoop 群集到NoSQL 数据库,关系 EDW 不再是获得正式批准的唯一数据存储位置。


这意味着,数据移动过程不再需要围绕单一位置集中执行。事实上,如今的现代数据平台更像是相互连接的神经组织,它们将组织 “数据大脑”的左半脑和右半脑连接在一起。将此平台与当今无处不在的云解决方案相结合,基础架构和服务在几个小时内便可启动管道/ETL 项目,您只需掌握在组织内移动数据的方法 - 这是史无前例的事情。


遗憾的是,许多 IT 团队大多错过了这个机会,因为许多组织的数据管理手册都是使用去年的 “万能单一数据桶”思维模式编写的。

[if !supportLineBreakNewLine]

[endif]

从 “数据桶” 思维方式转变为 “管道” 思维方式,其中的诀窍是接受这样一个事实:并非组织中的所有数据问题都能从任何一个数据源中找到答案。深入探索直接从消息服务器日志中擦掉的为期五年的电子邮件资产,这种对数据粒度的需求是 EDW 可能无法满足的。而 Hadoop 部署也可能无法根据实时分析需要对销售数据提供亚秒级的查询响应。在现实世界中,许多业务问题都需要以精细的粒度快速查询一个或多个数据源,而为了完成一个数据项目,则需要在不同的时段和不同的演替阶段进行这些操作。


业务用户如何找到其数据答案?大多数 IT 团队都知道,当前在整个组织内的电子表格中保存了许多未获批准的独立数据存储库。但是,对于这些孤立的、未经监管的本地文件数据的蔓延,IT 团队感到无力控制和管理。位于业务端的员工通常认为,围绕企业数据环境开展工作是唯一切实可行的解决方案 - 这就是他们的工作。


当 IT 团队全面了解业务用户查找、清理、分析和呈现数据的方式并为这一过程提供支持(同时就管控提供辅导)时,才能转变到“管道”思维模式。一旦技术团队坚定地认为,在传统批处理 IT 层面以及业务用户的即兴查询层面,数据移动比加固数据存储库更为重要,就会实现关键转变。

从全球角度来看,掌握所有这些信息并能够从中发现见解越发显得至关重要。


2使用基于需求的数据停放区


云应用程序数据不能始终直接停放在企业数据仓库中。决策应始终反映出组织的需求。或者,更清楚地说,决策应反映出需要采取哪些措施才能使数据对组织有用。


IT 团队(甚至那些已经接受 “不存在万能单一数据桶”的团队)有个常见的误解,即认为 Web 应用程序数据应自动直接整合到 EDW中。这在表面上合乎情理,因为许多成功的企业云应用程序是销售、营销和支持基础架构的必要组成部分。这些数据具有较高的指导意义、经常被访问,且通常具有优良结构。将这些资产放置在 EDW 中的投资报酬率(ROI)(其中,每字节的价格是最高的)貌似比较合理。

[if !supportLineBreakNewLine]

[endif]

但是,IT 团队需要思考的关键问题是:

[if !supportLists]·     [endif]是否可以直接从云端分析数据?换句话说,数据是否整洁,以及我们应不应该费力耗神地移动数据?

[if !supportLists]·     [endif]相关云数据的真正价值是否必须在与其他数据结合使用后才能实现?

[if !supportLineBreakNewLine]

[endif]

根据这些问题的答案,IT 团队将其云数据资产放在哪里(如果他们选择将这些数据资产直接放在本地环境)可能会因组织和应用而异,允许将没有删除重复数据的机会记录存放到 EDW 中,将会后患无穷。从不精确的佣金支出到大幅过度预计的收益数字,当处理未妥善清理的销售数据时,这些问题仅是冰山一角。

最终用户获得数据后,便能快速整合自己的基础报告。最终用户是产品和应用程序变化的最直接感受者,他们可以快速发现可能需要调整的地方。

——SHARON GRAVES,GODADDY 企业数据拓展专员


同样,如果记录的准确性不能让人信服,那来自 Google Analytics、Eloqua 和 Marketo 等云数据源的网站和营销数据可能会干扰组织跟踪销售线索流程和计算客户获取成本的能力。


当必须合并数据源时,此准确性问题会变得异常糟糕。当组织需要描绘完整的客户漏斗(从第一次网站点击一直到销售决策)时,通常会遇到上述情况。虽然几乎所有 IT 团队都知道整洁数据(无论来自云或其他数据源)的重要性,但他们通常不会思考当从Web 应用程序中下载后,这些数据会首先放在哪里。

但是,当处理在被企业广泛信任之前需要繁重和 / 或复杂处理的Web 应用程序数据时,IT 团队可以利用高计算速度、低字节成本的环境,例如 Hadoop 环境。借助上述第二种方法,资源可以在清理和转换数据时发挥最大作用,而不会影响 EDW 的速度。随后,处理业务的 IT 团队可以决定是否应该将清理后的数据移动到 EDW 中和 / 或在较大的环境中直接访问这些数据。


最后,请牢记一点:有时可能根本不需要移动云应用程序数据。许多 Web 应用程序正在为其后端存储库提供简便的接入点,这意味着业务用户可以使用自助式报告和分析工具,对实时数据执行各自的调查工作。针对这些情形,部分 IT 组织仍然希望拥有一个中间授权和管控层。究竟是否迫切需要移动数据(以进行清理和获得其他价值等),还是可以将数据留在原处并在业务用户级别进行集成?


3从数据保护者转变为数据指导者


应将公司内的自助式分析举措视为面向 IT 的握手提议,而非有敌意的接管威胁。那些首先伸出友谊之手的 IT团队将为赢得一切胜利做好准备。


不仅现代数据环境进行了扩展,以便不只包含关系数据存储;分析环境同样得到了改善,以便包括每天都为业务用户提供巨大价值的工具。此做法与传统流程背道而驰。在传统流程中,所有分析数据都由经过严格培训的少数尖端人才进行筛选。


结果,具有前瞻性思维的 IT 团队正在转变为其更大型组织内的数据和分析思维引领者,并且正在重新定义他们与业务团队的合作方式,从而解决数据难题。从“数据保护者”到“数据指导者”,这一 IT 思维模式的转变可能是现代数据环境中最重要的转变。此转变是决定组织能否成为真正的数据驱动型企业的一个关键因素。


重新定义 IT 与企业之间的这种关系,意味着将默认的数据管控态度从“禁止” 调整为 “允许” 。这个新模式假设公司任何部门的业务用户都可以访问任何数据资产,只要其不违反合规性条例即可。


通过这种方式来培训业务用户,可有效将整个组织的分析报告能力提升一个量级。此外,这还可以帮助组织在自助式分析解决方案方面更快地获得更高的投资回报。然而最重要的是,使用数据来更好地全面了解业务已然成为整个组织运营精髓的一部分。


3问题更难解决,但并非无计可施


从处理全新的数据存储和处理解决方案,到了解在何时、何地以及是否应该将云数据纳入到生态系统中,负责管理组织数据流的IT 团队的责任突然变得更加艰巨。此外,自助式分析举措以及这些转变共同实现了更大的成效 - 公司处理数据的方式发生了彻底的转变。


组织需要 IT 来指导它们完成这一转变。IT 团队之所以会感觉到不确定,大多是因为他们知道问题已不在于是否将新技术应用到现有业务流程中。大数据、云技术和自助式分析模式表明,IT 团队需要从根本上改变方式,才能打造现代数据环境。让繁复的数据回归简单的初衷,Qlik一直在用实践向人们证明着。

你可能感兴趣的:(启路科技|2018数据环境中的 3 大思维转变)