新一代数据分析及实时数仓平台Greenplum,助力企业数字化转型

新一代数据分析及实时数仓平台Greenplum,助力企业数字化转型_第1张图片


9月28日,《Greenplum走进深圳》大会顺利举行,会议提供了线上、线下双渠道的参与方式,精彩的演讲内容获得了与会人员的一致好评。今天为大家推送的内容整理自Greenplum资深平台架构师牛云飞演讲的《新一代数据分析及实时数仓平台Greenplum介绍》。


随着企业的发展,分析也在变化,从单纯面向过去,逐步演进到全视角数据分析。数据逐步成为企业核心资产,数据的衍生价值也越来越大,企业都在努力从流程驱动型企业转型成为数据驱动型企业。


在分析1.0阶段,随着信息化建设的深入,企业积累了大量业务数据,用户洗完更了解一段周期内的企业经营情况。因此这一阶段企业以看到过去的描述型分析为主。整合业务数据、累计历史、通过报表、查询等形式,对业务历史数据进行统计分析。这一阶段,需要解答的业务问题是

  1. 业务以及发生了什么?

  2. 业务为什么会发生


在分析2.0阶段,企业不仅仅要对已经发生的业务进行评估,还需要对业务进行前瞻性预测。因此这一阶段企业以面向未来的预测型分析为主。需要建立数据科学团队,针对海量数据进行探索、研究,从数据中发现新的业务洞察。这一阶段,需要解答的业务问题是

  1. 已经发生了什么?

  2. 为什么会发生

  3. 将要发生什么?


在分析3.0阶段,企业希望提高分析的时效性,嵌入业务流程自动化、智能化驱动业务。因此,这一阶段企业以决定现在的运营型分析为主。监控业务,实时反映当前业务状况,进而,利用预测型分析的成果,驱动业务向我们希望的方向发生。这一阶段,需要解答的业务问题是:

  1. 已经发生了什么?

  2. 为什么会发生?

  3. 将要发生什么?

  4. 正在发生什么?

  5. 如何驱动业务发生?


为满足分析2.0或3.0阶段的需求,很多企业采用多种技术路线,建立多个异构数据平台,管理混合数据生态,提供多样化的分析能力。这一思路为数据平台建设带来了如下挑战:

  • 数据分散在多个异构平台,缺乏统一的企业级视图

  • 数据冗余存储,一数多源,存在二义性

  • 平台间数据共享、交换频繁,数据流网状

  • 技术路线复杂,增加了开发和运维工作量

全视角数据分析需要现代化数据平台。数据平台需要面向混合数据生态,基于多元化寄出设施,提供多样化分析能力。而Greenplum作为新一代数据分析及实时数仓平台,能够针对不同形态、不同时效性的数据具备高效的采集能力和海量数据管理能力。同时,还能通过标准SQL语言,集成各类企业数据源(如:Hadoop、对象存储等),保证数据访问准确、完整、及时并使用方便。

新一代数据分析及实时数仓平台Greenplum,助力企业数字化转型_第2张图片


Greenplum提供的服务既包括复杂的分析查询,也包括简单高并发的点查询,更有HTAP类型的分析。此外,还可以使用文本检索、机器学习等技术提供数据服务,具备多样化的计算能力。


现代化的数据平台需要应用于不同的分析场景,有些场景CPU敏感,有些强调IO能力,有些则需要按需搭建、弹性伸缩,Greenplum可以适用于不同基础设施要求。


戳下面链接观看完整演讲视频,深入了解新一代数据分析及实时数仓平台Greenplum。



点击文末“ 阅读原文 ”,获取Greenplum中文资源。


新一代数据分析及实时数仓平台Greenplum,助力企业数字化转型_第3张图片来一波 “在看”、“分享”和 “赞” 吧!


本文分享自微信公众号 - Greenplum中文社区(GreenplumCommunity)。
如有侵权,请联系 [email protected] 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

你可能感兴趣的:(大数据,数据分析,人工智能,java,编程语言)