从数据库开始,数据存储、调用及分析的生产力工具或平台就根据企业对于数据的需求不断升级,每个阶段的数据管理方式都是与所处的阶段特点所匹配。
数据中台与之前的数据工具不同,他的最大的优势为基于业务的框架设计对数据资产质量及应用的管理。数据中台居于前台和后台之间,是企业级的数据共享、能力复用平台,是数字化转型的基础和中枢系统。将企业全域海量、多源、异构的数据整合资产化,为业务前台提供数据资源和能力的支撑,以实现数据驱动的精细化运营,最终指向企业的业务场景。
上面是一张讲述数据中台价值体现比较通用的图,描述了数据和业务之间的一个闭环过程。
结合以往我们在数据领域耕耘多年的经验,我们认为,数据中台必须具备“安”、“畅”、“容”、“易”、“用”5个基本核心能力。下面重点来看看麦聪软件根据多年大数据经验的累积及数据中台的项目实践总结出来的数据中台技术架构,主要分为以下6个部分:
数据中台不产生数据,数据其实来源于各个业务系统、数据库、网络环境等等,是日常操作所产生的数据,多数存储在网络环境和存储平台中,且各个系统之间独立存在,很难直接使用,需要去进行数据抽取、采集、整合和处理,然后再采集到统一的平台进行存储,进而通过建模将数据进行加工处理,变为对业务有用的数据,只有这样才能有效汇聚数据,形成数据统一服务平台。
将采集补录、抽取整合的业务数据汇聚后,以数据形态存储。
数据平台建好后,业务数据可能杂乱无章,数据质量过低,这就需要经过一系列的治理提高数据质量,将数据统一起来进行管控,根据一系列规则,对库表数据进行校验和整改,进而评估数据的可用性和可信度,缩短数据查找时间。
经过数据汇聚、数据探查,已经形成的数据资源需要有统一的地方去进行管理,方便业务人员理解数据,这时就需要建立数据资产管理体系,根据业务先形成资产目录或标签目录,数据拥有者将自己的数据资产挂到对应的类目树,梳理成一套完整的资产目录,将数据资产开放出去,展示给业务人员或外部人员,提供企业的数据意识。
自助式查询,提供与主流数据库集群进行交互来分析处理数据,并且实现对hadoop的管理,连接查询系统,例如Hive,Impala等。针对单数据集数据的查询与访问,可以通过配置直接查看相关的样本数据,无代码的情况下完成对数据的查看,下载;对于通过复杂的数据关联或是计算才能完成的查询,系统支持通过SQL完成高级查询的模式,自动SQL语句提示和格式化,提高用户对数据进行复杂查询的要求。
经过前期一系列梳理工作,数据其实还没有真正发挥它的价值,数据服务则是将数据资产转化成一种服务能力,那么如果我们需要调用某个数据资产要怎么操作使用?数据提供方又如何将数据资产提供给别人使用?
这就是我们说的数据服务功能,接口服务配置化是数据服务管理平台最最核心的能力,低代码/零代码的情况下将接口生产流程产品化,数据开发人员、算法开发人员、甚至业务人员就可以自助完成接口配置上线,供应用端使用,以此帮助用户实现数据规划,数据资产服务开放以及数据可视化应用等。
数据API服务是数据价值输出的重要形式之一,但是,这并不能让人人都能够参与其中,为了更贴近业务,数据统一服务平台通过数据API构建的数据产品超市,助力提高IT效能,降低IT门槛,让更多非专业人员参与其中、设计、建设IT应用。
完整的权限和审批流程,切实保证数据安全以及一切行为可以被审计。
在数据中台项目落地中,我们可以根据具体情况对其中的一个或者几个部分的内容做重点的加强或者减弱,甚至可以只在其中一个方面做重点突破和攻关,为企业建设提供强有力的保障。
麦聪软件,作为全球领先的企业级Daas平台厂商,依托对数据业务场景需求的专业洞察,以高度产品化的数据统一服务平台,帮助企业敏捷构建跨平台管理的“数据超市”,提升各业务场景对数据的使用效率,帮助企业更高效、更安全、更经济地实现数据的资产化与服务化。数据中台的幕布早已揭开,如对麦聪软件数据统一服务平台解决方案感兴趣,欢迎留言探讨哦。
公众号:麦聪软件
软件下载试用入口: http://www.maicongs.com