数据治理的本质是盘点数据资产、治理数据质量,实施数据全生命周期的管理,这里面包括了建组织、立制度或者使用一款数据治理的软件帮助企业开展数据治理的相关工作等等。根据不同的数据治理项目特点,会用到不同的技术或工具。拥有一套趁手好用的平台和工具,无疑能够让您的数据治理工作事半功倍。
对于数据治理工具的选型,通常大家会关心以下问题,例如:
企业通常利用本地部署还是基于云的工具?
目前是否有中心化的数据平台?是否需要一个能与多个数据平台集成的工具?大概范围是什么样?
是否需要一个工具来处理来自多个数据源的大量数据?
用户是否需要自助式的数据服务满足工作流程中的数据需求?
数据治理工具全景图(来源:大数据标准工作组)
那么整体对于企业来讲,如何来选择一款数据治理的软件能更大程度的保障管理效果,促进管理目标达成,结合十多年的从业经历,给大家提供以下两个维度作为参考,既关注工具本身,也要考虑企业自身实力。
数据治理工具选型的首要因素是工具自身,具体可以从功能、性能、架构、采购成本四个方面进行考虑。
1、产品功能
对于数据治理工具功能的考察要结合企业自身的业务需求,要选择最适合企业现状和发展要求的。在数据治理领域,目前有两个学术流派,一是全面的数据治理体系,二是面向主题的数据治理,这两套体系没有谁高谁低,针对不同的企业选择适合的策略和适合的工具。
假如您的企业中没有或技术人员不足,那么选择的数据治理工具的功能一定要简单易用并且功能点要覆盖企业的业务需求,尽量减少定制化开发的功能。假如您的企业技术实力雄厚,可以选择一个稳定的框架,部分功能可以定制开发,这样也许更加易用和适用。
在功能指标上,不同的数据治理主题关注的功能和工具不同,例如:元数据管理、数据质量管理、数据标准管理、主数据管理等。从技术选型角度来看,数据治理工具落地需要考虑的功能列表有:
跨平台支持各主流数据库和数据平台的元数据信息
管理关键数据资产,如数据字典
跟踪和管理元数据操作历史和变更记录
批量导入和更新元数据
分配数据治理流程角色和策略
定义工作流程和管理用户权限
通过数据探查快速分析业务数据情况
自动化追踪数据质量指标和效果
……
这个话题会涉及很多技术细节,这里就不再一一展开了。但是,要重点强调的是数据治理工具的选型一定要了解其工作方式及其自动化程度,以及完成特定任务可能需要的特定功能。最后,至关重要的是要考虑数据控制、安全性和许可等因素。
此外,评估和选择数据治理工具不仅取决于功能,还取决于您如何使用这些工具来增加业务价值。例如,如果您对元数据管理有要求,请确保在使用具有该功能的数据治理工具之前,应该搞清楚为什么要用元数据工具,它能帮助企业的业务价值带来些什么或改变什么?
2、产品性能
数字化时代,企业的数据环境变得多样而复杂,大数据的4V特征(体量大、多样化、速度快、密度低)已经展现的淋漓尽致。考虑到需要处理的大量数据以及业务需求的日益复杂,对于任何正在评估的新技术和工具,都必须考虑性能和可伸缩性。数据治理的工具需要能够支持大量并发用户和非常大的数据集,尤其是针对数据模型工具、数据质量工具、数据集成工具、数据存取工具。
3、产品架构
产品架构包括了数据架构、技术架构、应用架构、安全架构、部署架构等。在数据治理项目中,数据架构更多的是需要根据企业的现状和需求进行规划设计的,比如数据的分层分级、数据的存储、数据的读取、数据的安全控制等。
技术架构重点是考察供应商产品的技术先进性。当下微服务架构、人工治理、区块链、大数据、云计算等都是流行的技术,如果您考察的产品用的技术架构比较老旧,则与主流架构生态的融合则会存在一定的障碍。
应用架构是从功能组件的适用性、易用性,以及功能组件的关联性等方面进行考量的。
安全架构是考察产品在数据安全防护和个人隐私数据保护层面的功能和成熟度。
此外,在部署模式上是否支持云部署也是一个需要考虑的点,因为很多中小企业不得不考虑成本问题,机房、服务器和人力资源都是需要投入资金的。
4、采购成本
数据治理工具选型通常会受到财务预算的限制,因而采购成本也是不少企业在选型时重点考虑的因素。然而,对采购成本的控制不等于简单的报价和还价,价低者为最佳,还应该包含对很多隐性因素的考量,比如购买成本、实施成本、升级成本、学习成本等。
现实中大多数企业都只关注购置成本,并试图将其最小化,而不是以总拥有成本为标准。正如前两年的云计算项目,出现了很多“0元中标”情况。事实上,这种看似购置价为“0”的项目,每年都需要需要投入大量服务费、运营费,总的成本并不低。要相信:“羊毛出在羊身上”。
除了前面列出的工具相关要素外,数据治理厂商的整体实力也是选型时需要考虑的重要方面。企业的数据治理是一项持续的长期工作,所以对于数据治理工具的选型要尽量选择能够长期合作的、靠谱的厂商。尤其是要当心一些概念炒作一流,拿不出“真货”的厂商,如果选择了这样的厂商,您的企业很有可能成为被拿来试验的”小白鼠”。
毕竟从某种意义上来说,数据治理厂商的能力决定着数据治理工具的优劣。在厂商层面,主要考虑解决方案、服务、品牌和市场4个要素。
1、解决方案
解决方案是数据治理厂商能力的一个重要表现,虽然不是直接反映产品和工具的功能,但是解决方案能力保证企业如何才能将工具使用起来的重要措施。这往往考察的是企业在数据治理方面上的实施经验或成熟的案例。数据治理解决方案能力主要包括但不限于:数据治理组织体系、数据治理流程体系、数据治理运维管理、数据治理考核体系等。
同时,是否拥有具体行业的解决方案反映出厂商对该行业的数据治理应用是否积累了丰富经验,对行业特点是否有较为透彻的了解。越来越多的企业期望将工具与企业具体业务做更好的结合,从而产出更大的价值。完备的行业解决方案能够帮助企业精准定位业务问题,对症下药,得到的效果自然也就更好。
2、服务
数据治理相关的项目都应该是更注重服务的,厂商在数据领域的咨询规划能力、专业业务和技术能力非常重要。其实,一旦数据治理产品在使用中出现问题,如果厂商无法提供服务,企业就需要再投入成本进行后期维护,这项工作极其困难而繁重。
比如厂商是否提供产品的配套文档或其他基于文本的材料,一般包括:产品手册、产品章程、产品规格说明、数字媒体、产品白皮书等;充分考虑厂商是否提供本地化服务,是否能快速响应,是否有完善的问题解决机制等,并且还要考虑对于企业一些特定的需求,厂商是否能提供服务支持对数据治理产品的二次开发。当然,如果您的企业技术和业务能力如果足够强大,不需要太多依赖供应商来的话,该环节可以忽略。
3、品牌
品牌是数据治理厂商整体实力、用户认可度和口碑的综合体现,无论买什么,选头部品牌总没错。在 B2B 领域,品牌就是厂商的形象。关于数据治理厂商品牌的评估,可以先看厂商的运营方式,比如是一站式服务还是组合式服务,再看厂商的经验和积累的口碑,比如是否有众多的成功案例,是否给企业客户带来了很大的价值。
4、市场占有率
市场就是最好的试金石,是工具和厂商两大要素的综合体现。激烈的市场竞争会自动淘汰掉产品能力差、生命周期短的数据治理工具,因此数据治理工具的市场占有率、行业地位、领先程度在很大程度上说明了其优越性,是 IT 进行选型的首要考虑标准。
以上是数据治理工具选型时,需要特别注意的几个方向 ,大家在选型的时候可以参考。很显然在数字化时代,借助类似于睿治数据治理平台的这些工具,可以加速企业数字化转型进程。受市场认可的软件其实有很多,选择时必须要结合实际的情况。一般的情况下,都建议选择市面上较主流的产品,比较容易达到好的效果,目前企业数据治理软件市场占有率前列的,就是亿信华辰的睿治数据治理平台,官网可以在线试用,大家对功能可以有个很全面的评估。