来源 | 凯哥讲故事
越来越多的企业配置两个乃至三个技术管理者角色,首席信息官CIO,首席数据官CDO,乃至首席技术官CTO。今天,作者将从DataOps的角度来看企业的数据价值链中的角色及分工。
一、DataOps的定义
为了制作出色的音乐,乐团需要各种独立的,熟练的音乐家在同样熟练的指挥下一起工作。凭借其乐器上的所有创新和作曲家的才华,乐团的成功归功于人类在瞬间的完美协作,理想的情况是使一切看上去都毫不费力。
而DataOps的目的也是如此。
行业里对DataOps的定义是:
“DataOps is an emerging set of Practices, Processes, and Technologies for building and enhancing data and analytics pipelines to meet business needs quickly.”
一系列实践、流程和技术的组合,帮助更快的建立满足业务需求的数据和分析流水线(Data Pipeline)
下面这张图,很清晰的说明了DataOps的重要性:
总结:
加快,最大化企业数据资产价值的生产是DataOps的使命。
DataOps是企业中加快数据交付和数据的工业化体系,就像DevOps一样。
二、数据价值链的八种角色
DataOps的核心用户群是以下八种角色:
1.数据提供者
“我如何能够让业务跑的更快,让我的数据更准确呢?”
数据源所有者拥有数据,数据源所有者是哪些业务系统的负责人。
他们的最终老板是CIO,他们通常具有IT技能,通常在企业应用程序架构级别。
他们购买,运营/维护并拥有主要的运营应用程序(例如,ERP,CRM,SalesForce等),业务数据库(例如,Oracle,MYSQL)以及与第三方数据供应商的关系。他们还需要查看其数据以及谁在使用它们。
虽然数据源所有者一般不直接去处理和加工数据,但他们需要与数据准备和处理者去沟通。
这样,他们可以从数据消费者那里接收查询,需求和及时反馈。
“我如何能够更清晰,高效的管理源数据,让他们错误更少?”
DBA听上去已经是一个很古老的名词了,在十年以前,ITPUB 还如日中天的时候,DBA论坛的Oracle版高手云集,现在的多个数据领域大咖都出自于DBA这个群体。
DBA是为了让数据源系统的效率更高能够应对业务的快速变化,让数据产生的更正确,更高效,更一致,更稳定。
DBA是数据准备者的真正的甲方,他们对于数据源系统的结构了如指掌,清晰地指导整个数据产生的过程,结构,这里的存储过程都可能会出哪些问题。
如果数据开发和消费工作者发现业务系统的DBA的时候,恭喜你,你拥有了解开通向过去的复杂数据历史的钥匙,你看见他后,第一件事情是,请他吃饭。
“我不关心数据的设计,我只关心业务的效率和需求的满足”
数据源系统的技术专家,包括架构师,开发人员等。
这些角色,是源数据产生的源头,为什么要设计成这样的结构,为什么这个字段是Int型,而不是String型,为什么这两个表之间要有一个关联表,所有的一切历史的故事,都是由他们的协作工作产生的,所以,如果你需要了解数据背后的故事,你需要他们的支持。
2.数据准备者
“如果我可以简化和加快构建数据管道以更好地为消费者服务的方式怎么办?”
数据工程师是IT中长期建立的角色,是DataOps的灵魂和灵魂,但如今他们的最终老板是CDO。
数据工程师将原始数据转化为消耗品,建立了复杂的数据流水线,以自动化统一数据的交付。DataOps 的目的是就是使数据工程师能够摆脱传统工具(ETL,SQL)和瀑布式方法的限制来准备数据。
他们喜欢敏捷的数据准备和处理的方法,他们希望有AI驱动的,人工指导的数据工具快速迭代,可重复和可扩展的方式,加速原始数据从源到数据消费者的业务就绪数据的转换。
“我可以为你提供更全面,更负责任的数据来源”
数据连接者是在DataOps和CDO下运行的新角色。
数据连接者,连接消费方和生产方,以确保数据消费者以最佳方式获取最准确的数据。
很多时候,数据消费者需要找一个权威人士,为其业务中的每个核心实体(例如,客户,供应商,产品)寻找来源,而这就是数据连接者的价值。
他们为各个项目创建可信的版本,精心挑选适当的数据资源资源供消费者使用。
数据连接者在数据治理中也扮演着重要的角色,以确保数据分发符合公司治理标准。随着企业数据分权的增加,企业需要寻找更多的数据连接者。
在作者所在团队,将这个角色叫数据业务分析师(Data BA)。
“如果我能够更轻松,安全地跟踪和改善关键数据源,该怎么办?”
数据管家是在DataOps和CDO下运作的另一个不断发展的角色。数据管家将对数据源的理解与对数据源的使用知识相结合,以创建策略,确保正确使用(管理)并不断改进数据及其有用性。
Stewards利用新工具从消费者那里收集连接数据时的反馈,并将这些反馈合并以推动数据源修复和治理策略更新。
通过系统地收集和管理数据反馈,Stewards可以将精力集中在最受欢迎或质量最低的数据源上。
3.数据消费者
“我希望在任何时间地点都能够以我需要的格式获取所需的数据怎么办?”
数据公民是业务的最前沿人员,他们每天使用通用的业务应用程序和数据可视化工具制定关键的业务决策。他们的最终老板是CMO,CFO,CPO和其他“ CXO”。
他们需要从一个来源直接将准确,及时和“任务就绪”的数据传送到其工具中。
例如:他们需要能够在不知道到达那里的技术差异的情况下将所有客户数据收集到一个地方。
这代表这一个数据民主化的趋势,让所有的业务人员都能够自由的,容易的使用数据。
数据分析师
“如果我能够获得更好,更干净的数据,从而以更快的速度向我的CXO提供更好的见解该怎么办?”
数据分析师通常通过PowerBI或其他工具中内置的仪表板和报告为业务提供关键的见解。他们的老板是CMO,CFO和业务中的其他决策者,他们了解业务的分析需求,但需要来自多个来源的准确,整洁和最新的数据,以及在何处查找的知识它。
尽管它们比一般的数据公民更了解内部数据,但不良数据却浪费了他们的时间,并可能延迟对时间至关重要的洞察力。
所以,如何让数据分析师能够获取高质量的数据,是最重要的。
数据科学家
“如果想使我的模型和算法更快地部署和运行,该怎么办?”
数据科学家是数据供应链的科学家,是价值链的顶端。
通常他们会疯狂地运用数据来解决各类的业务问题,他们为预测分析和其他竞争优势来源建立模型和算法,他们的老板是企业的CMO,CFO和其他高层决策者。
他们高效的处理多个来源的准确,干净和最新的数据,以及有关在何处查找以及来源所有者的知识。
而数据科学家的敌人还是“数据质量,”当“不良”数据进入模型和算法时,它将对业务产生多米诺骨牌效应,研究表明,数据科学家的工作,70%左右仍然是花费在数据处理和准备上。
数据开发人员
“如果我希望在不重新发明轮子或不打扰DBA的情况下更快地将应用程序推向市场,该怎么办?”
数据开发人员从公司数据构建业务应用程序。例如客户360门户或供应商管理应用程序。
他们的老板是CMO,CFO,CPO和其他“ CXO”。
他们需要来自多个来源(包括来自企业外部)的准确,干净和最新的数据,以及有关在何处查找数据源及其所有者的知识。
尽管使用了诸如Python和REST之类的先进,开放式开发工具的支持,他们花费更多的时间来担心公司数据源的准确性,却花更少的时间来创造性地将数据编织到引人注目的业务应用程序中。
三、CIO/CDO/CTO的数据分工探讨
随着技术在企业的重要性的增加,越来越多的企业加大了对于技术部门的投入,将技术部门进行了细分,也有越来越多的企业设置了多个技术管理角色,CIO,CDO和CTO。
在这种情况下,从DataOps的视角来看,CDT应该如何分工呢?
参考如上的三个阶段:
CIO是业务数据化的负责人,是数据提供者的主要负责人,是所有业务数据源,源系统的总管。
CDO是数据准备,数据产品开发的负责人,是二次加工源数据的团队的总管。
CTO,如果有的话,应该是CIO和CDO提供统一的,标准的,技术架构和技术能力,把握技术方向的技术架构师团队的负责人。
CIO对源系统数据质量负责,CDO对整体数据架构,数据加工,生产的数据产品和数据服务的质量负责,CTO对技术选型,技术架构的先进性负责。
三者一起为业务部门提供更好的数据智能服务。
文末福利
领取方式:扫描二维码关注公众号
回复关键字【日历】
邀请10位好友助力即可
往期精彩回顾
首批!智领云CTO宋文欣入选“开源GitOps产业联盟技术委员会”成员名单
喜讯!智领云《云原生数据中台》获“财资中国2021年度好书”殊荣 | 文末赠书
如何使用DataOps,为你的业务实现最大价值?
DataOps指南:数据管理新时代来了?| 内附万字秘籍免费下载
DataOps:现代数据管道的精髓
更多智领云科技详细内容,点击“阅读原文”