数据量越庞大,数字化转型的意义也就越大,但转型这件事与企业内部多个技术部门紧密相关,它不是某一个单独的团队能够独立完成的任务,而是需要企业的业务部门、数据资产管理、开发应用等更多部门协同合作,因此,越是大型企业数字化转型的难度就越复杂。企业需要打破传统烟囱式架构设计,用全新的数据云模式来实现数字化转型。
01
数据、应用、基础设施—数字化转型亟待解决的三大难题
对于企业而言数字化转型包含三个要素:应用、数据和基础设施。而目前阶段,企业的每个要素都存在着不同的问题。
对于企业应用而言,不同的应用都是由不同团队独立建设、独立开发的烟囱式架构,这种架构导致企业不得不重复造轮子,不但造成人力和资源的极大浪费,同时也增加了运维和管理的成本。
烟囱式架构设计导致的另外一个问题就是数据孤岛现象,因为不同团队各自建设应用,数据没有打通,或者同一份数据在多个业务系统内保存,缺少统一标准,导致难以进行数据管控和质量提升,也难以从一个个孤岛中挖掘数据的价值。
最后一个要素是基础设施,企业在不同时期建设应用的时候,采用的基础架构也不同,基础设施多种多样,包括传统物理机部署、虚拟化部署、虚拟机部署、云部署、云原生部署等,基础设施不统一,导致建设应用、归集数据的压力非常大。
02
大数据与云技术的发展与融合
八九十年代时,企业应用多数是单体建设,基于独立的数据库、物理机或者虚拟化的方式。2000 年左右云计算出现了,建设应用的模式也发生了变化,对数据而言,这个阶段已经做到云上的统一收集。2018 年之后,云原生的概念发展起来,企业希望自己的应用是基于原生进行部署的,享受云原生带来的快速、弹性、灵活按需等能力。
对于大数据技术,已经从数据的统一归集到了大数据 3.0 模式,从数据资产到价值再到数据服务化。而现在对基础设施的要求就是能通过一套云原生的基础设施去承载企业的不同应用,收集企业的所有数据,进行企业数据化转型的大数据底座的建设。
数据是企业非常重要的生产要素,数据和数据价值的演进也经过了四个阶段:通过数据仓库和数据库对数据进行统一收集整理的数据统一化阶段、通过数据治理形成高质量数据的数据业务化阶段、通过数据智能与分析实现数据资产化的阶段以及通过数据共享交易实现数据的生态化阶段。
随着数据价值的演进,大数据和云技术也在不断演进以适应这种数据价值的挖掘,大数据的发展链条是从 2004年Google 提出大数据分布式计算框架 MapReduce,到加州大学伯克利分校的AMP实验室所开源的专为大规模数据处理而设计的快速通用的计算引擎Spark,到后来出现的低延时流处理引擎 Flink等更多机器学习框架大量涌现,处理大数据量大、快速等的特定需求。2017 年星环科技发布了首个基于容器云的极速大数据平台 Transwarp Data Hub。与此同时,云的技术也在不断演进,从开源的云计算管理平台项目 OpenStack到开源的应用容器引擎 Docker 再到现在基于K8S等技术的云原生。
2018 年星环科技,把大数据和云这两条技术进行了融合,星环基于底层云原生基础设施平台,把大数据进行了容器化部署和云原生调度,形成了星环数据云TDC,数据云是以新一代云原生技术为基础,以数据为中心,供完整的数据应用以及分析的开发工具,形成数据和应用互联互通的企业级云服务。
03
数据云,未来5-10年企业数字化基础设施
随着技术的进步和业务需求演进,企业的应用、数据、基础设施都在不停地迭代,这种迭代也促使数据云从概念走向落地。星环基于云原生的数据云 TDC 实现了数据 PaaS、应用PaaS、分析 PaaS 三云融合,未来企业的开发人员,就可以在这个标准化的 PaaS 服务之上完成 SaaS 应用的开发,而这也是将来 5-10年企业数字化基础设施建设的新模式。
TDC 的联邦云架构兼容多种基础设置,可以将企业私有云、公有云以及私有云和公有云混合基础设施进行统一接入和统一纳管,可利旧并兼容已建设的 IaaS 基础设置,形成完整的云基础设施,能够支持企业级数据应用云平台的长期演进。
在云在基础设施之上提供了数据 PaaS、分析 PaaS、应用 PaaS 能力。TDC 分析 PaaS提供了数据科学平台、知识图谱平台等智能分析工具,通过分析 PaaS 企业可以自主建模形成一些智能化应用;TDC 的应用 PaaS 提供了应用市场和应用开发平台供企业应用开发人员使用,通过应用 PaaS 企业可以建设不同的业务系统服务不同的部门;TDC的数据 PaaS 是提供大数据平台、大数据开发工具等,通过数据 PaaS 可以解决大数据开发、大数据治理等问题。
除此之外,TDC 提供了数据云管理平台Transwarp Data Cloud Management Platform,有了这个数据云管理平台企业用户就可以自服务的对大数据产品进行部署、运维、安装、扩容、升级。在云管理平台上星环把开源的以及星环自有的产品打包成一个自服务的产品,提供给最终用户。
未来,随着业务端人员对数据服务的需求越来越多,企业需要开发大量新的数据应用来持续的迭代业务,改进用户体验,这其中就包括实时类、AI类、在线数据类业务的大量创新和尝试。
而面对这样的趋势,唯有通过数据云的分层设计和更优秀数据建模,以及提供多种不同的数据计算能力才能够满足,数据云 TDC 可以根据业务负载进行弹性的伸缩,最终需要云计算技术来支持弹性、灵活的数据服务和应用。
企业未来 5-10 年的数字化转型之路,唯有以数据为核心,实现数据的互联互通,才能不断重构和升级数字化基础设施的建设新模式,以此作为创新与变革的支撑,实现企业数字化转型的升级和迭代。