调研:黄勇 武宇
撰写:武宇 兰壹凡
前言
在数字化时代,各行各业都需要数据赋能业务,数据已经成为企业重要的生产要素,但在当下的企业中,数据管理普遍存在数据孤岛、标准不完善、技术缺失以及基础设施重复建设问题,企业亟需全面加强数据能力建设。而数据底座作为数据能力构建的基础,可以帮助企业运用最先进的大数据技术及多业态复杂场景的最佳实践,形成完善的数据资产运营和数据管理体系,构建兼备稳态和敏态的数据底座,为企业数字化转型提供长期支撑。
科杰科技CEO于洋在接受爱分析专访中表示:数字化时代,数据能力是立体化的能力,与在信息化时代建设的人力能力、财务能力、供应链能力等能力一样是企业必不可少的能力,但这些能力中只有数据能力是与业务深度融合的立体化能力,是支持企业数字化转型的核心能力,帮助企业实现规模化的数据智能和业务创新;同时也讲述了科杰科技在帮助企业构建数据底座、支撑数据能力建设方面的成功实践。
北京科杰科技有限公司成立于2019年,是一家数据能力构建商,致力于帮助客户快速构建数据能力,打造数据智能组织,推进数字化进程。基于领先的云原生的大数据与AI技术,科杰科技构建企业级湖仓一体数据智能平台KeenData Lakehouse,为AI科学家、数据开发、分析师等数据工作者提供数据管理、开发挖掘、协同共享、运维发布、DataOps一体化的全流程数据能力建设方案。
依托湖仓一体、存算分离数据底座产品KeenData Lakehouse,与领先数字原生企业最佳实践方法论服务能力,企业可以大幅度简化管理数据与应用数据的难度,实现体系化的数据开放赋能与规模化的数据智能落地。科杰科技已成功为政府、零售、能源、汽车、互联网、金融、通信、传统工业等行业百余家的大型客户提供数据能力构建服务,激发数据价值的实时释放,全方面实现数据价值反哺业务。
01
数据能力是数字化时代下企业必须具备的能力
爱分析:科杰对于自身的定位是“最值得信赖的数据能力构建商”,您认为应该如何理解“构建数据能力”?
于洋:首先必须明确的是,在数字化时代,数据能力与财务能力、人力资源等能力一样,是每个大型企业必须具备的能力。但是企业在构建数据能力过程中,往往面临技术缺失和重复建设等挑战。
企业如果缺少完整的数据基础设施,就无法有效管理数据资产,不仅仅是数据基础设施建设,陈旧的数据治理方法同样不能适应如今数据规模高速增长和数据类型快速变化的特性。更重要的是,如果企业缺少数据能力构建的长远规划,常常会陷入基础数据能力重复建设的困境。这种情况下,企业亟需通过更为高效的解决方案构建数据能力。
基于企业在数字化转型中面临的问题,科杰认为:企业构建数据能力是未来数字化转型的重点,而数据底座是帮助企业构建数据能力的最佳解决方案。科杰在成立之前,核心团队在十几年的时间里始终致力于数据底座解决方案的研发和沉淀,形成了以“领先的大数据技术+全域数据资产建设+大数据工作方法论”三位一体的解决方案,能够帮助企业快速构建数据能力,打造数据智能型组织,让数据工作体系化的开展,实现现有业务优化,加速管理升级,深化创新能力,开辟新业务模式,推进数字化进程。
爱分析:科杰科技在数据底座赛道深耕多年,您认为应该怎么定义数据底座?相较于数据中台等概念的区别是什么?
于洋:这个问题我们在早期融资过程中也经常被问到,当时由于资本市场对数据底座了解不多,主要的疑惑有两点:其一是数据底座能不能够作为基础平台支撑大规模的业务量,在数据底座基础上发展数据中台、业务中台、技术中台的可行性如何;其二是在解决方案和行业布局上,数据底座与应用层的关联关系是什么。
对于上述两个问题,我们认为数据底座的数据能力比数据中台所承载的企业价值更大,而且数据底座在构建数据能力方面更接近于数字化转型的真理,它是技术和运营管理对于企业整体性支撑最重要的部分,并且在各行业具备通用性。
完整的数据底座应该具备三个要素:大数据技术工程和 AI基础设施能力,全域数据资产管理和运营能力,组织性数据共享与规模化协作能力。
大数据技术工程和AI基础设施能力。数据底座需要具备以大数据为主,采用湖仓一体、批流一体、存储计算分离、数据编织、DataOps 的数据与研发运营一体化的基础能力,这一系列能力可以降低企业使用新技术门槛,形成一套产品化、可高效、可运营的大数据开发体系,面向多业态、复杂的业务场景,以乐高式的产品组合方式,持续高效的生产高质量可复用的数据资产。
第二,全域数据资产管理和运营能力。依托高度自主、灵活的产品,搭建企业组织级数据能力体系,包括:数据治理能力、数据运营管理能力、数据汇聚能力、数据处理能力、数据价值挖掘能力、数据共享交换能力、数据服务能力、数据应用支撑能力等八大数据能力,构建企业全域数据价值链,实现企业数据集中化、数据标准化、数据资产化、数据价值化、数据服务化,全面、高效、灵活的支撑企业数字化转型发展。
第三,组织数据共享与规模化协作能力。以多元化的数据共享交换和数据服务方式,为不同业务应用和人员提供按需的数据消费途径,持续支撑多业态、多人员共享协同开发,打造业务沉降数据,数据反哺业务的闭环模式,实现企业数据应用层面的降本增效。
我们认为,具备上述三要素的数据底座能够支撑企业未来 5到10 年的业务和技术需求,可以大大降低大数据基础门槛。在数据底座之上,企业可以管理所有数据,并且实现数据和开发的一体化融合。数据底座还能够支持不同部门人员协同、规范的开展数据工作,整个数据工作都聚合在数据底座里,有利于数据能力建设的整体规划,并且为数据工作实现持续化支撑。
02
科杰通过行业领先的数据底座解决方案帮助企业构建数据能力
爱分析:对于通过数据底座构建数据能力,科杰给出的解决方案是KeenData Lakehouse湖仓一体数据智能平台,可以向我们详细介绍一下KeenData Lakehouse吗?
于洋:在我们帮助企业构建数据能力过程中,湖仓一体数据智能平台是解决方案的核心基座。科杰科技湖仓一体数据智能平台KeenData Lakehouse全产品矩阵设计在存储计算分离、湖仓一体领先技术架构基础之上,自下至上由大数据基础平台Keen KDP 、数据同步系统Keen Dsync 、数据开发管理平台Keen BDP 、实时计算平台Keen Stream 、数据科学平台Keen DSP 、数据标准平台 Keen DSM 、主数据管理平台 Keen MDM、数据质量平台Keen DQM 、数据指标平台Keen Index 、数据服务平台Keen DaaS 、数据标签平台Keen TAG 、数据资产管理平台Keen Asset十二个产品构成。产品能力贯穿从数据采集体系建设、生产研发体系建设、资产治理体系建设、到数据运营服务体系建设的数据全生命周期;每个产品都可以与客户其他系统能力对接进行单独应用部署;最先进的存算分离架构帮助企业解决现有大数据平台、云数仓、分析型数据库等已有数据资产免迁移统一纳管的棘手痛点;完备的DataOps产品体系可支撑大型组织全角色精细化业务开展。
KeenData Lakehouse湖仓一体数据智能平台整体上构建了最完善的企业数据开发管理能力,它布局在IaaS 到 PaaS 这一层,能够囊括各种类型的数据源,具备纳管存储、流批一体和数据编排的能力,涵盖了批流一体、 DataOps等整个数据管理流程。
同时,KeenData Lakehouse湖仓一体数据智能平台可以利用企业已有建设成果,实现包容性支撑,数据源、数据仓库、云存储等都可以在KeenData Lakehouse上进行数据资产存储和计算。它能够以逻辑统一的数据资产和协作方式进行开发,是一种能长久支持未来数据工作的开放性架构。结合数据底座应具备的三要素,KeenData Lakehouse湖仓一体数据智能平台可以利用好企业原有的数据仓库和数据库,同时容纳、管理云化的资源,在上进行数据资产存储和计算,能够很好地支撑云迁移、混合云部署等需求。
今年科杰的湖仓一体智能平台KeenData Lakehouse入选了中国信通院《中国数智化产业图谱1.0》数据基础设施和数据中台版块,这也是科杰数据底座解决方案受到了国家官方机构的认可。让我们更加坚信数据底座的优势和价值,未来科杰还会在数据底座领域持续深耕。
爱分析:从过往的服务案例来看,科杰是如何通过数据底座帮助企业构建数据能力?
于洋:从过往经历来看,甲方企业数字化转型的目标是明确的,预算和项目是确定的,但是对于如何实现数字化转型却一头雾水。对于科杰而言,帮助企业整体性地建设数据能力,清晰讲解不同技术和企业整体建设,明确表述集团数据部门跟各类数据应用项目开发如何协作,给出切实解决企业痛点的方案,尤为重要。
针对这样的问题和痛点,科杰的落地方案是:首先,建设以湖仓一体技术架构为基础设施底座核心引擎,它的好处在于能够在充分利用已有数据架构的情况下对各方面数据纳管做长远支撑。
其次,科杰会根据企业现状给出针对性解决方案。虽然厂商技术包容性和长久支持性是第一位,但也要根据企业现状判断是不是要新建更全面的数据底座,还是在现有数据仓库、数据平台基础上进行建设。这要求厂商深入思考企业数据治理遇到了什么问题?企业的数据协作理念和管理办法是什么?改进点有哪些?根据实际情况因地制宜给出落地方案,并且真正在自有技术产品和解决方案上帮助企业更好地落地。
最重要的是,科杰注重从企业整体数据架构上给出解决方案。大型机构特别是大型银行的项目往往会专门配置人员做数据治理,但是传统组织架构中平台技术人员只和技术人员交流,数据应用人员和数据应用人员交流,双方常处于割裂状态。科杰的解决方案是将企业技术人员和数据应用人员融为整体,明确每个部门工作重点,建议企业组建相应数据小组,明确数据组面向企业、大型组织应该支撑的工作内容。同时,科杰还会评估企业部门割裂程度和建档程度,在不同方面给出建议。
在项目实践中,往往企业既存在对过往数据的存储需求、ETL性能提升需求,也存在针对月度、季度、天、分钟甚至实时的计算需求,存在对于数据开放项目的支撑需求,还存在能够在统一数据底座上制作数据报表、开发数据提取功能、面向更多组织分发数据的需求。企业的精细化需求既表明整体数据架构需要具备较高的计算性能,又体现整体数据架构在企业变革方面实现数据支撑和效率提升的重要作用。
爱分析:您介绍了很多科杰数据底座解决方案的特点,科杰是否有考虑通过自身优势进行更多的生态合作?
于洋:科杰现在已经有很多生态合作厂商,我们的KeenData Lakehouse作为数据基础设施可以灵活的支撑合作伙伴进行针对行业的数据智能开发和应用。考虑到应用层市场比单独的平台软件市场要大得多,我们也会通过与合作伙伴的合作进行各种数据应用的开发,支持合作伙伴运用行业know-how拉动业务提高商业智能化水平。从长远来看,企业自身定位和产业生态的关系不可忽视,通过与生态伙伴合作可以形成更完备的服务体系,科杰也会将生态建设纳入未来发展规划中。
03
国产厂商崛起,未来中国企业可以自主构建数据能力
爱分析:我们了解到科杰也参与了信通院《企业数智化能力成熟度模型EDMM》的数据中台及DataOps技术标准制定,科杰作为一家年轻的公司为什么可以和很多大型企业一起参与到企业标准制定中?
于洋:首先很开心看到主管部门在有意识地对最先进的技术标准进行定义,引导企业进行数字化转型,让企业在建设数据能力时有标准可依。《企业数智化能力成熟度模型EDMM》是由中国信通院大数据技术标准推进委员会主导,召集优秀厂商帮助信通院制定模型标准,而且完全是从纯技术角度去讨论和思考,梳理企业数智化能力建设及评估方法论,为数智化建设的过程提供指导和参考依据,为能力建设及运营的成果提供评估模型和评价方法。我们非常认可信通院这种公平讨论并且对技术和理念信息进行评估的方式,有利于总结出最符合技术延展方向的优秀能力。
科杰能够参与到此次工作也是源于科杰团队对大数据技术的专业理解和技术创新的能力,科杰的数据底座技术获得行业的广泛认可。此次标准的定义和制定也将极大地促进行业的发展,我们也特别高兴能够为行业做出贡献。
爱分析:科杰未来有哪些发展方向和目标?
于洋:科杰有三个目标,一是成为卓越的大数据技术创新公司,二是成为在大数据技术领域不断创新、面向客户提供标准化产品的公司,三是致力于为中国的大型企业提供数据底座服务,并且未来成为国际领先的中国大型数据基础软件服务公司。
在发展方向上,科杰希望在国产大数据领域帮助中国的支柱性企业构建数据能力,在行业应用方面跟各行业的合作伙伴进行协同,始终坚持为客户带来更好的产品体验。
爱分析:当今数字化时代下,科杰对于帮助企业构建数据能力方面有什么样的展望?
于洋:在整个数字化转型过程中,科杰希望帮助企业实现以数据驱动的增长发展和整体飞跃。过去十几年,中国的大量技术和软件产品大多是定制化开发、咨询服务或者外包形式,由国外厂商提供长远的整体建设规划和标准的大型软件产品。区别于信息化时代,在当今数字化时代下,中国国产自主的软件产品也在不断努力支撑数字化发展道路。科杰将专注于企业数据底座建设,以国产的大数据标准软件来支撑各行业数字化转型。我希望5到10 年后,中国优秀的企业软件商不但服务国内大型企业转型与数字经济发展,在面向国际大型集团也能提供优质科技产品与服务。