利用多种数据智能技术实现数据驱动的分析与决策,已经成为当前企业数字化转型最重要的目标之一。随着数据来源日益丰富、数据体量快速增长,企业对数据的依赖和挖掘愈发深入,不仅带来数据应用场景、数据用户角色的复杂和多元,也使得企业对于数据应用的敏捷性和即时性的要求变得越来越高。
为满足日益增长的数据应用需求,企业在数据能力建设逻辑上正转向以业务为核心,基于业务需求完善数据智能基础设施构建,如尝试通过DataOps、指标中台等概念实现数据和业务部门之间的高效协作。
市场在技术和解决方案的供给上,也正以特定业务价值实现为驱动,变得更分化和聚焦。市场中分化出多种针对特定场景的数据平台解决方案,如针对风控、营销场景的实时数据平台,针对工业、物联网场景的边云协同数据平台,为了加速多数据源联合分析的数据联邦分析平台,为了加速异构数据分析的异构数据即时分析平台等。
1月30日,爱分析正式发布《2023爱分析·数据智能厂商全景报告》。爱分析综合考虑企业需求、关注度等因素,选取其中7个特定市场进行重点分析,通过对各特定市场的需求分析和代表厂商的能力解读,为企业厂商选型提供参考。
覆盖市场:
数据中台、DataOps、大数据平台、一站式数据开发与管理平台、数据分析平台、银行对公智能风控、银行对公智能营销
注:扫描下图二维码,可下载完整版《2023爱分析· 数据智能厂商全景报告》。
01
研究范围定义
研究范围
利用多种数据智能技术实现数据驱动的分析与决策,已经成为当前企业数字化转型最重要的目标之一。随着数据来源日益丰富、数据体量快速增长,企业对数据的依赖和挖掘愈发深入,不仅带来数据应用场景、数据用户角色的复杂和多元,也使得企业对于数据应用的敏捷性和即时性的要求变得越来越高。
传统的数据开发与管理、数据计算分析正面临着巨大的挑战。为满足日益增长的数据应用需求,爱分析观察到,企业在数据能力建设逻辑上正转向以业务为核心,市场在技术和解决方案的供给上,也正以特定业务价值实现为驱动,变得更分化和聚焦。
数据能力建设核心逻辑转向实现业务价值。企业以往在构建数据能力时,通常是由技术部门或数据部门进行统一规划,并进行数据开发与管理,业务部门被动的使用企业的数据能力。然而,随着业务部门对数据价值的逐渐重视,以及对数据应用需求的快速增加,企业技术部门或数据部门已经不能满足业务部门的用数需求。为赋能业务部门更好的使用数据,企业数据智能基础设施的构建正逐渐转变为以业务部门为核心,如尝试通过DataOps、指标中台等概念实现数据和业务部门之间的高效协作。
面向业务场景价值实现,技术解决方案更细分、更聚焦。过去几年的实践表明,功能大而全的数据中台并不适合所有企业,根据企业内数据源、数据用途的差别,市场上分化出了多种针对特定场景的数据平台解决方案,如针对风控、营销场景的实时数据平台,针对工业、物联网场景的边云协同数据平台,为了加速多数据源联合分析的数据联邦分析平台,为了加速异构数据分析的异构数据即时分析平台等。
基于以上背景,爱分析将数据智能市场划分为数据基础设施和应用解决方案。数据基础设施覆盖数据生命周期的多个技术栈,应用解决方案覆盖多个垂直行业与通用智能解决方案,具体市场划分详见下图。
本次报告将数据智能市场划分为应用解决方案和数据基础设施两大部分,其中数据基础设施指利用云计算、人工智能、隐私计算等新兴信息技术构建的为企业赋能的平台类解决方案,主要包括数据的采集、存储、计算、管理等内容,进而为上层应用提供数据服务;应用解决方案是指通过数据智能解决方案在垂直行业或通用职能领域直接赋能业务价值提升的最佳实践。
综合考虑企业关注度、行业落地进展等因素,爱分析在本次研究中选取了数据基础设施中的数据中台、DataOps、大数据平台、一站式数据开发与管理平台、数据分析平台,以及应用解决方案中的银行对公智能风控、银行对公智能营销共计7个特定市场进行重点研究。
本报告面向企业决策层以及数据部门、业务部门负责人,通过对各场景的需求定义和代表厂商的能力评估,为企业的数据智能基础设施及应用规划、厂商选型提供参考。
厂商入选标准:
本次入选报告的厂商需同时符合以下条件:
厂商的产品服务满足各市场定义的厂商能力要求;
2022年厂商具备一定数量以上的付费客户(参考第4章各市场定义部分);
2022年厂商在特定市场的营业收入达到指标要求(参考第4章各市场定义部分)。
02
市场洞察
数据能力建设和数据应用建设,是企业围绕数据的两大重点工作。数据能力建设是从企业长远业务发展需要和数据部门能力提升出发,数据应用建设则是针对管理层、业务部门、IT部门等用户的具体需求,提供数据解决方案。数据能力建设和数据应用建设相辅相成。同时,数据应用的需求决定了数据能力建设的重点方向。2023-2024年,企业在数据能力建设和数据应用建设方面,需要关注以下重要趋势。
2.1 数据资产入表加速数据要素价值释放,央国企需要率先落地
随着国家数据局的正式成立,以及《关于构建数据基础制度更好发挥数据要素作用的意见》(数据二十条)、《企业数据资源相关会计处理暂行规定》、《“数据要素×”三年行动计划(2024—2026年)》行动计划等一系列重磅政策文件的发布,国家政策层面推动数据要素价值释放的蓝图布局已经就绪。尤其是数据资产入表,真正让数据成为企业资产。
落地到企业端,应该如何着手开展相关工作?我们可以从北京、上海、重庆等各个地方版的“数据二十条”中,获得更加具体的重点工作指引。
总结来看,各地方数据要素政策对于企业的要求重点在数据管理能力建设、数据资产运营体系、数据资产开发利用、参与数据要素市场化交易等方面。同时,央国企作为数字经济的排头兵,需要在数据要素流通、数据资产入表方面发挥示范引领作用,率先取得突破。
具体而言,企业在数据能力建设和数据应用建设方面,可以重点考虑以下发力点。
数据能力建设方面:
建设和完善数据管理能力,实现数据管理能力贯标。数据管理是数据资产化的前提,企业应当对标数据管理能力成熟度评估模型(DCMM)国家标准进行能力诊断和提升。
增强数据运营能力,进行数据资产盘点和估值,推动数据资产入表。
组织层面,成立数据集团、数据公司或数据研究院,设立首席数据官等,为推进数据要素市场化提供良好的组织和人才保障。
数据应用建设方面:
加快企业数据资产的开发利用,探索高价值数据应用场景。首先在企业内部持续挖掘数据应用场景,赋能业务降本提效增收。
加快数据开放,开展数据资产登记、挂牌和交易。在用数据赋能自身业务的同时,在安全合规的前提下推动数据对外开放,通过数交所等交易机制实现数据要素流通。
积极参与公共数据等数据开放应用,积极采购数据产品和服务。一方面,根据企业数据应用的实际需求,向外寻求合适的数据要素资源;另一方面,主动探索公共数据等外部数据与自身业务场景的结合点。
2.2 大模型变革数据分析范式,推动企业敏捷用数
作为一项变革性技术,大模型也对企业数据分析领域带来了诸多新价值。大模型基于其强大的生成、理解和推理能力,可以在NL2SQL自然语言交互取数、数据下钻分析与洞察、报告生成等场景发挥价值,变革数据分析范式。
大模型增强的数据分析范式,最大的价值在于降低管理层和业务人员用户的取数、用数门槛,从而增加数据消费用户规模,放大数据价值,业务收益直观。同时,可以将数据团队从繁重的基础取数工作中解放出来,有机会创造更大的价值。
从应用成熟度来看,大模型结合知识库、指标平台、图计算引擎、数据虚拟化引擎等技术方案,能够较好地解决大模型幻觉等问题,提升对话式BI的准确率。因此,建议企业在规划大模型应用场景以及数据应用建设时,优先考虑大模型与数据分析的结合。
2.3 数据交易平台落地需解决产品和服务场景、运营流程等难点
随着数字化转型的市场教育和实践深入推进,以及当前市场环境下企业自身对于高质量发展的诉求日益强烈,企业用数理念持续渗透,已经较为成熟。用数据驱动数字化经营,提高运营效率和创新能力,已经成为普遍共识。与此同时,企业用数需求日益增长与相对有限的数据服务供给能力之间的矛盾也日益增长。
企业数字化经营以指标数据的分析和洞察为核心。指标平台通过对企业指标数据资产进行全生命周期的统一管理,实现指标口径对齐,并通过一系列技术和工具优化,实现指标的高效开发,面向指标应用提供灵活、高性能的服务。
2023年,指标平台持续渗透,成为越来越多企业数据分析技术架构中的关键组成部分,并与大模型等新技术融合,对于提升数据服务效率和敏捷性效果明显。企业需要从指标体系设计和平台建设着手,进而通过数据运营不断拓展指标在数字化经营中的应用场景,让指标平台产生更大的价值,并牵引指标体系持续迭代和数据平台建设。
04
市场分析与厂商评估
数据中台
市场定义:
数据中台是在统一数据标准规范基础上,提供数据接入、数据开发、数据资产管理、数据分析、数据服务等能力的数据资产管理和服务平台,帮助企业实现数据集中管理和服务。
甲方终端用户:
企业数据工程师、数据分析师、业务分析师
甲方核心需求:
挖掘数据要素价值、用数据驱动经营决策已经成为企业共识。随着AI、大数据、5G等技术发展,企业数据体量快速增长,企业对数据的依赖越来越深,众多业务的快速迭代需要数据应用敏捷开发支持。但由于企业传统IT建设以业务为导向,业务系统间数据相互独立,企业在用数据的时候面临诸如数据质量差、数据管理难、数据开发重复等多种问题,数据“难”用正成为企业实现数字化的阻碍。数据中台通过对企业数据进行汇集、开发、治理,并统一为业务提供数据服务,满足业务“用”数据的需求。数据中台正成为企业数字化转型的关键举措,企业对数据中台的需求主要体现在以下几个方面。
建设统一数据底座,解决数据孤岛问题。许多大型企业的数据存储基础设施建设普遍以业务需求为导向分批次建设,如企业的APP、官网、小程序、营销、财税和供应链中的数据都存储在各系统中、相互独立,形成数据孤岛。数据孤岛不仅使得企业用数需跨多个系统、经多个业务部门审批,同时还会面临因数据定义不一带来的各种数据质量问题,导致协作沟通成本增加、经营效率大幅降低。
提高数据开发效率、增强数据共享能力,推动数据应用快速开发。企业数据应用的场景愈加广泛,使用人员也转向一线业务人员,于是对数据应用开发的敏捷性、实时性提出更高要求。企业传统“烟囱”式开发模式,不仅效率低下,且存在大量的重复开发,带来计算资源和人力的浪费。企业需要提升数据开发效率、加速数据共享,通过支持数据应用的敏捷开发支撑业务快速迭代。
形成高质量的统一数据资产。数据孤岛也带来诸多数据质量问题,如数据不一致、数据缺失、数据不及时、数据不准确等,难以有效支撑数据分析、经营决策,企业需要对各业务数据通过数据治理后形成高质量的统一的数据资产,以供业务人员或数据开发人员使用。
保证数据安全。国家对数据安全、个人隐私信息保护等立法使得企业数据安全风险提升,企业正面临多种数据安全保护场景。例如在数据收集、存储、传输、使用以及共享过程中如何保护用户隐私信息,如何对重要、敏感的数据资产进行细粒度权限界定和管理,平衡数据使用和数据安全需求,如何在云办公场景下保护数据安全等等。企业需要在建设数据中台的同时,考虑合适的数据安全保护措施。
基于规划咨询,建设适用于自身业务可持续发挥价值的数据中台。数据中台服务于业务价值,受业务需求、数据资产现状、数据安全现状以及现有数字化基础设施等条件影响,不同的企业数据中台的架构设计、采用的技术栈差异明显,企业需要开展咨询规划,结合业务战略选取合适的数据中台方案。而在数据中台建设完成后,也需在组织和文化层面上给予有力支持,采用科学的管理和使用方法,才能让中台发挥最大价值。
厂商能力要求:
支持多源异构数据接入和集成。针对数据集成,厂商应支持文件传输协议采集、数据采集、接口应用程序接入采集、流式采集、网络爬虫采集以及物联网网关数据采集等多种采集方式,提供分布式异构数据集成引擎,支持离线数据同步、实时数据同步。同时,厂商应考虑用户体验,为客户屏蔽底层技术栈差异,提供零代码开发接入功能,如配置可实现多源异构数据一步接入。另外,在数据集成同步、数据集成监控方面也应提供可视化工具,降低数据开发人员的操作门槛。
具备数据开发能力。一方面,在数据接入后,厂商应提供丰富的数据存储方式,满足数据模型、数据规模,数据生产方式、数据应用方式等带来的多样化的数据存储需求,如提供OLTP数据库、分布式文件系统、NoSQL数据库、云数据库等。另一方面,厂商应提供可视化的离线开发、实时开发、算法开发环境,降低数据开发人员的使用门槛,支撑实现批计算、流计算、在线查询、即席分析等数据计算能力。此外,厂商还应配合提供智能调度、智能运维、监控告警等系列工具,保证数据中台的计算性能和系统稳定性。
提供完整的数据资产管理工具。厂商需要提供数据治理服务,帮助企业构建一套统一的、可执行的数据标准,同时对数据血缘、数据质量、元数据、数据生命周期进行管理和可视化展示,使企业数据资产可见、可用。同时,厂商也应对数据生命周期提供数据安全保障,如对数据进行分类分级、发现敏感数据以及对数据权限进行细粒度控制等,保护用户隐私、防止数据泄漏。
支持构建数据服务,实现数据共享。数据中台的核心功能是为业务部门提供数据服务,因此厂商应支持向导模式或是SQl模式快速生成API,同时应提供接口性能实时监控、权限管控、API发布等功能,提高数据开放与共享效率。
具备行业Know-how能力,提供企业数据中台建设咨询和定制化服务。企业需要具备较强的咨询服务能力,需为企业在数据架构涉及、数据资产梳理、数据团队规、数据运营等方面提供切实可行的方案,并通过培训等方式强化和落实。此外,不同行业、不同规模的企业其组织文化、业务场景和数字化水平差异巨大,因此数据中台的定制化程度较高,厂商需要基于对行业和业务场景的Know-how,结合企业数字战略,为企业提供个性化的数据中台解决方案。
入选标准说明:
符合数据中台全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥10个;
2022Q1至2022Q4该市场合同收入≥1000万元。
代表厂商评估:
微品致远
厂商介绍:
微品致远成立于2014年,是由中兴通讯孵化,深圳国资委、大型央企联合投资的智能化技术服务商,基于大数据、人工智能、5G等技术,为通信、民航、工业、政务、园区、金融等领域企业客户,提供数据中台、5G专网、IOC可视化平台、IOT平台等系列产品和解决方案,帮助客户实现数字化和智能化转型。
产品服务介绍:
微品致远数据中台是企业级一站式数据中台PaaS,具备完善的数据中台体系产品及工具,如大数据分布式计算平台、数据开发套件、数据质量管理工具、数据地图管理工具、数据模型管理工具、API管理工具等,覆盖数据采集、计算、存储、服务和应用全链路,为客户提供轻量级、低代码、可落地的数据中台解决方案。同时,微品致远基于丰富的案例沉淀,已经形成完善的数据中台建设方法论和体系化的数据中台建设实施流程,为电信运营商、机场空管、工业企业、政府机构、地产、园区、泛家居、时尚、新零售、金融机构等客户数据中台建设提供咨询、部署及实施全方位支持。
厂商评估:
微品致远的数据中台PaaS产品,在功能的完善性、易用性等方面具有优势。基于在运营商、泛交通、地产园区、智慧乡村、时尚零售等领域智能应用开发积累,融合数据中台能力,微品致远能为客户提供一体化解决方案。此外,微品致远还集成数据中台、技术中台能力,为企业应用敏捷开发提供数字底座。
微品致远具备完整的数据中台技术栈,能提供一站式数据中台PaaS产品。微品致远数据中台的技术架构由数据源、数据平台、数据管理平台、数据服务以及数据应用等构成,可覆盖数据采集、计算、存储、服务和应用全链路。其中,数据平台提供一站式大数据开发平台,兼容Python、SQL、Java等多种异构语言,支持离线、在线数据开发环境。数据管理平台提供对数据源、元数据、数据质量、主数据、血缘关系、生命周期等管理功能,并提供敏感数据发现、敏感策略配置、脱敏算法管理等数据安全功能,保证数据的可读性、可追溯以及安全性。数据应用基于统计报表、数据挖掘、高管驾驶仓等功能为客户提供销量预测、数据门户、智慧门店等智能应用。
微品致远的数据中台产品具备较强的易用性,能显著降低中小企业的学习成本。如数据源侧,支持来自RDBMS、Hadoop、文本、接口等多个数据来源的结构化、半结构化、非结构化等多种数据类型,以离线和流式数据的采集模式一步跨网接入,实现实时多源异构数据一站式上云。在数据开发环节,支持通过对数据计算元子拖拽组合,以低代码可视化的形式实现复杂的批量数据计算流程开发。在数据服务方面,有强大的API网关能力和ESB数据总线能力,包括整合外部数据、快速配置API、审核内外API、管理API消费权限,同时可零代码生成API并发布。在数据应用方面,提供自助大数据分析BI工具,可帮客户轻松搭建报表管理平台,打通数据壁垒。
基于数据中台能力和数据智能应用产品积累,微品致远能为运营商、地产园区、智慧乡村、时尚零售、营销等领域客户提供一体化解决方案。微品致远在园区、智慧乡村、零售、营销等领域积累了丰富的实践案例,不仅沉淀了丰富的领域Know-how和项目经验,也在各领域形成了丰富的数据应用体系,融合数据中台能力,为客户快速实现数据能力落地。以智慧乡村为例,微品致远基于与广西、贵州、浙江等多地政府单位的合作经验,已经开发形成覆盖交易、金融信贷、三资管理、农产品溯源、水务、教育、旅游等各个版块的智慧乡村应用,融合乡村大数据中台,可为客户提供全系统集成、全数据连接的智慧乡村解决方案,实现乡村数字化治理。
此外,微品致远具备集成数据中台、技术中台的数字底座能力,支撑企业应用实现敏捷开发,显著降低业务运行成本。在数据中台能力基础上,微品致远具备六大技术中台能力,包括统一身份认证、统一门户、能力开放平台、流程平台、低代码平台、DevOps平台等。集成数据中台、技术中台能力,微品致远能以标准化服务的形式为企业各个应用提供所需的数据资源、基础功能、开发平台、开发组件等,实现业务应用敏捷开发,满足业务快速迭代创新需求。
典型客户:
长沙城发、顾家家居、谢瑞麟、云创设计、珠海机场
DataOps
市场定义:
DataOps数据开发运营一体化是指通过流程自动化、可观测性、协作沟通、工具集成等方式实现敏捷开发、持续交付,满足敏稳双态数据消费需求的咨询、工具和服务。
甲方终端用户:
金融、制造、汽车、消费品零售、能源等行业的大数据部门负责人、IT部门负责人
甲方核心需求:
企业的数据开发效率正面临严峻的挑战。一方面,企业数据体量和多样性在日益增长,以图像、视频、文本、时序等为代表的非结构化数据占比提升,使得传统的ETL工作量加重,数据开发效率更低、反应更缓慢。另一方面,激烈的竞争环境要求业务快速反应,不仅要求缩短数据开发周期,还要求实现实时分析、自助式分析。为适应业务部门的需求,企业需要通过DataOps理念实现敏捷数据开发。企业对DataOps的具体需求如下:
提高数据开发和交付效能。1)提高数据开发流程自动化水平。企业在过往建设数据平台过程中,由于缺少规划意识,采购的数据开发管理工具成为散点工具。企业在使用散点工具开发数据过程中操作繁琐、效率低下。以数据采集为例,传统ETL方案通过脚本实现,随着数据源的增多、数据类型的增长,企业增加大量手工适配任务。又如数据任务在开发环境、测试环境和生产环境中的导入、配置均需开手工实现,为开发人员带来繁琐工作量 2)建立灵活、敏捷的数据开发管道。企业传统的数据开发流程需依照需求分析、数据设计、编码、测试、部署等步骤,数据开发需进入测试阶段才能全面校验,难以及时发现问题,并且一旦业务需求改变,需要回到前期重新进行设计和规划,导致开发周期较长,常以周甚至月为单位,难以快速响应业务需求。企业需要建立可持续开发、持续测试、持续交付的数据开发管道,快速发现开发问题,实现敏捷迭代。
提升数据治理水平,提高数据可用性。企业传统数据治理与数据开发割裂,普遍是“先研发、后治理”,在数据开发完成后再以专项项目的方式推进数据治理,取得效果后过段时间又会出现数据质量问题,效果反复,对业务端用数造成困扰。企业希望提升数据治理水平,实现持续的数据治理、保证数据可靠可用。
建立数据开发规范,提高跨部门跨域数据开发协作能力。1)针对业务提需求环节,需建立业务人员的取数、用数规范。如业务人员做全局数据分析时,对数据归属部门不了解、数据申请流程缺失、数据申请规范不清晰等问题极易造成业务人员取数困难。2)需求沟通环节,需建立业务人员与开发人员的协作规范。一方面,在业务人员与IT人员的沟通中,由于双方专业性差异、术语理解不一致、目标期望不同等原因带来沟通障碍,造成开发效率缓慢或是反复开发的情形。同时,双方在需求沟通过程中往往少正式的沟通渠道和沟通工具,信息传递受阻,也导致双方对需求理解不全面。3)数据开发中,需建立跨域、跨部门以及跨角色的开发规范。其中跨域开发协同问题以大型集团型企业为例,企业的各个子公司都有独立的数据开发团队。由于子公司间信息化水平和所选供应商存在较大差异,各子公司在数据格式、数据规范、数据模型、数据标准等方面都存在显著差异,这使得总部在与子公司进行数据同步时,需要二次数据治理,以确保数据有效性和准确性。而跨角色协同开发问题以机器学习建模场景为例,IT人员、数据科学家、数据工程师等多种角色相互配合,数据流转过程中也需要制定数据规范提高流转效率。
降低业务用数门槛,赋能业务场景应用。激烈的竞争环境下要求业务快速响应。企业一方面需要建立指标体系低业务人员用数门槛,另一方面也应支持业务人员开展自助式探索分析,如在BI平台中利用数据指标开展数据洞察,或是在机器学习平台中可自助完成销售预测分析等。
厂商能力要求:
支持敏捷数据工程和较高的自动化程度。在数据工程方面,厂商应支持企业内部将各业务系统的数据融合打通,提供数据采集、数据汇总、数据清洗、数据治理、数据服务等数据开发全链路工具协助企业建立数据资产。同时,厂商数据工程应支持从开发、测试到上线的持续集成和持续发布,并为不同角色人员提供便捷的开发环境。此外,厂商数据工程中应将数据采集、数据转换、数据治理、代码测试等重复的工作流程自动化,提高数据开发效率。
支持数据开发治理一体化。厂商应将数据治理融合到数据开发过程中,如支持对多种元数据的主动采集,建立数据血缘关系,实现数据溯源;如支持数据标准自动落标,为数据建模、数据质量审计等环节提供规范参考,使数据开发成为企业可持续开展的任务。
厂商需具备数据运营咨询规划能力。厂商能基于可复用的成功经验,针对客户的业务需求和内部建设现状指导实施落地。一方面,厂商需具备规划能力,为客户规划数据开发运营的蓝图和实现路径;另一方面,厂商应为客户提供咨询能力,协助客户建立数据研发运营规范、调整组织架构、完善流程机制,如制定数据质量管理规范以及数据建模标准,梳理数据申请、数据使用流程等。
为业务人员提供便捷的数据服务。厂商应支持业务人员轻松连接多个源数据,进行整合、清洗和分析,在规范的指标体系基础上,使业务人员便捷地开展自助式分析、智能分析。另外,厂商还应融合AI能力提供全局数据发现,业务人员可自助进行数据发现、探索。
入选标准说明:
符合DataOps全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥5个;
2022Q1至2022Q4该市场合同收入≥500万元。
代表厂商评估:
科杰科技
厂商介绍:
科杰科技成立于2019年,是国内领先的大数据基础软件供应商,致力于自主可控的大数据底座产品研发与应用,推动企业全面实现数据驱动型组织转型升级。科杰科技自研的湖仓一体数据智能平台KeenData Lakehouse,具备云原生、低代码特点,可为组织提供数据管理、开发挖掘、运维一体化的一站式全流程数据能力建设方案。
产品服务介绍:
科杰科技核心产品湖仓一体数据智能平台 Keen Data Lakehouse是基于云原生技术自主研发的数据底座产品,内置数据开发管理平台Keen BDP、数据同步系统Keen Dsync、实时计算平台Keen Stream、数据标准产品Keen DSM、数据质量管理平台Keen DQM、主数据管理平台Keen MDM、数据资产目录Keen Asset、数据服务平台Keen DAAS、数据标签平台Keen TAG、数据同步系统Keen Dsync、大数据基础平台Keen KDP、数据科学平台Keen DSP等12大功能模块。
Keen Data Lakehouse数据底座分为三层,底层数据引擎提供存储计算引擎等基础设施支持,中层提供低代码开发、数据工程能力建设,上层则提供基于数据和数据资产的业务服务能力。
厂商评估:
科杰科技在协助企业构建数据工程能力、实现主动数据治理、提供数据运营咨询规划等方面具有明显优势,此外,科杰科技基于丰富的落地经验积累,提炼形成适用于大型集团型企业数据能力建设的最佳实践方法论,广泛应用于政府、金融、新零售、能源、工业互联网、汽车、通信等多个行业。
科杰科技KeenData Lakehouse数据底座产品可为企业构建数据工程能力,实现敏捷数据开发。
KeenData Lakehouse数据底座丰富的产品模块,将数据开发IDE(集成)化、流程化、协作化和自动化,可为企业建立起一套兼具数据管理和软件工程能力的数据工程体系。其中,在数据管理方面,KeenData Lakehouse覆盖数据获取、数据集成、数据准备、数据治理和分析与建模等数据管理全生命周期,提供全局统一的数据标准、数据质量、主数据管理、元数据管理。
软件工程方面,KeenData Lakehouse覆盖研发管理、持续交付以及研发运维,为企业提供数据协作、数据开发、数据部署、编排以及测试与监控等功能。如针对协作开发,KeenData Lakehouse支持同项目下多人协同开发、支持代码版本管理和代码回滚,实现灵活、高效的开发;针对开发运维,平台提供智能依赖任务推荐、智能调度、智能基线预警等功能,实现数据处理流程自动化。
科杰数据工程能力可支持企业通过低代码、零代码的方式高效率开展数据开发、数据管理、数据运营工作,大幅提升业务运营和产品研发在数据使用层面的效率。如科杰科技为中金公司提供数据中台建设,实现多源数据汇集、多团队协同开发、数据资产的统一管理,有效提升各部门数据集市建设效率,支撑营销、投研业务分析及其他智能应用。
科杰具备主动数据治理能力,为企业建立主动实时的数据自治理体系。
科杰将访问控制、管道连接、数据合并、主动元数据探查等技术融入数据工程中,提供基于AI增强的数据异常检测和数据血缘分析,加强对数据标准、主数据管理、数据治理、数据资产目录的管理,形成主动、实时的数据自治理系统。如科杰提供主动元数据探查,一旦数据源发生变化,系统将通知使用数据的算法或模型进行自动化调整;如科杰支持对数据质量可预测问题进行AI强化学习,优化对异常情况的灵敏处理。
科杰具备数据运营咨询规划能力。
科杰科技能够为客户提供前期的数字化咨询服务,在战略规划方面,科杰将根据企业现状给出问题诊断帮助企业内部的IT技术部门、数据部门和业务部门达成共识,明确目标和建设路径;在制度流程方面,为企业完善数据管理的相关标准和规范,梳理数据管理部门数据开发协作、业务部门与数据管理部门协作工作流程;在组织建设方面,协助企业完善企业组织和角色。
科杰积累丰富落地经验,形成适用于大型集团型企业数据能力建设的最佳实践方法论。
科杰科技的核心研发团队具有互联网大厂背景和十多年大数据实战经验,曾经历大型企业的大数据部门组建、数据中台项目的建设,对大型企业跨部门的数据协同开发、数据管理流程等方面痛点了解深入。
经过多年经验积累,科杰总结出一套复杂业务场景下数据能力构建的最佳实践方法论,包括数据工程能力、数据自治理能力、基于 Data Fabric 理念的数据资产管理能力以及面向不同组织角色融合的 DataOps 全流程服务能力等,并已在金融、新零售、能源、工业互联网、汽车、通信等行业成功落地。
此外,科杰科技作为DataOps理念的实践先行者,深度参信通院《DataOps实践指南(1.0)》编写,并成为信通院首批DataOps产品创新实验室单位之一,也使得科杰对于DataOps实践标准的熟悉程度、工具产品融合、DataOps构建效果等方面备受行业认可。
典型客户:
中石化勘探院、中金公司、永旺集团、一汽集团
大数据平台
市场定义:
大数据平台是基于数据湖、湖仓一体架构的数据平台,提供数据存储计算、数据集成、数据开发、数据治理、运营管理、数据分析、数据共享和服务等一站式能力,支持对各类结构化和非结构化数据的处理,以及BI、数据科学、AI/ML、实时分析等数据应用场景,从而帮助企业低成本地获得自助式、可按需使用的数据平台服务,并实现安全的跨组织数据共享和消费。
甲方终端用户:
企业数据部门、IT部门
甲方核心需求:
随着企业数据类型和数据规模的增加,企业内部以数字化经营、精准营销、智能推荐、风险管理为代表的多模态数据实时分析场景逐渐增加。传统数据分析平台由于仅能提供结构化非实时数据的加工处理功能,不具备对结构化、半结构化和非结构化数据等多种数据类型进行实时计算的能力,使得企业数据资源的挖掘和利用受限,企业对大数据平台的需求具体体现在:
整合多类型数据,实现统一管理和分析。企业采集的数据类型异常丰富,如CRM关系数据、日志数据、流量数据、广告投放等分散在多个系统中,包含大量的文本、音频、视频等半结构化与非结构化数据。非结构化数据与结构化数据在数据标准、数据语义等方面难以打通,这使得企业难以对全域数据进行关联分析,使得用户画像信息缺失、舆情判断不准确等问题。
满足快速增长的海量多类型数据实时写入和分析需求。在车联网、证券、广告投放等场景中,快速给出分析结果是保证服务有效性、保障客户体验的前提。尤其车联网场景中,车企面临高密集上千种实时信号数据的写入和及时的数据分析需求,企业迫切需要建设高效实时数据链路。
降低海量数据存储和计算成本。企业数据规模快速增长,头部大型企业数据体量正从TB升至PB级,这使得数据汇总、数据聚合、模型训练等全量数据写入场景需要更高的数据存储和计算成本,企业需要针对海量数据的低成本存储和计算优化方案。
提高数据开发效率。在传统的数据平台中,企业或是缺乏数据开发全流程工具,或是由多个数据开发工具构成,导致不同开发模块间链接不通畅,数据开发效率低,难以满足企业日益增长的数据应用需求。企业需要通过一站式数据开发工具打造敏捷开发流程,提高数据开发效率。
满足政府单位、国央企和金融等领域的国产化要求。大数据平台底层对接存算引擎、数据库,应适配国产化,满足企业自主可控需求。
厂商能力要求:
具备多类型异构数据的统一存储和管理能力。厂商提供的大数据平台底层应基于数据湖、湖仓一体架构,支持结构化、时序、文档、图像等多模数据自动冷热分级存储,支持对多模数据通过统一存储为湖表格式或通过数据虚拟化的方式实现统一元数据管理、统一语义,支持全域数据统一分析。
支持存算分离架构,可实现海量数据的低成本存储。支持存算分离,可按需分别对计算资源、存储资源进行弹性扩缩容。其中,资源调度系统应融合机器学习算法综合任务优先级、资源需求、系统健康状况等因素对资源分配进行智能决策,通过灵活任务调度提高资源利用率。
提供一站式数据智能开发工具,帮客户建立敏捷开发流程。大数据平台应覆盖数据开发全流程,包括不限于提供丰富的数据处理组件,提供工作流调度、智能运维、数据质量管理、数据安全等功能支持,以及提供敏捷开发集成环境支持多人协作设计等。此外,厂商也应将AI融入数据开发流程中,如在数据标准、合规和质量等方面进行自动化检测、识别、校验、告警。
厂商应具备国产信创适配能力。符合信创标准,实现国产化替代。厂商需要能与国产主流软硬件兼容适配,包括不限于国产化芯片、服务器、操作系统、中间件等,满足企业国产化需求。
入选标准说明:
符合大数据平台全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥5个;
2022Q1至2022Q4该市场合同收入≥5000万元。
代表厂商评估:
滴普科技
厂商介绍:
北京滴普科技有限公司成立于2018年,定位为数据智能基础设施提供商。以Data+AI为核心战略,滴普科技打造了实时智能湖仓平台FastData、企业大模型Deepexi、智能体平台FastAGI、训推一体机Fast5000E等在内的数据智能产品体系,助力企业实现从数据驱动到智能驱动的升级。目前,滴普科技已成功服务200余家知名大中型企业,包括中国石油、兴业证券、百丽时尚、航天烽火、重庆机电、陕药集团、长安新能源、纳爱斯集团、广州城投、九洲电器等。
产品服务介绍:
滴普科技实时智能湖仓平台FastData是基于湖仓架构,支持一站式数据采集、存储、开发、治理、分析的大数据平台,由底层云原生实时湖仓引擎FastData DLink(简称 DLink)和数据智能开发治理平台DataFacts构成。
DLink采用存算分离架构,支持 EB 级多模数据的存储与处理,支持流批数据处理、数据分析、数据科学等多工作负载,无缝连接大数据生态,提供一站式数据探索与数据开发能力。
DataFacts提供完善的数据开发套件、数据治理套件和数据分析套件,为用户提供可组合、可配置的现代数据栈,为数据应用与场景提供端到端组装以及全链路管理能力。
厂商评估:
滴普科技实时智能湖仓平台FastData在底层湖仓引擎的高效、易用以及实现敏捷开发和开发治理一体化等方面具有明显优势。同时具备较强的国产信创适配能力和全流程服务能力。
FastData底层云原生实时湖仓引擎DLink具备简单、高效、易用等特点,支持海量多源异构数据的统一存储和管理,可同时适应BI、即席分析、机器学习等多种应用场景。
在数据集成上,DLink存储层兼容Iceberg和Hudi两种主流数据湖格式,支持丰富的结构化、半结构化与非结构化数据类型以及主流Oracle、MySQL、PostgreSQL、Hive、人大金仓等30多种数据源,以离线、实时和流批一体的方式统一入湖。
在数据管理上,DLink统一元数据管理功能支持用户以逻辑湖的形式连接数据孤岛、统一数据语义,实现数据的统一管理。
DLink可支持即席查询、AI、ML、实时推荐等复杂场景。如即席查询场景,DLink高性能SQL引擎支持PB级海量数据任意维度即席查询,MPP 分析引擎秒级查询延时。针对AI、ML等高负载的应用场景,DLink支持数据湖上非结构化数据处理与数据仓库中结构化数据处理任务无缝衔接,用户可通过统一的调度平台调度,快速完成AI与ML中的数据开发、模型训练等环节。
FastData丰富的数据开发套件,能为客户建立敏捷开发流程。滴普科技提供覆盖数据采集、建模、离线及实时开发、运维监控、服务开发等丰富的敏捷开发集成环境和开发套件,操作界面直观、配置方式简单。如数据平台支持基于WEB SQL的可视化离线/实时任务开发;批流采集任务中,开发人员一次配置后,程序可自动进行批和流的数据采集;在任务调度配置中支持多种任务DAG组织形式,以及跨项目、跨流程、定时、时间等触发方式,满足客户复杂调度场景。
基于Data Fabric架构,FastData可帮客户实现数据开发治理一体化,充分释放数据价值。如平台可根据企业数据资产情况智能化进行标准关联或标准推荐,并将国家标准、行业标准、集团标准等多种数据标准自动化映射到表字段,开发人员可以将数据标准作为规范应用在数据建模、数据质量稽核以及运维中。又如平台支持对多种数据源元数据的自动化采集,建立基于元数据的全链条数据血缘,能帮助数据开发人员在模型设计和数据开发中理解数据的质量、可靠性以及构建数据流程,使开发人员在应用侧数据异常时快速洞察数据的生产过程,或是数据变动后快速分析影响范围。
滴普科技具备较强的国产信创适配能力。自2020年起,滴普科技陆续与多个领域开展国家级测试,及云计算、能源、证券等重大行业测试,这也加速滴普科技产品对芯片、服务器、操作系统、存算引擎、国产化中间件等方面完成系列化适配认证。如FastData在底层存算引擎方面适配广泛,可支持十余种存算引擎的数仓建设,在芯片方面,也已完成鲲鹏、龙芯、海光等国产化芯片的适配。
滴普科技提供以数据为核心的业务价值创新咨询服务,具备从咨询规划、技术选型、建设交付到运维运营的全流程服务能力,满足客户项目落地过程中不同阶段需求。如在数据治理咨询中,滴普科技可提供数据成熟度评估及蓝图规划,数据治理体系设计、业务数据盘点及深化治理等咨询服务;在技术选型中,提供数据平台技术架构设计、数据开发和管理工具规划等服务;在建设交付过程中提供大数据组件技术支持;在数据运营中,可提供指标及标签体系设计、数据流向设计、数据关联角色与流程设计等服务。目前,滴普科技在先进制造、生物医药、能源出行、政务双碳、金融科技、消费流通等领域的持续深耕,服务客户数量超过200家。
典型客户:
百丽时尚、昆仑数智、中核装备院、航天烽火、中国海诚
一站式数据开发与管理平台
市场定义:
一站式数据开发与管理平台,是指针对业务用户需求,建立涵盖数据集成、开发、存储、计算、服务、任务调度等在内完整的数据加工链路,并提供全域数据资产管理能力的数据平台。
甲方终端用户:
金融、制造、汽车、消费品零售、能源等行业的大数据部门负责人、IT部门负责人
甲方核心需求:
随着业务部门对于数据分析的需求越来越广泛,甲方企业需要构建一套面向业务部门用数需求的数据开发与管理流程和机制,并提升相应的数据开发与管理能力。过往,甲方更多是将数据整合和管理作为企业的阶段性目标和项目来完成,对数据如何应用、如何在业务场景中发挥价值关注度不足。在实践过程中,投入大量资源和人力,完成数据整合之后,“取数难”、“用数难”、数据质量低等问题依然存在,甲方还是无法发挥数据的价值。因此,甲方真正需要具备的是一套面向业务的完整的数据开发与管理能力,其核心需求包括:
搭建端到端具备完整功能的数据开发与管理平台。平台需要围绕数据开发与管理全链路的需求,提供完备的功能,并具备自动化开发能力。甲方需要能够在这一平台上完成各类结构化、非结构化和半结构化数据的开发和管理,覆盖数据加工全链路的集成、开发、存储、计算、服务、任务调度等需求,具备对全域数据管理的能力。同时,为应对越来越多且时效性越来越强的开发任务,还需要利用自动化工具提升效率。
平台需能够兼容现有数据基础设施,并支持二次开发。经过多年信息化和数字化建设,绝大多数甲方已经具备一定数据基础,以MPP、Hadoop为代表的技术架构,以大数据平台为核心的数据开发和管理工具,因此,数据开发与管理平台需要兼容现有的数据基础设施。同时,随着业务的发展,未来产生越来越多的创新业务场景,平台需要有充分的扩展性,可以二次开发接入外部工具以应对多元的需求,从而支持各类型业务场景开展。
建立统一的数据开发与管理流程和机制。在甲方现有流程中,应用开发和数据开发往往是分开进行,但考虑到越来越多数字化应用是基于数据驱动这一趋势下,企业需要考虑将二者融合。过去建设的数据中台尽管一定程度上能够支持报表、自助式分析等应用,但实质上仍未能满足支撑整个数据开发管理体系,无法满足越来越多基于数据驱动的应用需求,特别是以即席查询、机器学习为代表的探索式应用。因此,甲方需要将应用开发与数据开发融合,并建立统一的流程和机制。
厂商能力要求:
数据开发与管理平台产品具备完整的功能。能够覆盖数据开发与管理的全流程,包括数据集成、开发、存储、计算、服务等等各个方面,能够提供多人可协作的项目空间管理,具备持续集成和发布的能力。
产品架构需要具备较强的可扩展性。需要具备解耦能力,采用模块化方式构建,能够单独拆分功能模块按需提供。在扩展性方面,需要能够适配企业内的其他生态,支持多种接口协议,已封测及对接多种软件或硬件接口调用等方式,能够快速满足企业未来的创新应用。
针对业务场景的需求建立统一的数据开发与管理流程,提供咨询服务或将流程内化为产品标准。厂商需要具备对数据应用场景的深入理解,以及具备丰富的客户服务经验,构建满足甲方业务部门数据应用需求,实现高效的数据加工处理的开发管理流程,并为客户提供相应的咨询建议。针对一些行业共性的需求,厂商需结合其产品和技术能力,将开发与管理流通融入数据平台产品中,提供行业最佳实践。
入选标准说明:
符合一站式数据开发与管理平台全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥5个;
2022Q1至2022Q4该市场合同收入≥1000万元。
代表厂商评估:
炎凰数据
厂商介绍:
炎凰数据是一家致力于打造具备自主知识产权的大数据处理平台的公司,其核心产品炎凰数据平台,专注于提供对异构多源大数据的即时分析能力。公司核心团队来自前Splunk中国研发中心,具有深厚的大数据分析、架构设计和系统开发经验。
产品服务介绍:
炎凰数据平台是新一代的异构大数据即时分析平台。结合其一站式的数据开发与管理能力,以及独特的读时建模、搜索引擎等技术,用户可以对来自各类机器、物联网设备、移动终端、业务系统、数据库异构的原始数据进行即时分析。
炎凰数据平台的服务范围涵盖泛金融、互联网、新能源 、工业制造等多个行业领域,典型应用场景包括:数据安全,AIOps,流程挖掘、时空数据分析、工业物联网等。服务过众安保险、上海电力、知识星球等标杆客户。
炎凰数据平台的大数据搜索引擎、读时建模等核心技术均为自研,做到源代码可控,并达到国际先进水平,是国产替代的可靠选择。
厂商评估:
炎凰数据平台专为现代企业数据源广泛,数据格式多样且易变,以及带有一定时序特征的数据分析需求而设计,通过提供一站式的数据开发管理平台,为企业在异构数据的查询分析中带来灵活、即时、易用,以及快速部署的使用体验,具体如下:
基于自研的读时建模存储和计算引擎,炎凰数据平台能够灵活支持多种场景下,企业对异构多源大数据的存储与查询分析。在数据存储方面,平台无需事先定义数据结构,而可以按数据原格式将来自企业各类生产管理系统中的非结构化、半结构化以及结构化数据统一存储在平台中,打破数据孤岛的同时保证了数据的完整性;在数据查询分析方面,平台的读时建模技术允许用户在读取数据时自定义规则,根据算法从原始数据中自动提取分析需要的字段,并支持用户根据业务需求动态地调整数据查询规则,从而避免繁重的传统ETL工作,提高异构数据处理的灵活度。同时,炎凰数据自研的搜索引擎提供类似Google的关键字简易查询,以及交互式查询、事件上下文搜索等高阶查询,满足用户在不同场景中的数据查询需求。此外,平台也支持对结构化数据进行写时建模,提升对结构化数据进行分析的能力。
炎凰数据平台在数据加工处理方式,平台架构等方面进行了多重优化,能够保障用户即时获得分析结果。针对读时建模以往固有的算力开销较大,影响查询速度的问题,炎凰数据在向量化计算、即时编译,基于列式存储的数据压缩,并发任务安排等多方面做了大量精巧的设计与优化,以加快运算速度,提高数据吞吐量,从而可以在绝大部分场景中实现相对即时的分析结果;在平台架构方面,炎凰数据平台采用云原生架构,所有服务都可以快速部署到各类云端环境的同时,存储和计算资源可以根据需求独立实现弹性地扩展,满足大规模数据处理的要求。
炎凰数据平台提供标准SQL查询,仪表板等实用功能,使平台具备较高的易用性。区别于业内同类大数据平台通常采用定制的搜索语言,如SPL、Elastic query DSL等,炎凰数据平台支持用户使用标准SQL语言进行数据查询,除了支持过滤,映射,去重,聚合,排序,关联等基本SQL查询能力之外,还提供了大量标量函数和表函数的扩展,同时也支持用户自定义函数,极大降低了用户的学习门槛;炎凰数据平台提供仪表板功能,基于平台集成的可视化图库echarts,用户可以使用各类常见的可视化解决方案,并将数据分析方法和分析结果保存在其中,加速企业内部数据价值的传递。
炎凰数据平台为用户提供标准化的产品,方便用户按需快速搭建数据平台,实现数据价值。对于数据基础设施相对薄弱的企业用户,炎凰数据提供了一站式的数据平台解决方案,具备从数据导入、数据集成、数据建模、数据存储、数据分析、数据服务、数据可视化等端到端的能力,使用户可以开箱即用;对于数据开发能力较强,且内部已经有一定的成熟数据开发管理工具的企业用户,炎凰数据将平台的各层能力进行了解藕,并提供API接口,允许用户以平台核心的数据存储和搜索功能为基础,接入外部系统或工具,实现对平台的二次开发。
典型客户:
众安保险、上海电力、知识星球
数据分析平台
市场定义:
数据分析平台是一套由ETL引擎、数据仓库、指标计算引擎、数据分析工具和报表工具等功能模块组成的软件系统,能够在打通和整合企业内部各类数据源基础上,通过多样化的数据查询和分析,以指标、报表、图表形等式输出数据分析结果。
甲方终端用户:
企业数据分析师、业务分析师、管理人员,以及大数据部门负责人、IT部门负责人等
甲方核心需求:
数据分析和可视化是企业数据最直观的价值呈现方式。随着数据量的指数级上升和数据类型的丰富,企业对数据分析平台的需求,也从最初较为简单和定向的报表和大屏,向多元化、场景化的深度挖掘分析,以及低操作门槛的方向演变,具体而言:
支持业务人员、管理人员实现自助数据分析。数据分析结果的最终受众是企业业务人员和管理人员,但大多数数据分析平台的主要使用者是企业数据团队,在业务逻辑向数据逻辑转换过程中,由于沟通成本等原因,需求响应的即时性和准确性都难以保证。因此,企业业务人员和管理人员需要一个低门槛、易操作的数据分析查询平台,不仅能够直接满足其部分即时性、灵活的数据分析需求,同时还能够方便其参与数据分析过程,与数据团队协作共建。
提升数据分析结果响应速度。企业在多年的数据分析实践中,经过多次加工处理形成了极度膨胀的ETL任务和中间表,在运行中会消耗大量IT资源,严重拖慢了分析结果产出的速度。随着外部市场的变化加快和企业运营的敏捷性提高,企业需要小时级、分钟级的分析结果,无法接受以天为单位的产出。
支持业务侧大量场景化、定制化需求。随着对数据分析产品的使用不断加深,企业用户不再满足于仅仅用其生产固定报表,而是希望能在更多深度结合垂直业务的分析场景下使用数据分析平台满足相应需求。然而,大部分数据分析平台是基于预设的分析场景进行搭建,新需求的实现需要数据工程师进行定制化开发,等待周期较长,极为不便。
厂商能力要求:
为满足以上需求,厂商需要为企业提供高性能、分析功能强大、低门槛的数据分析平台,具体而言:
能提供低门槛、高易用的数据交互方式,满足业务人员使用需求。为应对非数据分析专业人员的查询、分析需求,厂商首先需要提供便捷的数据查询入口,支持通过拖拉拽、搜索、自然语言等简易交互方式实现数据查询,尤其在当前大模型能力逐渐成熟的背景下,提供基于自然语言的数据查询能力将成为厂商的必备能力;其次,厂商需要优化在报表展示界面,让用户能够通过滑动、托拉拽等操作自主进行数据和指标的关联分析、对比分析等,并支持多种图形化呈现方式选择。
通过构建高性能数据分析引擎或高效数据流通链路等方式,提升数据分析速度。其一,厂商可以通过建立更完善和通畅的数据接入、处理、分析全链路,加快数据流转,并且在底层可采用新一代的湖仓一体引擎,以提高分析性能和弹性扩展能力;其二,厂商还可以通过构建独立的模型指标层,实现分析和数据的解耦,从而实现高效的数据分析,并减少极度膨胀的ETL任务和中间表;其三,厂商可以基于AI算法,在数据准备和数据探寻等数据分析环节中实现流程的自动化,提升效率。
能提供丰富的数据分析功能,并支持模型、指标的灵活调整。厂商预设数据分析场景的定制化能力,无法满足企业衍生出的多样化、垂直场景化的分析需求。因此,厂商首先需要在产品中加入以机器学习、深度学习等技术为基础的分析引擎,支持对大数据实现归因分析、预测分析等多种智能化分析方式;其次,厂商产品需要支持数据模型以托拉拽等方式灵活调整,帮助数据分析人员实现快速按需定制。
入选标准说明:
符合数据分析平台全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥10个;
2022Q1至2022Q4该市场合同收入≥1000万元。
代表厂商评估:
衡石科技
厂商介绍:
衡石科技定义新一代AI-Powered的分析智能平台,专注赋能全行业的企业客户和SaaS/ISV厂商敏捷构建分析应用。旗下核心产品HENGSHI SENSE,让合作伙伴在自己的业务场景中轻松上线AI Copilot、BI分析、指标中台、运营看板等功能,驱动业务的智能化转型。衡石科技的核心团队来自VMware、秒针、阿里、百度,底层架构能力卓越。
产品服务介绍:
衡石科技的核心产品HENGSHI SENSE作为新一代AI-Powered 的数据分析PaaS平台,可以让用户在业务场景中轻松构建AI助手、BI分析、指标平台、数据看板等功能。
面向SaaS/ISV厂商,HENGSHI SENSE提供成熟完备、高度灵活的集成嵌入能力,厂商可在数天内敏捷集成整合各种典型企业级BI能力,包括固定报表、自助分析、指标看板、Data API等,也可以基于SDK做更加灵活的二次开发。
面向企业客户,HENGSHI SENSE作为专业的分析工具,可为企业构建包含指标管理、数据集成、管理、建模、分析、可视化等功能在内的一站式的数据管理与分析解决方案。
厂商评估:
衡石科技是业内少有的能提供成熟企业级BI PaaS能力的厂商,结合完备的指标管理、AI增强分析,以及与最先进的湖仓引擎无缝集成的能力,可为用户提供敏捷、灵活和易用的数据分析和应用服务,具体如下:
具备成熟的企业级BI PaaS能力,能够支持SaaS、ISV等厂商快速构建数据分析应用,极大降低厂商自行构建数据分析能力的成本。
在功能方面,HENGSHI SENSE具备包括数据准备、数据管理、数据建模、数据分析、数据看板、指标管理等在内的功能全面的数据管理与分析能力,并支持通过零代码的方式,构建一站式的数据分析工作流;
在开放性方面,HENGSHI SENSE架构具备高度的开放性和扩展性,能够将数据准备、聚合、建模、分析、可视化等能力拆分成标准的功能模块,并为所有功能模块提供API接口,用户可以灵活调用所需功能的API,同时结合样式、主题的定制化,满足用户个性化的需求。
在多租户管理方面,HENGSHI SENSE能够基于不同用户复杂的组织架构,按账户进行行权限、列权限最小粒度的权限控制,并支持与业务系统的权限管理打通,以保障数据安全。
具备完善的指标管理与分析能力,让用户能够较低的门槛灵活应对业务报表和分析需求,并减少数据部门进行数据加工处理的成本和压力。区别于传统BI厂商的产品,HENGSHI SENSE在架构层面采用逻辑语义层(HQL)将数据与分析解耦,并将数据转换计算过程(Transform)后置,即将ETL转变为ELT。用户因此可以以指标为中心,通过HQL语言定义相关业务指标以进行数据分析,从而实现消除数据口径不一致,减少重复建模和中间表以提升建模效率,以及降低分析门槛,让业务人员具备自助分析的能力。同时,HENGSHI SENSE不断丰富完善了指标定义和指标管理能力,使用户能够在平台上建立完备的指标管理体系,实现从传统BI到自助式敏捷BI再到业务自主式指标型BI的转变。
以元气森林为例,元气森林利用HENGSHI SENSE的业务指标层对接其底层的各类明细数据,业务部门的各类数据查询、数据应用、业务报表都通过调用指标层的能力实现,从而高效满足业务部门的各类用数需求,支撑业务发展。
能够与业内先进的湖仓一体引擎无缝集成,提供高性能和低成本的数据分析体验。HENGSHI SENSE独特的ELT分析管道架构,具备强大的指标管理与分析能力,也对底层引擎的架构和性能等方面也提出了更高要求。因此衡石科技与云器科技合作,利用云器科技的湖仓一体数据平台,形成了云端一体化的数据分析解决方案,从架构上极大提升了分析的灵活性,真正让BI可以在业务侧落地。具体而言,云器科技的湖仓一体数据平台具备简化的系统架构,能够统一存储和处理企业的各类数据,同时,云器科技的湖仓一体数据平台具备高性能,以及根据分析需求对存算资源进行弹性扩展的能力,因此可以在企业进行大规模的指标查询和应用中,提升响应速度,并降低使用成本。
提供基于大模型的AI增强分析能力,让业务用户能够以自然语言的方式进行数据查询与分析,大幅降低数据分析的门槛。在功能设计上,HENGSHI SENSE利用大模型强大的自然语言理解,以及SQL生成能力,并基于平台的指标体系,让用户可以对系统进行提问,实现各类业务报表和分析功能;在使用形式上,平台采用AI Copilot的形式,给用户提供常用的Dashboard,并提供基于AI提炼的关键数据和信息,用户可以在此基础上针对相关问题进行进一步追问。此外,平台提供了通用的大模型调用框架,用户可以根据自身情况选择合适的大模型。
典型客户:
浩方电商、纷享销客、分贝通、致远薪事力、元气森林
银行对公智能风控
市场定义:
银行对公智能风控平台是融合征信、工商、产业链、舆情等丰富外部信息,综合利用人工智能、大数据、知识图谱等技术,针对贷前、贷中、贷后全流程建立风险防控体系,实现风控策略智能化的一站式平台。
甲方终端用户:
银行小微金融/普惠金融部、风险管理部等部门。
甲方核心需求:
为促进经济发展,政府在科技信贷、绿色金融、普惠金融等方面对银行有信贷指标考核。在此背景下,银行需要丰富企业信息渠道,建立清晰的企业画像和客观高效的风控模型,为工作人员开展客户准入、信用评级、授信审批、风险预警、贷后检查等工作提供决策支持。银行对公智能风控平台的需求具体体现在:
银行数据信息渠道待丰富。在对公信贷场景下,银行内部企业信息维度单一,多以企业财务流水、负债等基本面信息为主,缺少征信、工商、司法、电力、舆情、产业链等综合性信息。
建立面向内外部海量数据的数据工程能力。外部数据在转化成预警信号之前需要经过采集、存储、治理、开发、整合等多个过程,这要求银行具有对海量结构化和非结构化数据的存储能力,以及结合NLP技术对企业名称、经营范围、经营活动、相关描述等信息进行自动识别、打标、抽取、整合的能力。尤其在实时预警场景下,整体数据处理流程需要实时完成。以城商行为代表的中小型银行尚未构建起可满足上述要求的数据工程能力。
提高风控模型质量、完善风控策略体系。传统风控模型大多凭借专家经验和评分卡,存在数据获取维度窄、量化分析能力弱、精细化程度低等缺点,银行需要建立适合自身业务战略、客群特点、数据及系统现状的全流程风控模型和策略,否则难以对企业舆情、产业、司法等关联风险进行快速识别。
厂商能力要求:
厂商应具备海量数据采集、开发和整合能力,为风模控型提供高质量数据输入。厂商一方面应具备对海量数据实时采集和存储能力,同时具备对数据智能打标、加工处理和整合能力,支持对外部企业数据诸如流水、资产负债、涉税、质检、环保、海关、产业链数据等结构化和非结构化数据进行统一加工和整合,形成高质量数据集,供贷前、贷中、贷后全流程模型使用。
智能风控平台需覆盖贷前、贷中、贷后全流程风险管控,为客户提供一站式外部风险诊断。平台应为客户输出高质量预警信号,包括不限于企业风险画像、预警信号筛查、风险事件监控等功能,并且工作人员无需专业知识,也能轻松判断企业产业链传导、涉诉、涉税等专业风险。
厂商应提供定制化咨询和实施支持,赋能银行自主风控能力。在项目规划阶段,厂商应提供数据治理、模型定制、模型测试优化等咨询规划支持,在项目建设过程中提供接口开发、功能定制开发、大模型部署等项目建设支持。其中,针对数据治理,厂商应支持银行内外部数据融合,帮银行建立起数据开发和整合流程,赋能银行数据工程能力;针对风控模型和风险策略,厂商应提供个性化风控模型开发支持,能适应国有银行、城商行、股份制银行等不同银行之间、以及银行内部不同业务场景之间对风控模型定制化需求,建立适应银行定位和场景的预警策略、标签体系、定级策略等。
入选标准说明:
符合银行对公智能风控平台全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥5个;
2022Q1至2022Q4该市场合同收入≥500万元。
代表厂商评估:
拓尔思
厂商介绍:
拓尔思信息技术股份有限公司(简称“拓尔思”)成立于1993年,是中文全文检索技术的始创者,领先的人工智能、大数据和数据安全产品及服务提供商。拓尔思坚持“数智+赛道”的发展战略,以规模化的数据和知识资产、数字化基座能力和自研大模型能力为企业、政府赋能,实现数字化转型升级。
产品服务介绍:
拓尔思数星智能风控大数据平台,是一款利用人工智能、大数据、自然语言处理、知识图谱技术构建的综合型在线服务平台。平台围绕海量异构数据,全面监控海量金融实体多维风险。平台提供智能多维标签、预警信号推送、风险事件跟踪、风险传导关联、综合异构图谱等贯穿多场景全流程风险管理功能,提升金融机构风控能力。目前平台在风控、合规、 投研、监管等核心金融场景得到广泛应用。
厂商评估:
拓尔思在银行智能风控领域积累了丰富的头部客户,具备模型持续迭代和数据闭环的运营能力。拓尔思自身体系化的数据工程能力和自研大模型能力,向内支撑数星智能风控大数据平台提供实时高效的风控预警功能,向外赋能银行机构、提升银行场景化数据分析能力。
基于丰富的头部银行机构服务经验,拓尔思具备模型持续迭代,以及风控数据质量持续校验的闭环运营能力。拓尔思数星智能风控平台服务的头部金融客户包括中国银行、农业银行、国家开发银行、进出口银行、平安银行等。这使拓尔思一方面积累了专业深厚的智能风控垂直领域知识,另一方面多样化的客户带来差异化的风控场景,使拓尔思的风控模型得到持续迭代、风控数据质量得到持续校验,拓尔思形成完整的风控数据运营闭环。如在平台的预警信号推送功能中,拓尔思基于对智能风控场景的深度理解,结合知识图谱和NLP高精炼知识数据,精准识别企业复杂关系、分析群体特征、监控区域性风险,预警信号准确率超98%,NLP风险识别准确率超85%。
拓尔思具备海量数据的工程化能力,融合大模型能力,为客户提供实时的风险监控、预警和推送服务。
拓尔思具备体系化的数据工程化能力,如在数据采集和存储环节,拓尔思自建大数据中心,拥有10年以上的总数据量为2000亿+的政府、互联网、媒体、舆情、企业专项、产业等高质量数据;在数据管理和治理方面,拓尔思具备完善的大数据底座和人工智能产品对公开采集的数据资源进行统一清洗、治理、打标、加工、融合、管理等,为内外提供高质量数据资产。在数据分析和挖掘方面,拓尔思自研了500+深度学习算法模型、31000+标签维度规则、30+领域知识库等,可为媒体、舆情、金融风控、金融监管、产业服务等领域的业务快速高效地提供数据分析和挖掘服务。
在数星智能风控平台基础上,拓尔思利用自研拓天金融大模型,构建基于数据与知识融合驱动的agent智能体,在风险预警、风险报告生成和风险摘要生成等场景Agent工具链应用,提升风险分析的准确性、时效性与融合性,优化用户体验。在贷前尽调、贷后排查等环节,提高风控人员工作效率。
拓尔思提供在线服务SAAS、数据服务DAAS和本地化部署的复合服务模式,满足不同规模银行机构多样化风控需求。
针对小型银行机构,拓尔思可提供SAAS订阅服务和DAAS数据服务。SAAS服务提供全量实体查询、个性化推荐、自定义组合策略等功能;DAAS服务将基于标准标签以分钟级实时推送数据。
而对于需要构建或增强自身风控能力的中大型银行机构,拓尔思可为客户提供本地化部署服务,同时提供咨询规划、数据能力赋能等服务支持,使客户具备自主的场景化风险分析能力。如在咨询规划中,拓尔思能协助客户对既有数据资产进行盘点、确定数据加工策略、设计风险运营机制等;在数据能力赋能中,为客户梳理数据治理流程,建立股权、舆情、司法等多主题知识图谱,定义预警因子、预警模型,以及基于内外主题数据打造大模型助手等。拓尔思与中国农业银行合作建设风险监控平台,面向农行100万家企业授信客户,实时监控在营企业风险、推送风险信号,形成跟踪反馈闭环,大幅降低不良率,服务期内,成功提前预警中信国安、方正集团、新城地产等重大风险事件。
典型客户:
平安银行、国家开发银行、中国人保、中国银行
银行对公智能营销
市场定义:
银行对公智能营销平台是融合银行内外部信息,利用大数据、知识图谱、人工智能等技术,从客户画像、客户标签、商机事件、关联探索等维度挖掘潜在营销对象,实现精准营销,为高银行线上信贷业务提供支持。
甲方终端用户:
银行对公业务部、资产管理部、资产负债管理部、信贷审批部、风险管理部
甲方核心需求:
对公业务是银行的重要收入支柱。金融科技爆发式增长使银行同业竞争愈发加剧,同时市场融资渠道多元化,以股票或债券为代表的企业融资方式分流银行企业客户,也为银行对公业务带来冲击。在此背景下,银行传统对公营销依赖线下渠道获客的方式,暴露出信息不对称、线下渠道获客难、工作效率低、获客成本高等问题。银行对公智能营销平台的需求体现在:
丰富数据源,完善企业标签画像体系,支持对公营销和风控。全面的企业标签画像是银行开展客户分层经营、形成客户洞察的基础。银行内部企业标签以流水、负债为主,需增加诸如产业链数据、发票数据、上市公告、征信数据、舆情数据、股东股权披露等信息标签,完善企业画像。
拓宽拓客方式,提高目标企业触达效率。银行传统的对公营销线索获取,多依赖当地商会、招商局以及高层资源等,线索池有限。在获客竞争日益激烈的情况下,银行需要深挖企业关联关系,增加链式或网状拓客途径,如通过产业链、股权关系链、同业竞争关联、产品交叉营销关联、客户交易关联等多种途径,构建丰富的线索池,提升客户经理新客获取效率和质量。
增强商机发现、商机筛选和评级能力,实现精准营销。海量线索信息下,相较传统依据经验筛选,基于知识图谱、人工智能建模的方式能有效降低客户经理工作量、满足银行精准营销需求。银行建模场景包括:1)拓客中对新客、关联客户建模后进行批量营销;2)商机筛选中开展高潜价值客户识别、存量客户存款潜力预测等;3)商机转化环节,基于客户画像以及产品特征进行精准匹配与推荐;4)企业风险评估。以商机筛选为例,银行需要建立有效的商机评价体系,对商机线索分级评价,指导客户经理开展工作。如在针对规上企业的授信中,银行需要融合企业资本实力、收益能力、偿债能力、发展和稳定性为依据衡量企业的经营状况及未来发展潜力,同时结合政策导向,对区域内规上企业进行评级,为客户经理营销、授信等提供参考。
厂商能力要求:
厂商需具备丰富的外部数据源,并能提供基本数据服务。厂商需能够对接众多外部数据渠道,数据维度包工商、信用、融资、供应链、交易、园区、舆情等数据,并能将多源数据整合后形成高质量的API、SDK等数据服务,供银行直接使用。
厂商需能够帮助银行构建标签体系,生成差异化的客户画像。基于行内外数据的整合,厂商需能够帮助银行构建有效客户、高价值客户、高潜力客户、低风险客户等丰富的标签体系,形成多维客户画像;同时,厂商需基于征信数据、工商数据、交易数据等数据,构建风险相关标签,以帮助银行实现风险排查的前置。
厂商应具备知识图谱和AI建模能力,支持客户精准营销。在知识图谱方面,首先,厂商应在整合结构化和非结构化数据的基础上,刻画企业经营状况与企业之间的关联关系,形成链状、圈状、域状的客户群视图。其次,厂商应建立基于知识图谱的规则模型,支持企业股权变更、负面舆情、融资等突发事件在关系网络上的营销活风险传导,最终为客户经理推送商机或风险提示。在AI建模方面,厂商应具备NLP引擎、机器学习引擎,帮助客户从海量信息中进行语义识别、聚类分析,提供舆情分析或是信贷预测等支持。
厂商需能帮助银行建立起全流程客户管理与跟踪能力,并提供可视化能力,以帮助银行客户经理实现持续的企业客户价值挖掘。厂商对公营销平台应覆盖客户获取、客户成长、客户成熟、客户衰退等全生命周期管理,为客户经理提供完整的对公营销业务流程闭环,包括客户认知、营销过程、营销评估与提升,提高组织协作效率。
入选标准说明:
符合银行对公智能营销平台全部厂商能力要求;
2022Q1至2022Q4该市场付费客户数量≥5个;
2022Q1至2022Q4该市场合同收入≥500万元。
代表厂商评估:
数库科技
厂商介绍:
数库科技成立于2009年,是一家引领产融数字化的数据科技公司,五度荣获KPMG中国Fintech 50企业。数库科技长期致力于在金融及产业领域提供基于产业逻辑的智能数据产品与系统服务,帮助金融机构、企业集团、产业园区、政府部门解决业务场景中的数据和系统需求。
产品服务介绍:
「Clue智拓客」是数库科技的一站式智能对公营销平台,旨在帮助银行从产业链获客、园区获客、关系链获客、周边获客、商机线索、企业筛选、潜客跟踪等多种维度,深度挖掘有资金需求、可高转化、风险可控的优质潜在企业信贷客户,构建行业客户数字化洞察体系,完善银行对公数字化营销获客体系系统建设。
厂商评估:
数库科技以产业链图谱数据和企业图谱数据为基础,融合结构化数据量产和实时资讯精准解析能力,为银行提供一站式对公营销服务和管理支持,并以多种服务形式满足银行差异化需求。
数库科技拥有丰富的产业链图谱数据和企业图谱数据,为银行对公营销提供强大的数据支撑。
数库产业链数据体系以全球行业分类标准GICS为基础,拓扑至十二层级分类标准,形成从广义行业到细分产品的动态产业链体系。围绕上市发债龙头企业、私募融资企业、科创战新企业、核心企业供应链上下游企业等百万级高价值企业进行主营业务挖掘和梳理,归纳形成7000+项标准化产品分类,并将全国近7000万家工商企业与产业链体系打通,实现了全领域的企业上链。
数库企业图谱数据覆盖股权关系图谱、供应链图谱、工商信用、知识产权、负面风险及资质荣誉等标准化企业信息和知识图谱组件,能完整呈现企业内外关系链、股权链、融资链等信息。
产业链数据和企业图谱数据,为银行了解企业中微观全景画像、丰富获客途径提供数据支撑。数库科技相关数据产品已挂牌多地数交所,并落地多起场内交易,为股份行、城农商行提供一系列持续、稳定、高时效的区域性产业全景数据,赋能银行从产业链、供应链、产业园等多维度挖掘潜在客户线索。
融合算法和数据处理,数库科技具备结构化数据量产和实时资讯精准解析能力,为银行扩充文本识别范围,发掘潜在对公机会或是发现企业传导风险。
数库「DAS」数据加工工厂,基于深度学习、图像识别、NLP文本处理等多项技术,实现数据提取、清洗、标准化、质检全流程,可对PDF、Word、扫描件等多种非结构化数据文档进行高效提取、自动化量产成结构化数据,使数库科技能够低成本覆盖全面的上市发债公司财务及附注数据。结合龙头企业产业分类数据,快速形成同业财务对比能力,用于评价目标企业在同业中各项财务经营表现。
数库科技「SmarTag」智能解析引擎,可精准提取抓取海量新闻信息中蕴含的公司、人物主体、事件、行业、产品、地区及概念等多维度标签,一方面可持续反哺金融及产业知识图谱、丰富算法语料库,迭代数据生产引擎提升数据生产精准度,实现知识图谱的自我进化,另一方面,SmarTag对公司、行业的即时追踪,可与产业链体系、企业图谱深度结合,实时呈现上下游或关联方之间事件的传导反应。
「Clue智拓客」覆盖对公营销全流程,提供系统化对公营销流程管理,具备高度场景化、组件化特性。
在功能支持上,Clue智拓客丰富的产品模块赋能用户发现客户、洞察客户、判断营销时机、触达客户、过程追踪、效果分析等银行对公营销全流程。以发现客户为例,Clue智拓客提供产业链获客、园区获客、周边获客、以客获客等多种工具,提高银行获客效率。在营销流程管理上,Clue智拓客针对银行的组织管理机制,制定自上而下的营销管理框架,为管理者提供便利的名单创建及分发工具,为客户经理提供高效的营销记录跟踪功能,通过一站式关注、挖掘、跟进、记录,提升一线营销人员线索个性化管理与跟踪效率。
数库科技可提供标准化产品组件、标准化数据服务、SaaS账号服务、定制化项目开发等多种服务形式,满足银行差异化需求。针对中大型银行需构建自主对公营销能力需求,数库科技基于十余年的金融客户服务经验提供定制化服务。在数据能力方面,为银行建构统一数据治理体系,实现内外部多源数据融合;在系统开发方面,为银行搭建对公营销平台以及根据银行场景需求设计模型算法等。
05
入选厂商列表