2022爱分析· 数据智能厂商全景报告

2022爱分析· 数据智能厂商全景报告_第1张图片

报告编委

黄勇
爱分析合伙人&首席分析师
孟晨静
爱分析高级分析师
李冬露
爱分析分析师
冯怡欣
爱分析分析师
兰壹凡
爱分析分析师

目录
1. 研究范围定义
2. 厂商全景地图
3. 市场分析与厂商评估

  1. 入选厂商列表
  2. 研究范围定义

研究范围

数据智能是指以数据为生产要素,通过融合大规模数据处理、数据分析与挖掘、机器学习、可视化等多种大数据和人工智能技术,从数据中提炼、发掘具有揭示性和可操作性的信息,从而为企业提供数据驱动的分析与决策。

当前,数据智能已经成为企业实现数字化转型的核心方式。一方面,在实现初步数字化的基础上,企业希望把数据分析扩展到更多的应用场景,以在业务发展与运营中实现降本增效,或构建创新性的业务模式;另一方面,数据规模的持续膨胀,与分析场景的更加多样化,也对数据存储、处理和分析等方面的能力提出了更高的要求,因此企业需要对数据基础设施进行持续的升级与优化。

本次报告将数据智能市场划分为应用解决方案和数据基础设施两大部分,其中数据基础设施指利用云计算、人工智能、隐私计算等新兴信息技术构建的为企业赋能的平台类解决方案,主要包括数据的采集、存储、计算、管理等内容,进而为上层应用提供数据服务;应用解决方案是指通过数据智能解决方案在垂直行业或通用职能领域直接赋能业务价值提升的最佳实践。

综合考虑企业关注度、行业落地进展等因素,爱分析在本次研究中选取了数据基础设施中的分析型数据库、数据库管理平台、实时数据平台、DataOps、数据中台、云数据平台、数据分析平台、 数据科学与机器学习平台、知识图谱平台、隐私计算平台,以及应用解决方案中的城市大数据平台、智能营销、安全大数据共计13个特定市场进行重点研究。

本报告面向企业决策层以及数据部门、业务部门负责人,通过对各场景的需求定义和代表厂商的能力评估,为企业的数据智能基础设施及应用规划、厂商选型提供参考。

图 1:  数据智能市场全景地图

2022爱分析· 数据智能厂商全景报告_第2张图片

厂商入选标准

本次入选报告的厂商需同时符合以下条件:

厂商的产品服务满足各市场定义的厂商能力要求;
近一年厂商具备一定数量以上的付费客户(参考第3章各市场定义部分);
近一年厂商在特定市场的收入达到指标要求(参考第3章各市场定义部分)。

2. 厂商全景地图

爱分析基于对甲方企业和典型厂商的调研以及桌面研究,遴选出在数据智能市场中具备成熟解决方案和落地能力的入选厂商。

2022爱分析· 数据智能厂商全景报告_第3张图片

2022爱分析· 数据智能厂商全景报告_第4张图片

2022爱分析· 数据智能厂商全景报告_第5张图片

2022爱分析· 数据智能厂商全景报告_第6张图片

3.市场分析与厂商评估    

爱分析对本次数据智能项目重点研究的特定市场分析如下。同时,针对参与此次报告的部分代表厂商,爱分析撰写了厂商能力评估。

3.1分析型数据库

市场定义:

分析型数据库是指为应对企业管理人员、业务人员、数据分析师、数据科学家等人员对数据的各类分析和应用需求而提供的各类数据存储和计算引擎,包括数据仓库、数据湖、大数据平台以及湖仓一体数据平台等。

甲方终端用户:

企业IT部门、数据部门

甲方核心需求:

在企业数字化转型的过程中,数据应用场景呈现多元化趋势,数据规模也呈爆发式增长,企业需要深入挖掘数据价值,以提高生产与经营效率。在此背景下,对分析型数据库的数据库存储、计算、查询等能力提出了更高要求。具体而言,企业对分析型数据库的需求如下:

实时数据应用场景激增,企业需深入挖掘实时数据商业价值。企业在提高生产与经营效率的过程中发现,数据的时效性至关重要,如电商行业的订单查询、金融行业的实时风控等场景。因此,企业需要加强存储、查询与分析实时数据的能力,充分挖掘其商业价值。

业务需求爆炸式增长,存算资源弹性扩展能力急需增强。传统分析型数据库的存储和计算资源通常是耦合的,导致存储资源冗余、计算资源不足与扩展成本高的问题,且节点扩展会存在上限,影响系统的高可用性;同时,部分企业采用本地部署分析型数据库的方法也会对其存储能力、扩展性与并行处理能力产生影响。因此,企业需要优化已有分析型数据库的部署方式与扩展能力,为大数据分析的性能与速度提供保障。

业务智能化场景增长,对企业数据价值挖掘能力提出更高要求。近年来,企业业务场景不断丰富,数据正在成为其业务创新的核心,而大数据与人工智能等技术成为重要技术手段。但传统数据库存在对人工智能和机器学习等高级分析技术支持不足的问题。因此,企业需要借助人工智能技术增强分析型数据库的分析能力与效率,以及时响应业务需求。

运维成本过高,数据系统架构需简化。部分企业受到资源、技术能力等的限制,缺乏统一规划,部署了多种性能各异、彼此独立的分析型数据库,导致系统架构非常复杂,管理、维护与数据迁移的成本很高,稳定性差。因此,企业需要在统一规划之后,简化系统架构,降低分析型数据库的运维成本。

信创浪潮下,企业需要实现数据库国产化。在信创政策要求下,政府、国央企与金融等行业需要将已有分析型数据库更新为国产背景、符合信创要求、已通过国家自主可控测试的数据库,充分保障数据库的安全可控。

厂商能力要求:

具备较高的数据存储、查询与分析性能。厂商所提供的分析型数据库需要能够对海量数据进行存储、高并发查询与分析,满足特定场景下的性能需求。例如,部分场景下分析型数据库需要能够存储与管理实时数据,支持各类SQL标准,对海量实时数据进行高性能数据加载、高并发查询与分析等操作。

云上部署与弹性扩展。厂商需要能够提供支持云上部署、存储节点与计算节点相互独立且可分别独立扩展、在面对数据高并发场景时可按需快速实且现横向扩容的分析型数据库,充分利用云的可扩展性与相关资源。

支持智能化的数据分析和应用。厂商所提供的分析型数据库需要能够应用当前流行的AI、机器学习、高级分析等技术,实现对海量、高吞吐、高并发、多源异构数据的自动化与智能化查询与分析,提高数据价值挖掘效率与质量。

简化系统架构,统一管理数据。厂商需要提供性能良好、稳定性强、能够与已有数据库兼容的分析型数据库,帮助企业实现简化数据系统架构,实现以低成本进行系统维护、数据开发以及数据的统一存储与分析。

符合信创标准,实现国产化替代。厂商需要能够提供国产自研、能够与国产主流软硬件兼容适配、符合国家信息安全标准等资质要求的分析型数据库,同时,还需能够进行数据库迁移,完成国产化替代。

入选标准:

符合分析型数据库市场厂商能力要求;
2021Q2至2022Q1该市场付费客户数量≥10个
2021Q2至2022Q1该市场合同收入≥1000万元

  代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

柏睿数据

厂商介绍:

柏睿数据是一家以数据库为核心的“Data+AI”数据智能基础软件公司,基于完全自主研发的新一代全内存分布式数据库产品体系和人工智能产品体系,构建数据智能平台,以智能数据算力技术支撑,实时、迅捷、高效挖掘数据价值,为政府及国民产业数字化转型升级赋能。

产品服务介绍:

RapidsDB是柏睿数据全国产自主研发、具有完整独立知识产权、基于全内存结构的分布式分析型数据库,具备金融级数据持久化、数据安全性、系统高可用性,高于传统磁盘架构数据库100+倍数据读写访问和分析性能,适用于数据量大、实时性要求高的应用场景。

厂商评估: 

依靠专业的团队与丰富的行业实践经验,柏睿数据提供了数据存储与处理性能优良、自主可控的内存分布式数据库RapidsDB与全流程原厂服务。

基于全内存架构,数据存储、访问与分析性能优良,能够满足企业复杂的数据存储与处理需求。RapidsDB数据库是以全内存架构为基础的分布式数据库,具有高性能、高可扩展性强与高易用性。通过将数据全量加载到内存中进行处理,大幅度提升了数据访问速度与运算能力,满足企业高并发、低延时的业务需求;分布式架构能够通过集群及数据库分区的方式最大限度的提升负载状态下的数据库性能,当企业数据增长量达到一定规模后,无需对原有架构进行改动,即可在线灵活扩展。为解决传统数据库难以支撑企业海量分析需求的问题,柏睿数据还将数据库技术与人工智能技术深度融合,降低了数据读取的难度,企业可通过统一的数据库分析平台实现全量数据的实时分析,并应用于企业预测性业务场景中。此外, 该数据库还支持云端部署、统一SQL标准查询等功能,易用性大大提高。

技术全栈自研,产品自主可控,符合信创标准。柏睿数据库内核技术完全自主研发,实现了数据库SQL解析层、优化层、执行层到存储层的自主可控,兼容适配了全部国产主机、芯片及操作系统,顺应了信创趋势。基于此,公司不仅能够主导产品的功能迭代,针对不同客户的个性化需求做定制化功能,还能在网络存储计算资源等方面快速优化,提供原厂级的数据库管理运维工具。此外,公司还成立了信创小组,定期与不同的行业机构、客户、行业主管单位、技术主管单位等进行信创数据库技术探讨以及需求对接,对产品进行优化改进,更好的应对将来信创政策的全面落地。

自主研发安全芯片,发展上游数据治理能力,为分析型数据库发挥性能提供坚实基础。为了更好的服务客户,除了数据库产品外,柏睿数据还着力于硬件研发与数据治理能力强化。一方面,该企业组建DPU开发团队进行安全芯片研发,将其与自研数据库技术结合,有效解决了交易型数据库与分析型数据库行列混合存储带来的性能下降问题,实现了对数据库读写、存储、并行查询等操作的全域加速;另一方面,深入研究数据编织,帮助企业更加安全、快速的进行数据传输,以支持分析型数据库的实时分析。

深耕六大行业,为客户提供数据库全流程精细化服务。自成立以来,柏睿数据致力于为产业数字化赋能,凭借其多样化的产品、经验丰富的行业专家团队以及客户成功团队,为金融、能源、工业、互联网四大行业与数字政府、智慧城市两大领域提供全内存分析型数据库产品与全流程原厂数据库服务,以满足各行业的多样化场景需求。其中,原厂数据库服务涵盖部署前的规划咨询、部署中的数据开发迁移以及部署后的运维培训服务。

典型客户:

中国移动、北方健康
 

图片

睿帆科技

厂商介绍:

广州睿帆科技有限公司(简称“睿帆科技”)成立于2015年,以大数据及人工智能为核心技术为用户提供平台产品及服务,拥有自主创新的数据智能全生命周期产品体系,包括Baymax大数据科学平台、国产分布式雪球数据库、慧帆AI平台、湖仓一体大数据开发平台、InfoMover实时采集同步等,赋能企业数字化转型、为企业提供智能管理与知识服务,服务领域覆盖电信运营商、公安、轨道交通、政务、金融、应急等多个行业。

产品服务介绍:

SnowballDB™是睿帆科技自主研发的用于联机分析处理的 MPP 列式数据库。

SnowballDB™提供 PB 级别大数据集的在线多维查询和分布式存储,支持超低查询时延,百亿级数据毫秒级查询;支持准实时数据更新,支持边写边查,可进行准实时全量数据分析;支持高并发,可上百人同时查询;具有高容错机制,支持跨中心多副本灾备,数据自动同步、自动恢复。SnowballDB™适用于海量结构化数据存储、高并发点查询、高吞吐即席查询、多维分析和实时查询场景。

厂商评估: 

睿帆科技SnowballDB™产品在支持高并发查询、实时数据查询、高性能写入以及易用性等方面具有明显优势;此外融合SnowballDB™分析型数据库和Baymax™大数据科学平台,睿帆科技还能提供一站式数据平台解决方案。

睿帆科技SnowballDB™具有极速联机分析性能,支持PB级数据高并发查询和实时数据查询。SnowballDB™的极速联机分析性能通过列式存储、MPP集群架构、向量化执行、LLVM编译等四种特性实现。首先,SnowballDB™的列式存储可显著降低IO消耗,加快查询速度,且列式存储可支持轻量化压缩,在保证高性能的前提下实现较高压缩比,降低数据存储成本,适用于高并发查询场景。其次,SnowballDB™分布式集群架构支持多并发查询以及读写并发,允许在运行时创建表、加载数据和运行查询,无需重新配置或重启服务,适用于准实时数据查询场景。再次,SnowballDB™向量化执行既能对列数据一个批次调用一个指令,有效减少函数调用次数,又能实现仅加载必要列数据进CPU缓存,充分利用CPU资源。此外,在编译策略上,SnowballDB™支持LLVM动态编译,能极大提高代码执行效率。

SnowballDB™具有高性能数据写入特性。一方面,分布式集群架构采用share-nothing方式,支持多节点并行写入,消除单节点性能瓶颈,最大化集群写入性能。另一方面,SnowballDB™采用先进 Hash 随机算法,自动均衡各节点数据分布,保证各节点磁盘占用相对均衡。 此外,SnowballDB™支持多副本备份,可在不同节点上维护相同数据,当前节点发生故障时,自动切换由备份副本提供服务,在保证数据安全的情况下提升性能。

具有较强的易用性,能显著降低用户使用门槛。SnowballDB™提供图形化管理工具,可实现数据库对象管理、可视化SQL查询工具、系统诊断分析、用户权限管理、集群监控、副本监控等数据库全生命周期运营管理。SnowballDB™内置多种表引擎,用户可直接访问 HDFS / KAFKA / MYSQL 等外部数据源,无需额外代码,降低使用门槛。此外在安装方面,SnowballDB™支持多种安装方式,如可使用标准的 Ambari 开源平台提供的图形化安装配置管理功能,进行动态添加删除集群节点、调整SnowballDB™的配置参数、启停 SnowballDB™服务以及动态更新升级版本;也支持RPM包安装。

睿帆科技具备提供一站式数据平台解决方案的能力,在电信运营商行业服务经验丰富。睿帆融合SnowballDB™分析型数据库和Baymax™大数据科学平台,协同多源异构数据集成、高性能在线分析及查询、开发应用等功能,为客户提供数据融合、数据治理、高速检索、多维分析、交互查询等数据中台能力。目前,睿帆数据平台解决方案服务领域涉及电信运营商、政府、安防、交通等行业,服务节点超过1000个,日处理数据达到PB级,其中电信运营商客户已覆盖广东、河南、四川、浙江等全国10余个省市自治区。

典型客户:

北京移动、四川移动、广东省公安厅机场公安局、广州市公安局白云区分局

3.2数据库管理平台

市场定义:

数据库管理平台是指具备对多类型数据库进行统一安装部署、迁移、备份、监控告警、巡检、性能分析、智能运维、安全管控等数据库全生命周期管理能力,提升企业数据库综合运维效率的平台。

甲方终端用户:

数据库管理员

甲方核心需求:

企业应用的数据库种类在快速增长,一方面丰富的数据类型需要多种关系型、非关系型数据库储存;另一方面,开源和国产数据库的崛起也迅速打破传统商业数据库垄断的局面。数据库种类的增加在满足企业多种场景需求的同时,也带来繁重的数据库管理及运维工作。企业需要简化多模异构数据库的管理工作,降低管理成本。企业对数据库管理平台的核心需求主要体现在以下几个方面:

简化数据库管理工作,降低数据库运维成本。随着企业系统中数据库数量及种类快速增加,企业需要完善的数据库管理工具如监控告警、安装部署、备份恢复、安全管理、高可用性、资源管理等工具对多终数据库进行统一的管理运维,简化数据库管理工作。

数据库管理员易上手、操作便捷。针对复杂的数据库集群架构,企业需要数据库管理平台兼容多种类型数据库,提供诸如可视化功能、系统诊断分析、支持自动及自定义部署等工具,帮助数据库管理员实现多数据库轻松管理、便捷安装。

厂商能力要求:

厂商需要能够提供平台化、一体化的数据库管理平台产品。数据库管理平台能够提供多基础设施的整合能力,将多种类型的数据库纳入管理的范围,并提供平台化的工具覆盖数据库全生命周期,整合监控、性能分析、巡检、审核、运维、安装部署、变更、SQL执行、数据迁移、安全管控等众多功能模块,为企业提供一体化的数据库管理服务,降低复杂性。

厂商需具备数据库智能化管理能力。除数据库管理外,厂商还应具备机器学习、RPA等AI技术,将部署、巡检、数据采集、审核等流程自动化或半自动化,减少重复的人力劳动;以及支持数据库智能分析,提供数据库性能可视化,实现智能告警优化、趋势分析、异常诊断等数据库运维功能,降低数据库管理员门槛。

入选标准:

  1. 符合数据库管理平台市场全部厂商能力要求;
    2.  2021Q2至2022Q1该市场付费客户数量≥5个;
    3.2021Q2至2022Q1该市场合同收入≥500万元。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

爱可生

厂商介绍:

上海爱可生信息技术股份有限公司(简称“爱可生”)成立于2003年,是数据库整体解决方案提供商,国家规划布局内重点软件企业,具备自助知识产权的核心数据处理关键技术,为企业数字化转型提供高性价比、快速落地的分布式数据库、多数据库智能管理平台、数据库容器云平台和面向AI的向量数据库等产品。

产品服务介绍:

爱可生的云树®DMP产品是一款可管理多款开源和信创数据库的集群管理平台,提供部署、监控、备份、高可用、日志管理、事件告警等功能组件,实现对数据库的一站式管理。云树®DMP提供自动监控所有数据库实例,通过统一管理视图界面展示,方便用户管理整个基础数据库设施;支持便捷部署并正确使用读写分离中间件或分布式中间件,自动维护中间件和数据库实例的高可用性;可对数据库实例进行故障检测,自动处理可用性问题等功能。

厂商评估: 

爱可生云树®DMP产品能显著增强开源数据库功能完备性,并且在案例积累以及为用户提供数据库全生命周期一体化解决方案方面具有较强优势。

云树®DMP集成开源数据库周边生态工具,能增强数据库功能完备性。在数据库运维方面,云树®DMP在诸如监控告警、安装部署、备份恢复等基础运维功能之外,还提供了高可用性、灾备管理、资源管理等多种运维功能。其中高可用组件支持用户进行多种高可用架构部署,可对数据库实例进行故障检测,自动处理诸如虚拟机崩溃、计算节点服务进程崩溃、主机宕机等故障场景,还能支持便捷的切换主库、部署新从库、变更中间件等拓扑变更,维护数据库实例的高可用性;灾备管理组件可使用户掌控系统容灾业务运行情况,快速方便的完成数据恢复和测试演练,实现对虚拟机数据的备份,保障跨数据中心数据资产安全;在资源管理中,读写分离组件和分库分表组件支持数据库节点根据需求进行动态水平扩展或针对节点性能容量限制进行纵向扩展,能提升开源数据库的扩展性。在数据库开发方面,云树®DMP还提供诸如SQL编辑、审核、脱敏等数据库开发工具。

此外,云树®DMP还具备良好的兼容性、易用性,且部署便捷简单。架构方面,云树®DMP能兼容MySQL标准协议下的所有开源数据库产品,提供数据库管理能力;易用性方面,云树®DMP提供数据库运维视屏,实时展示数据库集群的可用性、实例数、容量、告警等信息,用户可轻松管理复杂数据库集群架构;部署方面,云树®DMP支持自动部署,支持任何类型基础设施,用户可自定义部署规范。

爱可生具备深厚的开源数据库研发能力和完善的服务体系,融合云树®DMP平台,协同为用户提供数据库全生命周期一体化解决方案。研发方面,爱可生具备基于多种开源数据库产品如MySQL、TiDB、OceanBase、OpenGauss、Redis的自研优化能力,持续研发增强数据库核心功能,并为开源社区反馈贡献源码。服务方面,爱可生为用户提供包括数据库、数据库管理平台产品在内的丰富的知识库以及培训考核体系,帮助用户快速落地。因此,融合开源数据库研发能力、云树®DMP数据库生态工具以及服务能力,爱可生能为用户提供从数据库架构设计、开发、运维全生命周期一体化服务。

爱可生还具备丰富的金融行业数据库管理平台实践经验,为用户提供安全稳定的用户体验。爱可生是最早进入数据库管理平台市场的厂商之一,已经在金融领域积累多个标杆案例,持续通过用户业务场景持续验证并完善云树®DMP产品的安全性、稳定性。此外,爱可生参与编写信通院《大数据 数据库管理平台技术要求》标准,且云树®DMP是业内首个通过信通院数据库管理平台产品能力测试的产品,在平台基础能力、平台资源管理能力、安装部署能力、性能分析及优化能力、健康检查能力、高可用能力、运维管理能力等12项能力域均达到标准。

典型客户:

兴业银行、百胜中国、银联国际

3.3 实时数据平台

市场定义:

实时数据平台是指基于数据同步、流处理等技术,支撑数据实时采集与接入、实时存储、实时计算、实时分析与查询等能力,从而提供实时数据查询与分析决策服务的数据平台。

甲方终端用户:

企业IT人员、数据工程师、数据科学家

甲方核心需求:

随着市场竞争环境和客户需求的快速变化,以及实时数据的积累,实时数据应用在提高生产效率、提升客户体验和提供个性化产品和服务方面的价值日益凸显,企业对数据驱动业务决策的实时性需求在不断提升。为此,许多企业通过手工定制、消息总线和事件流中间件等方式进行数据集成,但这些方式各自面临业务耦合度过高,管理、复用困难,实时性不足等缺陷,因此,企业需要通建设统一平台进行实时数据的汇聚、开发和运维管理。企业对实时数据平台的需求主要有以下方面:

实现实时数据汇聚。企业数据分散保存在多个数据库、系统中,数据的类型繁多、数据收集频率的差异也在客观上提升了数据进行实时采集和同步的难度,因此,企业急需通过借助专门的实时数据工具,实现实时数据汇聚。

海量数据统一存储和管理。大型企业每天产生的数据在TB甚至PB级,多数据源、多模数据的大量采集、长期保存、冷数据变温数据等带来了新的海量数据存储需求,而随着企业数字化建设进程加快,数据存储云、边、端并行,需要对数据进行有效管理,保证数据能够高速流转。

数据即时查询和分析。查询和分析是实时数据应用的核心,但大数据的加工、处理和分析过程较为复杂,因此如何能够提升数据查询和分析速度,让实时数据的价值最大化,是企业最为关注的焦点。

技术架构支持业务稳定运行。企业流数据往往有多个来源,以金融、零售行业为例,在双十一、618等重大节点容易面临数据高并发的情况。因此企业需要搭建一套稳定成熟的平台架构,在高并发的情况下保证系统运行稳定性。

在各业务场景中最大化实时数据的价值。实时数据分析是一个与业务场景进行深度结合的过程,因此企业需要针对自身业务情况,根据不同场景的要求,与具体业务逻辑相结合进行高度定制化的场景开发,从而保证应用效果最大化。

厂商能力要求:

 提供实时数据汇聚能力。一方面,厂商需高度适配各类技术框架,支持Kafka、RocketMQ、 IBM WebSphere MQ等多种数据源,以及多种数据格式;另一方面,厂商需要提供实时数据采集和计算技术框架,实现数据实时汇聚。

提供统一数据管理平台,进行数据分类分级存储和管理。首先,厂商需要为企业提供统一数据管理能力,通过平台化的集中式开发,沉淀数据任务模型,统一规范数据调用权限。在此基础上,厂商要基于存算分离模型,根据数据访问需求程度和其生命周期阶段,对热数据、温数据和冷数据进行分级存储。

具备高性能数据分析引擎。在数据分析与计算环节,厂商需将实时处理过程中的复杂计算逻辑,包括糅合指标、模型、业务规则等各类计算逻辑封装为可编辑的数据模型,并尽量实现高度模块化封装。其次,分析引擎需要具备较高性能, 提供目标应用程序所需的吞吐量和延迟要求,对数据查询进行即时响应,同时尽量能够提供基于 API 的高度灵活和可扩展的查询分析服务。

提供满足高并发高可用的先进技术架构。厂商需要提供高可用的技术架构,甚至可进一步具备在异常情况下的集群自愈能力,帮助企业有效应对数据高并发量的压力。

场景化实施经验丰富,具有成熟的行业解决方案和较强的定制化能力。不同行业在数据类型和实时数据应用场景上都有很大差异,而每个具体应用场景都是大数据技术、数据指标、模型和业务逻辑有机结合的产物,因此厂商首先需要具备定制化开发能力,其次需要在积累不同行业的场景化落地经验的基础上形成相对标准化的行业解决方案,保证实时数据平台的成功落地。

入选标准:

1.符合实时数据平台厂商能力要求;

  1. 2021Q2至2022Q1该市场付费客户数量≥5个;
  2. 2021Q2至2022Q1该市场合同收入≥500万元。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

九章云极

厂商介绍:

九章云极DataCanvas成立于2013年,是中国数据智能基础软件的领军企业,专注数据智能基础软件和数据科学平台的持续开发与建设,通过自主研发的一系列企业级AI应用所需的平台软件产品及解决方案,极大降低了AI门槛,助力用户实现数智化升级,推动政府、金融、通信、制造、交通、互联网等多领域客户AI规模化应用。

产品服务介绍:

九章云极DataCanvas RT 是一款分布式流数据实时处理、分析和决策平台,覆盖实时数据集成、数据资产创建和管理、数据建模分析、数据服务和运维监控全生命周期,帮助企业形成风险监控、精准营销、实时预警与事中分析等多种实时分析决策能力。

厂商评估: 

九章云极DataCanvas一站式实时数据分析平台,具有功能模块化衔接、技术架构稳定高可用等优势,通过其完善的应用开发能力和用户管理能力,能有效帮助企业实现实时数据分析和应用。

提供覆盖实时数据分析全生命周期的一站式平台,能有效实现各流程无缝衔接,提升分析效率,降低系统部署复杂度。九章云极DataCanvas提供一站式流数据分析平台,将流数据处理、建模、监控等各环节,以及指标、风控、营销等工具封装为统一平台上的不同功能模块,而非彼此独立的产品,屏蔽不同产品带来的系统复杂性。如在数据开发环节,DataCanvas RT实时决策中心 能够直接使用上一环节已经定义好的数据资产,无需考虑底层数据库认证问题,从而提升数据分析的效率。

具备稳定、高可用技术架构,能在提供高并发数据服务的同时,满足实时数据分析的需要。九章云极DataCanvas产品采用分布式可扩展架构,能够实现动态集群管理和弹性扩容,支持高并发数据计算和处理;同时,其存算分离的数据存储,能够减少数据搬迁,支持多样数据接入。在实时数据分析方面,系统具备强大的实时能力,能进行批量加载和毫秒级查询响应,支持实时写入、实时更新。

对于开发人员,提供多种数据开发方式和DevOps能力,能显著提升开发效率和体验。在数据开发方式方面,DataCanvas RT实时决策中心不仅内置包含数据输入源、窗口类、统计类、规则类、模型类的近百种预置算子,用户能通过托拉拽预置算子,轻松高效构建流数据作业;同时,系统还支持通过在线编辑器定义SQL流作业,支持UDF在线开发、作业调试监控、作业段落编排等功能,辅助构建实时数据分析模型和场景。在开发流程方面,九章云极DataCanvas提供一站式实时作业的DevOps,内置可视化环境配置管理、透明环境部署、网页调试、监控告警等功能,实现数据开发全流程高效协作和规范化运营管理。

具备多租户管理及用户权限管理等功能,帮助大型企业解决多用户协作难题,保障数据安全。九章云极DataCanvas产品能够以企业组织架构为基础,进行多租户管理,对计算资源和数据资产进行资源分配,同时提供统一的用户登录,支持基于角色的权限和定制化菜单,面对大型企业复杂人员构成,实现千人千面的数据权限管理,保障集团数据安全。

具备多家大型企业落地经验,提供全面贴合生产环境的业务场景。九章云极DataCanvas实时数据平台已在金融、交通、通信、互联网等各行业多家大型企业成功落地,在实时指标加工和监控、实时数据采集和加工、实时分析报表、实时风控和交易反欺诈四大高度抽象的应用场景基础上,根据不同行业复杂的实时数据分析需求提供针对性解决方案。如在金融行业,九章云极能提供客户足迹分析、客服大数据分析、资金变动营销、风险实时类预警等典型应用场景,帮助企业实现数据价值。

典型客户:

浦发银行,山东城商行联盟,兴业银行

3.4DataOps

市场定义:

DataOps(数据研发运营一体化)是人、流程和技术的高效组合,用于管理代码、工具、基础架构和数据本身,从而实现数据领域应用的敏捷开发和持续集成应用,优化和改进数据生产者和数据消费者的协作,持续交付数据流生产线。

甲方终端用户:

数据工程师、数据架构师、运维工程师、测试工程师、数据分析师

甲方核心需求:

数据分析对企业的价值日益增长,企业内部数据分析愈加民主化;与此同时,数据分析工具如BI、机器学习、可视化、数据挖掘等多元工具的运用,以及复杂的数据用户角色如数据工程师、数据管理源、报表开发人员等,大大增加了数据开发及运维工作量以及数据应用交付的协调难度。针对数据应用开发,企业面临的主要需求是:

实现跨部门、多角色协同。原始数据从获取、加工、就绪到产生价值的过程涉及多部门多角色协同,如数据架构师、数据工程师、数据分析师、测试工程师、数据科学家、运维工程师、数据管理员、数据分析师等,目前各角色之间目标割裂、难协同,导致数据应用开发周期长,企业需要一套工具能将多种角色组织在一起,高效协同完成数据应用开发,降低应用开发延误。

提高数据质量。在数据应用开发过程中,常由于数据质量问题导致数据应用难使用。数据质量问题来源于多个方面,如提供数据源的业务系统没及时规范地更新表结构、数据口径不一致、数据填报不规范、以及数据存储架构调整引发数据源意外改变等,企业需要体系化地对数据全生命周期进行数据治理,保证数据质量,让数据可信。

提升数据开发效率。在实际的业务系统中,数据来源多种多样,不同数据对数据处理的时延和数据量的要求不同,产生多种任务类型如离线同步、实时同步、离线计算、实时计算等,需要跨平台相互配合完成多个异构任务。因此开发人员面临大量数据流转规范、计算节点执行顺序编排等问题。此外,数据开发之后的部署上线也会花费大量时间。企业需要一体化平台管理跨平台异构数据任务开发、测试、部署上线,提高数据开发效率。

简化数据运维工作。当前企业各产品应用都会有监控告警能力,比如离线任务突破基线、实时任务失败、API调用失败等,企业需要统一监控平台实现对多产品的监控、告警。

保障数据安全。随着数据的民主化、数据应用的广泛使用,数据安全也成为企业重点考虑的问题。数据安全涉及到系统安全、数据安全、安全审计等,企业需要系统化的工具保证数据生命周期各个环节安全。

厂商能力要求:

厂商应具备一种或多种DataOps工具及技术,支持实现数据应用敏捷开发。如针对企业多种硬件环境、开发环境、发布环境、运维流程等,厂商应具备云原生、容器技术提供统一的开发、测试、运维环境;如为满足特殊数据应用的时效性,厂商应具备实时和流处理功能;针对复杂的数据类型及应用场景,厂商应具备多种分析引擎,如分布式处理引擎、离线批处理引擎等;针对数据质量,厂商应具备数据治理、数据血缘、数据标准的能力。此外,厂商还应具备应用集成、数据安全等功能。

厂商应具备丰富的实践经验,能基于DataOps理论为用户制定合适的解决方案。一方面,数据开发运营一体化涉及数据存储、数据计算、数据开发、数据运维等数据价值链各个环节,需要厂商具有丰富的实践经验和成熟的DataOps理论协助企业挖掘痛点、分析原因、提出合适的解决方案;另一方面,企业数据开发、运维、管理能力参差不齐,需要厂商兼容、优化企业现有数据开发、运维、管理功能及能力,针对缺失、薄弱的环节进行定制化开发,实现数据开发运营一体化。

入选标准:

  1. 符合DataOps市场全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥5个;
    3.2021Q2至2022Q1该市场合同收入≥500万元。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

数造科技

厂商介绍:

数造科技成立于2015年,是新一代数据开发管理能力提供商,将先进的DataOps方法论与领先的大数据技术进行产品化落地,帮助企业建立并打通数据开发、治理、运营、服务各环节能力,实现数据全链路一体化高效管理和应用。现已服务金融、政务、零售、能源电力、制造等领域的多家头部企业。

产品服务介绍:

数造科技自主研发的核心产品DataBuilder是基于DataOps方法论打造的新一代敏捷数据管理平台,架构于湖仓平台之上,实现数据同步、数据开发、任务提测、任务发布、运维调度全流程敏捷协作,同时通过统一元数据和数据目录,形成便于快速自助查询、血缘追溯和质量检测的数据资产体系,为企业提供中台化的数据管理运营服务全链路能力建设解决方案,挖掘数据要素潜能。

厂商评估: 

数造科技聚焦于数据全生命周期的开发和管控两大核心环节,以其在DataOps领域多年的研发经验和多家大型客户服务实践,能够针对大型企业数据任务量大、开发工具多、运维压力大的普遍问题,提供一站式数据开发、治理、运营的完整工具流,配合任务编排和持续集成发布能力,支持数据工程的高质高效开发投产,同时把数据治理工作融入到开发过程中,通过标准流程和自动化能力,促进数据开发的质量和数据治理效率。

通过数据沙箱环境配合持续集成发布,大幅提升发布效率和质量。企业数据应用开发上线过程普遍面临开发协作和缺少测试数据两方面难题,开发之间往往会因为数据和资源之间的抢占导致团队开发效率降低,而开发缺少独立测试环境和合适的测试数据则严重影响数据开发的质量。数造科技产品通过沙箱环境给数据工程师和数据科学家提供开发工具和实验数据,他们可在其中编写代码和测试任务,而不会影响生产环境,保证测试的充分性,有效提升数据任务质量。此外,数造科技产品通过构建完整的从任务开发、单元测试、任务提测到任务上线和生产运维全流程体系,实现数据开发上线的标准化持续运作。

能搭建自动化的数据开发运营全流程工具链,配合任务编排能力,在数据开发者、管理者、消费者等角色间形成无缝衔接的高效顺畅协作范式。一方面,数造科技通过将从原始数据、加工数据到业务就绪数据的集成、开发、部署、运维全生命周期形成敏捷的数据管道,将专业数据人员需要的所有工具、步骤和流程简化为一个易于使用、可配置的端到端系统,打通数据链上不同角色协作通道,同时用高度自动化流程规范所有环节,代替部分手工操作,从而最大化组织数据的价值。另一方面,数造科技产品提供任务编排能力,能根据数据开发和分析策略来调整任务的顺序、依赖关系,解决大型企业多任务同时进行的协作问题。

提供主动式数据治理功能,最大化数据资产的服务价值。数造科技产品能够在统一的数据标准和规范指引下,进行数据生命周期各环节的设计态到运行态的联动式互相管理和约束,从而把数据治理工作植入到数据开发和数据消费的过程中。同时主动式数据治理还提供业务协作数据资产管理能力,通过智能打标、使用引导和资产协作增强用户对数据的理解水平,提升看数效率,赋予数据消费者自助式探索分析能力。

具备成熟的场景化解决方案和定制化能力,能有效保障产品在不同行业成功落地。数造科技基于对不同行业的多家头部客户的服务经验,已在银行、保险、零售、能源、政府等多个领域形成完善的场景化解决方案,针对数字化基础较弱的企业,能直接提供成熟产品及解决方案。同时,数造科技具备较强的定制化能力,对于数字化基础较好的企业,能够在贴合企业原本数据开发管理模式的基础上,最大化兼容和复用其现有数字化成果,针对其缺失能力补充对应产品,并进行定制化开发,实现数据开发运营一体化的目标。

典型客户:

南方电网、沃尔玛(中国)、招商银行、平安产险、太平保险

3.5 数据中台

市场定义:

数据中台是在统一数据标准规范基础上,提供数据接入、数据开发、数据资产管理、数据分析、数据服务等能力的数据资产管理和服务平台,帮助企业实现数据集中管理和服务。

甲方终端用户:

企业数据工程师、数据分析师、业务分析师

甲方核心需求:

近年来,随着企业信息化、数字化进程加快,企业内部各业务系统数量增加,多系统数据重复计算、数据难以集成利用、数据质量堪忧等现象普遍。为打破“数据孤岛”,提升数据服务能力,需要进行数据中台建设。综合来看,企业对数据中台的建设普遍具有以下几方面需求:

实现数据统一接入和集成:许多大型企业的数据存储基础设施建设普遍以业务需求为导向分批分次建设,没有形成统一规划,导致数据孤岛和数据碎片化问题,在数据调用时需要分别从不同的系统、数据库中取数,异常繁琐。因此,企业需要通过建设统一平台,对多元异构数据进行统一接入和汇聚,形成集团层面的数据底座。

提升数据质量,形成统一数据资产:企业在多年数据建设的过程中,搭建了多种不同的数据仓库或是基于开源技术框架的数据存储工具,数据标准、口径不统一,数据指标混乱,质量参差不齐,无法集中对外提供数据查询和数据服务。因此,企业需要通过标准化数据治理,完成数据的资产化,并实现统一调度和开发的能力。

统一数据开发,提升数据服务能力。数据开发涉及复杂的流程,技术门槛较高,面对多个业务部门的需求,企业存在重复开发和建设问题,造成成本浪费,需要建设企业统一的数据开发与服务平台,将数据资产转化为业务可用的数据服务,以实现能力复用与服务共享。
确保数据资产能够持续高效运营和提供服务。数据中台不仅是对企业数据采、存、管、算、用全流程的体系化建设,也是对企业数据应用习惯,甚至企业组织和文化层面的重大革新,因此数据中台搭建仅仅是第一步,更重要的是如何采用一套科学的管理和使用方法,让中台持续发挥其数据资产运营服务的价值。

厂商能力要求:

适配多种技术架构,帮助企业有效屏蔽底层技术栈差异。厂商首先需要开发出集成度高的数据接口、能广泛适用各类数据源的数据采集工作,打通数据仓库和数据湖之间元数据的移动和访问,同时能够对结构化与非结构化数据进行集中存储与处理。同时,厂商还需要考虑到企业数据存储的扩容需求,保证用户能够稳定通过增加存储节点应对数据量的增长。

提供数据治理服务,构建全面的数据资产管理体系。首先,厂商需要具备数据治理和咨询规划能力,通过对企业数据进行全面盘点,对数据指标进行分类,制定数据标准,划分数据安全等级等,将企业数据资产化。其次,厂商需要通过成熟的中台产品实现数据开发和处理的标准化流程,建立数据类目标签体系,便于数据检索和维护,实现数据治理的完整闭环。
能构建完整的数据开发链路,形成高效数据服务。厂商数据中台产品需要提供统一的数据服务接口,以及实时和离线开发工具,同时配合智能调度、智能运维、监控告警等一系列工具,实现数据资产的统一开发和调用,提升数据开发人员和分析人员的效率,高效灵活地支撑前台业务。其次,厂商产品需具备数据服务能力,提供将数据资产快速转化为业务可用数据服务的功能体系,并实现数据服务的管理和调度。

具备丰富落地经验,能提供企业数据中台建设咨询和定制化服务。企业需要具备较强的咨询服务能力,需为企业在数据运营体系、组织协同和数据应用场景拓展三方面提供切实可行的方案,并通过培训等方式强化和落实。此外,不同行业、不同规模的企业其组织文化、业务场景和数字化水平差异巨大,因此数据中台的定制化程度较高,厂商需要在积累大量客户服务经验基础上,加深其对不同行业和业务场景的认知和理解,提升面向不同行业的解决方案成熟度以及定制化水平。

入选标准:

  1. 符合数据中台全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥8个
  3. 2021Q2至2022Q1该市场合同收入≥1000万元

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

每日互动

厂商介绍:

每日互动股份有限公司(简称“每日互动”)成立于2010年,是专业的数据智能服务商,致力于用数据让产业更智能。公司在互联网运营、用户增长、品牌营销、金融风控等场景积累了丰富经验,为互联网企业和政府部门提供丰富的数据智能产品、服务与解决方案。

产品服务介绍:

每日治数平台DIOS定位数据智能操作系统,包含数据治理平台、数据建模平台、机器学习平台、标签平台、数据开发平台、可视化平台、数据服务平台、调度平台等八个功能组件,为用户提供可视化向导式的操作和交互界面,使开发人员和工程师能够以项目模式省时省力地进行数据治理和开发工作;同时,平台提供全生态低代码和无代码应用构建能力,使得无开发背景的业务人员,能够便捷地应用数据、灵活地分析数据;此外,平台还提供完善的安全管控机制,让企业和组织安心地管理和使用数据资产。与传统中台不同,每日治数平台DIOS操作便捷、轻量、易上手,对外输出治数能力,已在政务、品牌营销、交通、金融等行业积累丰富的实践案例。

厂商评估: 

每日治数平台DIOS功能完善,能为用户提供数据接入、数据治理以及数据应用等一站式数据工作平台。此外,每日治数平台DIOS数据应用组件门槛低,易上手,能加速企业应用落地,帮助企业沉淀经验建立方法论体系。

每日治数平台DIOS提供数据接入、数据治理到数据应用的一站式工作平台。数据接入方面,每日治数平台支持分布式数据接入,能稳定高效实现多源异构数据集成。此外,通过每日治数平台DIOS,用户可实现自身数据与每日互动等第三方数据打通,丰富数据来源。数据治理方面,每日治数平台DIOS提供行业数据标准定义、数据资产管理、数据质量监控、资产地图展示等功能,帮助客户提升数据质量、搭建数据资产中心。数据应用方面,每日治数平台DIOS提供数据建模、机器学习、数据标签、可视化等功能组件,为用户提供归因、预测等智能业务应用。

每日治数平台DIOS的数据应用组件具有可视化、低代码的特性,门槛低,用户易上手。如可视化平台内置30余种主流图表,业务人员可自助搭建数据看板,进行业务趋势、道路运行、投放转化、人口流动等场景的数据分析;机器学习平台提供丰富算法、可视化的模型指标,非建模专业人员也可快速完成算法开发、模型训练、模型评估、在线预测等机器学习全流程;建模平台支持低代码数据建模,业务人员通过“拖拉拽”式的简单操作即可完成数据建模,便捷高效。

每日治数平台DIOS帮助企业沉淀自身数据经验,建立方法论体系,提升数据加工效率。每日治数平台DIOS支持用户将可复用的数据能力、业务能力、效率工具沉淀成企业独有的数据产品和工具。如可视化平台中,业务人员可将自建的通用主题看板沉淀成看板模板,供团队复用,提升工作效率。此外,用户也可以积累企业独有的模型算法库、业务标签洞察体系等,供企业内部业务人员、分析师以及开发人员查看、分析和应用。

每日互动在政务、高速、金融、互联网、品牌营销等多个领域积累深厚,加速用户数据应用落地。一方面每日互动积累了丰富的行业标签和特征数据以及大量在实际场景复用度高的算法模型,内嵌到每日治数平台DIOS中,形成可灵活调用的能力组件、行业标签模板、算法模型库等,开箱即用,帮用户快速进行应用落地及业务论证;另一方面,多年的行业积累使得每日互动团队在品牌营销、智慧高速、智能政务、金融风控等领域积累专业知识和深度理解,能准确挖掘客户需求,并与客户的工程师、分析师、建模师密切合作,解决客户业务场景中的各种问题,将数据应用真正落地,释放数据价值。比如,在品牌营销领域,每日互动不仅帮助品牌主完善和治理数据资产,还协助品牌挖掘用户数据,根据样本人群特征,搭建购买预测模型,明确高潜力购买人群,实现定向投放。

3.6 云数据平台

市场定义:

云数据平台是具备多租户、弹性扩展、计算存储分离等特性的新一代数据平台,提供数据存储计算、数据集成、数据开发、数据治理、运营管理、数据分析、数据共享和服务等一站式能力,支持对各类结构化和非结构化数据的处理,以及BI、数据科学、AI/ML、实时分析等数据应用场景,从而帮助企业低成本地获得自助式、可按需使用的数据平台服务,并实现安全的跨组织数据共享和消费。

甲方终端用户:

企业管理层、IT部门、业务部门

甲方核心需求:

企业随着数字化转型的推进,数据规模和数据应用场景快速增长,而传统架构的数据仓库、数据湖等数据基础设施,由于不具备弹性扩容、多租户管理等能力,导致使用门槛高、扩容和运维成本高、数据利用效率低、组织间数据共享难等问题日益突出。针对诸多问题,企业需求具体如下。

数智化时代,以数据驱动业务的趋势愈发明显,然而在传统数据应用体系下,企业普遍缺乏全流程的数据工具,不同模块间链接不通畅、数据利用效率低等问题突出,因此通过一站式的数据产品及服务,降低开发成本、减少开发时间、实现数据价值最大化是企业现阶段重点需求。

为全方面激发数据价值,企业需要跨部门、跨业务线甚至跨企业、跨地域的数据共享与联动分析,并可能需要引入外部数据源进行数据补充。因此,在保证数据安全、自主可控的前提下实现跨组织的数据共享与分析是企业的另一需求。

传统数据平台系统,由于扩展弹性较差,且不支持存储和计算独立扩容,导致闲时存储、计算资源浪费,且投资成本高,因此企业需要降低数据库及算力投资、运维成本,实现实际需求与可调用能力的精准匹配。

随着竞争的逐渐加剧,越来越多的企业决策者和业务人员,都期望能够实现T+1甚至 T+0 的实时数据反馈,从而基于更有时效性的数据进行业务决策,避免因决策周期过长而导致错失商机,如何实时地集成、调用、分析数据也是企业重要关注点。

厂商能力要求:

厂商需要提供云数据平台产品和相关解决方案,需具备以下能力:

能为企业提供从数据存储、数据集成、到数据分析应用的一站式数据服务,通过产品的整体封装,屏蔽了底层技术框架的复杂性,帮助企业建立易用的全流程数据工具体系,实现数据价值的深度挖掘,并提供/支持BI可视化功能,直观简约的体现数据价值,赋能企业管理层和业务人员。

具备多租户管理能力,实现跨组织数据共享与消费,使企业能够对来自内部不同业务部门、分支机构以及外部不同组织的数据源进行数据专区隔离管理,在保持各数据源独立性、数据安全性的前提下,实现跨组织的数据共享,并以此来提升企业数据建模能力,更好的为业务赋能。

基于云环境,将整体数据平台云化,利用云服务器、分布式存储等技术,产品采用计算存储分离架构,具备弹性可伸缩能力,根据企业需求实现在公有云、私有云、混合云等部署环境下的一键扩缩容、按需计费,并大幅降低运维成本。

具备更快捷的复杂查询性能,从而明显降低批处理、即席查询等任务所需的时间,支持实时分析,保证数据处理能力的高时效。

支持主流的开源生态,并提供智能化的运维管控平台,实时监控数据平台运行状态,并提供多种方式的告警服务。

入选标准:

  1. 符合数据中台全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥5个
  3. 2021Q2至2022Q1该市场合同收入≥1000万元

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

科杰科技

厂商介绍:

科杰科技是一家数据能力构建商,核心技术团队拥有丰富的头部互联网企业云数据平台搭建及运营经验,致力于将成熟完备的数据底座产品与多业态复杂场景的最佳实践有机融合,为企业提供数据管理、开发挖掘、运维一体化的整套方案,助力企业快速构建数据能力,实现高度规范化、敏捷化的数据工作协同与数据应用创新。现已服务多家政府单位及金融、能源、汽车、零售等多行业头部企业。

产品服务介绍:

科杰科技核心产品Keen Data lakehouse是采用云原生湖仓一体架构的大数据底座,拥有大数据基础平台 Keen KDP、数据开发管理平台Keen BDP、数据同步系统Keen Dsync、实时计算平台Keen Stream、数据标准产品Keen DSM、数据质量产品Keen DQM、主数据管理平台Keen MDM、数据科学平台Keen DSP、数据资产目录Keen Asset、数据指标平台Keen Index、数据服务平台Keen DAAS 、数据标签平台Keen TAG等12大功能模块,在实现多云资源统一纳管、弹性扩展和灵活调度的基础上,同时满足数据统一采集、存储、开发、管理和服务的需求,具有高性能高稳定性的特性。
厂商评估: 
科杰科技基于自身领先的大数据与云原生技术能力,形成了具有良好兼容性、扩展性和易用性的云数据平台产品,配合其久经验证的落地方法论,帮助企业建设全域数据资产开发、管理和运营能力。

产品体系完整,能够一站式赋予企业全链路数据能力。科杰科技Keen Data Lakehouse 12大功能模块提供从数据采集、开发、治理到数据资产管理、数据建模分析、数据服务全链路数据能力,能够一站式满足企业云上数据管理和开发应用需求。

采用领先的技术架构,支持企业数字化长远发展。科杰科技数据底座采用业内领先的云原生与湖仓一体技术架构,支持万亿级别以上大数据存储计算、分析挖掘,具备万台节点、千人协同开发的能力。同时,采用分布式、高可用、可扩展的存储架构,让企业无需进行架构和模块代码调整即可增加服务器数量,性能随节点数量线性上升,便捷满足系统业务扩容需要,可支持企业未来5-10年数据能力建设,大幅减少实施部署成本。基于领先技术架构的数据底座,可以支撑企业未来长期的数字化转型需求。

兼容性佳,支持异构资源的统一纳管。在兼容性方面,科杰科技大数据底座产品解决了不同技术框架间在实时/离线一体计算、统一资源调度和ACID事务性等方面的适配问题,能够同时兼容Oracle、MPP等数据库,并涵盖Hive、Spark、Flink等Hadoop原生组件,从而对企业原有数据库进行最大程度复用,避免重复建设,形成对云迁移或混合云部署的良好支撑。

易用性强,能实现流程自动化,赋能组织高效开展数据协作和运营。产品整体设计融合DataOps方法论,贯穿并落实进数据部署、治理、运维、到最终应用于生产的全生命周期,提升了数据工程师、数据分析师等不同角色的协作水平,并赋予企业大规模跨团队协同开发的能力。同时,通过固定流程将部分数据工作自动化,降低了数据分析应用的技术门槛。
拥有最佳实践方法论,有效帮助企业全域数据资产体系落地。科杰科技拥有大型互联网企业大数据团队基因,并结合多年服务经验形成了独有企业数据平台建设流程与迭代方法论。一方面,针对数据工作的长流程与高度复杂性,科杰科技能够快速为企业梳理和盘点现有数据,构建通用数据层次和管理架构,根据企业业务需求确立数据标准和规范。另一方面,针对企业组织架构、管理习惯的不同特点,以及在数据管理和使用上的不同角色,科杰科技能够对企业不同业务线、集团和分公司之间的多租户数据权限、数据安全、存储压力等问题提出针对性解决方案,并将项目管理、项目结果复用等数据工作管理办法通过培训方式输入企业内部,实现企业全域数据资产管理体系的落地。

典型客户:

中金公司、贵阳银行、永旺
 

图片

数新网络

厂商介绍:

浙江数新网络有限公司(以下简称:数新网络)由原阿里云大数据平台研发总监,御膳房、DataWorks平台创始人,数加平台总负责人陈廷梁创建。经过多年研发投入,数新网络已具备政务、金融、能源、高端制造、教育等多行业专属解决方案,高效助力企业深挖数据价值,打造核心竞争力。

产品服务介绍:

数新DataCyber云数据平台解决方案,包含了云数据平台Cybermeta、数据科学平台CyberScience、运维管控平台CyberOPS、大数据分析工具CyberExcel四大核心产品。基于四款产品,数新网络可提供数据汇聚到数据服务、高效建模、智能运维、智能分析的一站式服务,让数据从采集到展现、从分析到驱动应用得到高质量结合,整体提升企业竞争力。

厂商评估: 

综合来看,数新网络在一站式服务能力、产品协同性、技术架构先进、交付灵活性、生态五个方面具备优势。

在产品体系方面,数新DataCyber云数据平台解决方案拥有完善的产品矩阵,包含CyberMeta、CyberScience、CyberOPS、CyberExcel四大核心产品。一方面,可以为客户提供一站式服务,帮助用户快速建立从底层数据存储到上层数据应用的全流程数据工具体系;另一方面,能够为客户提供线上管控运维、数据可视化等辅助功能,帮助用户有效降低运维成本,提升整体数据利用效率。

产品协同性方面, 相较于传统公司各模块独立设计的方式,DataCyber基于后发优势,打造了具备高协同性的产品矩阵,有效解决了产品间解耦问题,大幅简化了用户产品适配以及系统建设流程,客户在购买产品后能够快速实现数据价值的提升。

在产品技术架构方面,首先,DataCyber采用流批一体技术架构,通过整合高性能、稳定版本的开源存储及计算大数据组件,支持兼容多种主流开源存储计算引擎,有效降低用户产品使用成本;其次,支持面对甲方客户的定向开源,可以在各大云平台部署使用,使客户避免技术路径依赖,提高技术的自主可控性;第三,具备弹性扩缩容、多租户管理、跨组织数据共享和实时查询分析、告警等多种核心能力;第四,公司80%为研发人员,团队主要来自大数据和金融领域,拥有丰富的行业经验和产品研发经验,有力支撑了产品的开发与升级。
在产品交付实施方面,DataCyber支持多种灵活的交付方式,可以根据客户需求提供标准化及定制化产品解决方案;同时,数新支持多样化的产品部署模式,可以根据不同行业客户需求,提供公有云、行业云以及私有云部署方式,便于客户快速部署实施。

在生态合作方面,数新已与多家数据服务厂商建立深度合作关系,针对客户个性化服务需求,数新可以快速集成合作伙伴能力,为客户提供前期咨询规划、数据开发治理、后期维保培训等全流程服务,并能够为伙伴提供的服务进行全程把控,确保服务交付质量。

典型客户:

浙江省金融综合服务平台、杭州市临安区数据中枢平台、杭州市滨江区科技积分贷平台
 
3.7数据分析平台

市场定义:

数据分析平台是一套由ETL引擎、数据仓库、数据分析工具和数据查询报表工具等功能模块组成的软件系统,能够在打通和整合企业内部各类数据源基础上,通过多样化的数据查询和分析,以数据报表和其他可视化图表形式输出数据分析结果。

甲方终端用户:

企业数据分析师、业务分析师、管理人员

甲方核心需求:

数据分析和可视化是企业数据最直观的价值呈现方式。随着数据量的指数级上升和数据类型的丰富,企业对数据分析平台的需求也从最初较为简单和定向的报表和大屏,向多元化、场景化的深度挖掘分析,以及低操作门槛的方向演变,具体而言:

支持业务人员、管理人员实现自主数据分析。数据分析结果的最终受众是企业业务人员和管理人员,但大多数数据分析平台的主要使用者是企业数据团队,在业务逻辑向数据逻辑转换过程中,由于沟通成本等原因,需求响应的即时性和准确性都难以保证。因此,企业业务人员和管理人员需要一个低门槛、易操作的数据分析查询平台,不仅能够直接满足其部分即时性、灵活的数据分析需求,同时还能够方便其参与数据分析过程,与数据团队协作共建。
提升数据分析结果产出速度。企业在多年的数据分析实践中,经过多次加工处理形成了极度膨胀的ETL任务和中间表,在运行中会消耗大量IT资源,严重拖慢了分析结果产出的速度。随着外部市场的变化加快和企业运营的敏捷性提高,企业需要小时级、分钟级的分析结果,无法接受以天为单位的产出。

支持业务侧大量场景化、定制化需求。随着企业在对数据分析产品的使用不断加深,不再满足于仅仅用其生产固定报表,而是希望能在更多深度结合垂直业务的分析场景下使用数据分析平台满足相应的需求。然而,大部分数据分析平台是基于预设的分析场景进行搭建,新需求的实现需要数据工程师进行定制化开发,等待周期较长,极为不便。

厂商能力要求:

为满足以上需求,厂商需要为企业提供高性能、分析功能强大、低门槛的数据分析平台,具体而言:

通过构建高性能数据分析引擎或高效数据流通链路等方式,提升数据分析速度。其一,厂商可以基于AI算法,在数据准备和数据探寻等数据分析环节中实现流程的自动化,提升效率;其二,厂商可以通过建立更完善和通畅的数据接入、处理、分析全链路,加快数据流转。此外,厂商还可以通过构建独立的模型指标层,实现数据存储和计算的解耦,从而实现高效的数据分析。

能提供丰富的数据分析功能,并支持模型、指标的灵活调整。厂商对预设数据分析场景的定制化能力无法满足企业衍生出的多样化、垂直场景化的分析需求。因此,厂商首先需要在产品中加入以机器学习、深度学习等技术为基础的分析引擎,支持对大数据实现归因分析、预测分析等多种智能化分析方式;其次,厂商产品需要支持数据模型以托拉拽等方式灵活调整,帮助数据分析人员实现快速按需定制。

能提供低门槛、高易用的数据交互方式,满足业务人员使用需求。为应对非数据分析专业人员的查询、分析需求,厂商首先需要提供便捷的数据查询入口,支持通过拖拉拽、搜索、语音等简易交互方式实现数据查询;其次,厂商需要优化在报表展示界面,让用户能够通过滑动、托拉拽等操作自主进行数据和指标的关联分析、对比分析等,并支持多种图形化呈现方式选择。

入选标准:

  1. 符合数据分析平台全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥10个
  3. 2021Q2至2022Q1该市场合同收入≥1000万元

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

佰聆数据

厂商介绍:

佰聆数据是一家企业数字化运营能力提供商,基于数字化运营平台产品、DASO方法论和专业的本地化服务团队,形成深度贴合不同行业属性和业务特色的“平台+服务”一站式数字化运营解决方案,帮助各企业形成数据驱动的战略决策、市场开拓、经营管理、风险管控能力。目前已累计服务电力、金融、政府、制造、通信等行业的近百家大型政、企单位。

产品服务介绍:

佰聆数据以在实践中沉淀总结的企业数字化运营方法论DASO为指导,打造了以“聆鉴”、“聆析”为核心的数字化运营平台,支撑企业快速构建指标、模型、标签、策略等数字化要素,并基于此开展各类大数据挖掘分析工作。其中,聆鉴是企业级大数据标签运营平台,帮助企业以标签的方式从海量异构数据中高效提炼各类业务对象特征与需求;聆析是企业级大数据深度探索分析平台,基于创新的“分析导图”技术,支撑用户灵活开展大数据分析和数据深度探索。

厂商评估: 

在产品方面,佰聆数据以 “分析导图”、“策略画布”、“场景画像“、“看板双模切换”等创新性功能,实现了产品独特的易用性;在服务方面,佰聆数据以本地化专业服务团队,以及成熟的落地经验和方法论,支撑数据分析应用在企业的高效落地,助力企业实现数字化转型。

首创“分析导图”技术,支持智能化的数据深度探索分析。佰聆数据创造性地提出了“分析导图”技术,对业务分析人员在分析工作中的“分析思维过程”进行建模,基于多节点联动分析的分析思路映射与优化技术,将用户大脑中隐性的分析思路以“分析导图”的方式进行管理,同时结合机器学习、知识图谱、NLP等技术,实现对话式交互分析、分析思路智能推荐、分析结论自动生成等增强型分析能力,提升用户对海量数据的洞察能力,支撑用户开展大数据分析和数据深度探索。

具备立体化策略设计能力,数据分析成果快速赋能业务执行。传统数据分析工具能够产出数据分析结果,但无法直接触达业务,而聆鉴平台的“策略画布”支持业务人员以托拉拽方式制定业务策略,并支持对策略进行预演和效果评估,最后通过策略执行端与企业内部各种微服务进行连接,实现策略自动发布执行。以电网欠费催收业务为例,电网公司原本需要在高风险欠费用户筛选完成后,在短信平台上传名单,编辑短信内容并发送,数据分析和业务执行是割裂状态。使用聆鉴平台后,业务人员能够直接在策略画布设计整个业务策略,并一键进行审批—发布执行完整流程,大大提升了业务响应速度。

本地化专业团队提供贴身服务。佰聆数据拥有由数据分析师、数据科学家、资深行业专家组成的专业、能力全面的大数据技术服务团队,能够全方位解决客户在数据采集处理、数据分析、挖掘构建、场景化应用等各方面问题。同时,佰聆数据在全国超20个省市具备本地化服务网络,能够敏捷响应,快速支持,提供贴身服务。

在电力、政府、金融等多个行业拥有丰富实施经验和成熟落地方法论。佰聆数据拥有10年以上大数据分析应用经验,并长期深耕电力、金融、政府等领域,成立至今已服务国家电网、南方电网两大电网公司多个省级以上电网公司,深交所、建设银行、广发银行等金融机构,以及人社部社保中心等政府单位,能够贴合业务场景进行数据分析应用的部署和落地。此外,佰聆数据独创由发现问题、分析问题、评估改进和解决问题四大环节组成的“DASO”方法论,通过科学完整的方法论推动实现从业务现状到业务目标和最佳实践的转化。

典型客户:

国家电网客服中心、京博控股、广发银行

图片

北极九章

厂商介绍:

北极九章是一家企业数据增强型分析能力提供商,具备行业领先的NLP自然语言处理技术,以简洁的对话式搜索颠覆传统SQL数据查询,让数据分析工具低门槛直接赋能企业业务人员,帮助企业轻量级打造数据分析与业务应用的高效闭环,并推动形成“全民数据科学家”的探索型数据文化。目前,北极九章产品已在金融、互联网、快消、零售等多个行业数十家标杆企业成功落地,并与华为云、腾讯云、AWS、Kyligence、听云、售后宝等企业达成生态合作。

产品服务介绍:

北极九章增强型数据分析引擎,是一款面向非数据分析专业的业务人员和管理人员的智能化数据分析工具,以自然语言搜索式数据查询功能为核心,提供多种智能分析模型,支持自动适配生成报表,同时能通过自动化数据备份、多维权限验证、不可逆数据加密等强大的数据管理手段保障企业数据安全,打造安全数据管理体系与高效的数据协作范式。

厂商评估: 

北极九章产品以领先的NLP和机器学习技术,为企业业务和管理人员打造高度易用的分析场景,既能为中小型企业提供相对完整的数据分析能力,又能在大型企业中作为传统BI的必要补充,解决企业数据分析能力最后一公里的问题。

采用先进NLP to SQL自然语言识别交互技术,降低数据分析门槛。北极九章采用完全自研的NLP技术,将自然语言转化为SQL语言完成数据查询工作,并且适应人与人之间自然对话场景指向模糊的开放性问题。例如,用户直接检索“XX商品销量”,系统可自动识别语义并按时间、地区等常用维度展示与关键词相关的数据。此外,北极九章产品支持设置和沉淀不同行业内部特有的表述方式,从而最大限度贴近用户使用习惯,降低数据分析的学习成本和技术门槛。

能力全面,对于未使用BI产品的企业,能一站式满足大部分数据分析与可视化需求。首先,北极九章增强型数据分析引擎覆盖数据管理、数据搜索、数据分析、可视化、数据订阅和协作全生命周期,具备自然语言查询、自动可视化图表生成、自动下钻进行智能化归因分析、时序预测分析等功能,帮助企业构建完整的数据分析能力。其次,北极九章可通过对数据预处理提升查询分析响应速度,实现TB级数据实时获取分析结果。最后,北极九章产品让企业员工能够低门槛自主探索数据分析场景,寻找指标之间的关联,根据企业自身业务逻辑实践出最适合的分析场景。

灵活低门槛,对已使用传统BI产品的企业,能短、平、快解决业务部门的灵活分析需求,打通企业数据分析能力最后一公里。敏捷BI产品的报表模板相对固定,更改和创建门槛高,依赖专业数据分析师,因此,敏捷BI既难以满足业务部门提出的具有高度灵活性的长尾需求,对于业务部门的日常性分析需求也会因业务人员和数据人员对业务场景的理解不一致而无法发挥最佳效果,甚至导致数据分析和业务之间长期存在断点。北极九章通过将数据分析能力开放给业务人员,免除需求沟通过程,在业务侧直接形成数据—业务快速迭代的闭环,同时激活业务人员数据创新能力,真正实现让提出问题的人解决问题。

轻量化灵活部署,带来优质的客户体验。北极九章具备成熟的产品化封装能力,对于已完成企业内部数据治理的客户,能够直接对接企业内部数据库,快速完成部署工作,真正达到开箱即用的效果。此外,北极九章分析引擎可嵌入企微、钉钉、飞书等办公软件和企业自有业务系统,并支持移动端和 PC 端,用简洁流畅的操作带来良好使用体验。

典型客户:

国家电网、小红书、雅戈尔
 

图片

衡石科技

厂商介绍:

衡石科技是一家数据分析和 BI 领域的标准化软件产品厂商,核心团队来自Amazon、BAT、秒针等高科技公司大数据部门,能够以标准化云原生数据分析PaaS能力,同时帮助甲方企业与SaaS厂商、ISV快速整合多种数据源,搭建高价值数据分析及应用场景,全面赋能各行业用户持续构建数据生产力。

产品服务介绍:

HENGSHI SENSE 是一款云原生架构的全栈数据分析PaaS平台,以行业领先的虚拟语义层技术,搭建新型ELT+E数据分析通道,配合多租户管理、无代码自助分析、中心化指标管理等能力,实现高度敏捷、高度灵活化数据分析。面向ISV/SaaS厂商,HENGSHI SENSE帮助厂商敏捷搭建高价值的分析场景和报表指标体系,为其用户提供更专业的数据服务能力;面向企业客户,HENGSHI SENSE 作为分析工具不仅以ELT 敏捷分析架构和指标中台功能提供数据分析能力,更为企业构建从数据集成、管理、建模到数据分析、指标管理和数据应用的全生命周期完整工作栈。

厂商评估: 

衡石科技以行业领先的HQL、多租户、湖仓一体等技术,构建企业级数据分析PaaS平台,以多种形式为SaaS厂商、ISV及企业客户提供敏捷分析、灵活易用、轻量部署的数据分析及应用服务。

具备领先的ELT+E架构,能实现存算分离,显著提升分析效率,降低资源成本。衡石科技变传统ETL分析为ELT+E(分析管道+嵌入业务),通过将数据指标和建模层独立于数据存储计算,使数据查询分析不再依赖底层数据库性能,从而大大减少数据仓库的数据准备工作,提升数据查询和分析的效率,减少资源占用和消耗,同时也能够便于企业实现本地+云、混合云等更为灵活的部署形态。

能基于虚拟语义技术构建分析指标集市,增强分析灵活性,降低数据分析门槛。衡石科技自研的虚拟语义层能够用函数、语法、条件语句表达业务逻辑,并以此为基础构建了直供数据分析的指标集市。面对个性化数据分析需求,使用传统BI工具时需要数据部门辅助,而HENGSHI SENSE能够支持业务部门按权限进入指标集市调整指标计算公式,就能实时查看所需的报表,从而将个性化数据分析能力直接赋予业务分析人员,大大提升了数据分析和查询的灵活性。

开放性佳,多租户管理能力强,能够大大降低ISV/SaaS厂商的数据分析能力构建成本,实现良好的嵌入体验。首先,HENGSHI SENSE 以标准化PaaS方式将基础数据分析能力提供给ISV/SaaS厂商,厂商能够基于自身成熟的行业Know-how,零代码快速搭建数据分析场景,满足多种场景化个性化分析需要,同时其架构的高度开放性使得其能够很好地嵌入市面主流SaaS产品,从而大大减少其自主研发成本。其次,HENGSHI SENSE 具备强大的多租户管理能力,能够基于不同用户复杂的组织架构,以账户为最小权限单位,保障数据安全。
产品功能全面,能够为企业客户构建数据分析全生命周期工作栈。面对企业客户,HENGSHI SENSE 在数据分析能力之外,还具备湖仓一体能力,能够有效整合多源异构数据,屏蔽复杂的数仓运维,解决从原始数据到数据建模分析中间的能力的断层;指标中台能帮助企业中心化管理业务指标体系;数据服务层拥提供交互式看板和可视化报表,支持用户零代码搭建可视化数据分析场景,从而一站式实现数据聚合、管理、建模、分析和可视化,构建完整数据全生命周期。

产品化封装能力强,能实现轻量化部署。HENGSHI SENSE 是高度封装的标准化产品,提供多种方式集成已有系统,API接入上线即用,相比传统BI产品,部署时间节约90%以上,实现轻量化无负担的产品交付。

典型客户:

分贝通、纷享销客、宝尊电商、六度人和 、元气森林 

3.8数据科学与机器学习平台

市场定义:

数据科学与机器学习平台是指涵盖数据接入、数据准备、特征工程、模型训练、模型部署、模型管理等端到端建模全流程的软件平台,为企业提升模型开发效率。

甲方终端用户:

数据科学家、风控建模人员、营销建模人员、业务分析人员、模型应用人员

甲方核心需求:

为敏捷响应市场变化需求,企业智能化应用场景正变得更加普遍,如智能营销、智能风控,由此带来企业建模需求激增。传统的机器学习模型主要依靠专业数据科学家进行开发,存在开发流程慢、模型反复开发不共用的情形。整体而言,企业对数据科学与机器学习平台的需求主要体现在以下几个方面:

提高建模效率,快速响应业务需求。机器学习模型构建通常由问题定义、数据收集、特征工程、模型选择、模型训练、模型评估等多个环节组成,每个环节又包含多种路径,以及多组可选参数,依赖人工进行开发,模型从开发到部署上线的周期时间过长,导致模型应用不能及时满足前端业务需求。企业需要自动化建模解决方案,缩短建模周期、降低建模成本,快速响应前端业务需求。

降低建模门槛。传统的Al模型构建难度大,技术门槛高,通常需要具备专业建模知识的数据科学家来完成,但大部分企业往往不具备完善的数据团队,因此需要具备低门槛的数据科学与机器学习平台,可供一般业务分析人员使用,增强业务建模应用的灵活性、及时性。
模型资产积累。传统的机器学习模型存在模型文档编写费时费力、数据科学家成熟的建模经验无法供其他人员复用、模型交接低效导致模型反复开发等问题,企业需要将优秀的模型沉淀为模型资产,提高模型复用性,加速模型应用上线。

保证模型效果。企业智能应用的场景主要为分类、预测、推荐,由于直面用户,模型效果的优劣直接影响企业风险控制、成本控制以及收益,企业需要持续提升模型效果。

厂商能力要求:

厂商应具备自动化建模功能。厂商的机器学习平台应能简化数据准备工作、可支持特征工程自动化、支持通过拖拉拽的方式实现模型开发,大幅提升建模效率,同时降低建模门槛,可供专业的数据科学家和一般业务分析人员同时使用。

厂商应支持实现模型资产沉淀。提供一键应用功能,将训练成功的模型以API的形式发布为线上服务,降低模型上线难度,并支持将企业现有模型集成形成模型资产共享,供其他用户在线调用,提高模型复用率。

厂商能提供场景化建模支撑。由于模型开发和应用与行业场景的高度结合,厂商提供的机器学习模型平台需内置针对特定行业的模板和特征库,契合场景建模需求,如针对金融风控行业提供风控标准评分卡建模模组,可对信贷申请者进行多方面信息挖掘,快速建立各种具备高精准性的风控评分卡模型。

入选标准:

  1. 符合数据科学与机器学习平台市场全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥10个
  3. 2021Q2至2022Q1该市场合同收入≥1000万元

代表厂商评估:
(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

飞算云创

厂商介绍:

前海飞算云创数据科技(深圳)有限公司于2020年成立,是飞算数智科技(深圳)有限公司旗下全资子公司,专注于研发人工智能技术产品与服务、加快企业实现智能应用,公司已在泛金融领域积累丰富落地场景,包括智能风控、精准营销、智能推荐、销量预测、客户流失预警等。

产品服务介绍:

飞算云创的AI.Modeler全自动数据建模平台是面向数据加工和模型开发的建模平台,涵盖数据建模领域的分析、清洗、衍生、选择、迭代、上线等整个生命周期,为用户提供自动化数据质量检测、自动化数据清洗、自动化特征工程、自动化参数调整、自动化模型选择等一键建模以及一键部署功能,具有开箱即用、高效稳定的特点,能显著提升AI应用开发效率。
其中AI.Modeler按照使用人员的专业性不同分为专业版AI.Modeler Pro和极简版AI.Modeler Lite。AI.Modeler Pro面向专业建模人员,在自动建模基础上提供金融风控模组、并可自动生成模型解释性报告及训练日志,满足专业建模人员模型评估、模型决策需求。AI.Modeler Lite面向普通业务人员,帮助无建模背景的业务人员快速创建Al模型,实现AI应用。

厂商评估: 

飞算云创的全自动数据建模平台AI.Modeler在降低使用门槛、适应不同建模背景人员应用、提升建模效率、沉淀模型资产等方面具有明显优势。此外,AI.Modeler Pro的风控建模模组具有良好的场景适应能力。

AI.Modeler 能实现零代码全自动数据建模,同时支持专业建模人员和非专业人员快速上手建模,并显著提升建模效率。针对不具有建模知识的普通业务人员,AI.Modeler提供低门槛极简版AI.Modeler Lite,在数据准备、特征工程环节进行优化,实现一键建模。其中针对建模的数据准备环节,AI.Modeler Lite可自动检测数据类型并清洗,简化数据准备工作;在特征工程环节,AI.Modeler Lite支持自动特征提取、自动特征衍生、自动变量分箱以及自动特征变量筛选等过程,业务人员只需导入数据即能得到模型结果。

AI.Modeler的一键建模使业务人员专注于业务问题,免于繁琐的数据工程,并显著缩短项目周期,实现对业务需求的快速交付。此外,飞算云创为AI.Modeler建立了完善的培训体系,包括产品白皮书、线上使用手册、产品培训视频、线上产品体验等,可大幅降低学习成本,AI.Modeler Lite用户只需一天培训即能熟练上手建模。针对具有专业建模能力的数据科学家,AI.Modeler提供专业版AI.Modeler Pro,在一键建模基础上,支持数据科学家对关键建模步骤尤其模型参数进行校对调整,并且模型训练完成后自动生成模型解释性报告及训练日志,记录模型配置、训练、迭代到生成的全过程,清晰反应模型特征,方便数据科学家及其团队决策。,AI.Modeler Pro用户经过三天培训即可创建模型进行业务应用。
AI.Modeler Pro 尤其适用于金融风控场景,能为金融用户快速建立风控模型。飞算云创核心团队在金融领域具有十年经验,掌握覆盖业务全流程、运营全体系的金融科技技术,具备对金融风控场景具备专业认知,因此AI.Modeler Pro在分类、回归等一般机器学习应用基础上,还内置了风控标准评分卡建模专属模组,可适用于金融风控、银行信贷、企业征信评估等应用场景。如在银行信贷中可对客户的申请信息、合同信息、人行征信、学历认证等数据进行充分挖掘,快速建立各种风控评分卡模型,如申请评分卡、行为评分卡和催收评分卡。

AI.Modeler 能为企业沉淀模型资产,提高模型复用率。针对传统模型开发过程中,模型文档编写费时费力、数据科学家优秀的建模能力无法复制以及模型交接低效等痛点,AI.Modeler提供一键应用功能,可将训练成功的模型以API的形式发布为线上服务,将企业现有模型集成到模型仓库形成模型资产共享,供其他用户在线调用进行预测,提高模型复用率。在模型预测环节,AI.Modeler还支持用户指定模型、指定多个待预测数据集,批量性地对数据集进行预测,压缩模型应用时间。

典型客户:

深圳京发科技控股有限公司、微米云服

3.9 知识图谱平台

市场定义:

知识图谱平台是支撑知识图谱构建与应用的平台,该平台融合认知计算、知识表示与推理、信息检索与抽取、自然语言处理与语义网、数据挖掘与机器学习等技术,提供知识抽取、知识表示、知识融合、知识推理、知识存储以及知识图谱应用等能力,帮助企业构建知识图谱并实现统一的知识图谱管理和应用。

甲方终端用户:

企业IT部门、各业务部门

甲方核心需求:

目前,数字化转型已进入数据驱动阶段,企业需要实现认知决策类业务场景的智能化,尤其是从大量非结构化数据中挖掘关联关系等数据价值,赋能业务应用。知识图谱提供了一种从海量非结构化数据中抽取结构化知识,并利用图分析进行关联关系挖掘的重要技术手段。核心需求包括:

高效实现知识构建,形成知识推理计算能力。非结构化数据存在数据量大、数据格式多样、结构不标准且复杂等问题,处理难度高,需要基于成熟的工具,利用数据治理、知识抽取、知识表示和知识融合等技术,实现知识构建。在知识构建基础上,企业还需要具备知识推理计算的能力,结合行业Know-How 计算知识中的显性与隐性关系和拓展属性,进一步挖掘隐含的知识。

丰富领域知识积累。对于一些复杂的业务场景而言,知识构建所涉及到的知识维度广、颗粒度细,其应用也更加复杂,这就需要多个业务方向的专家共同协作,时间成本较高。因此,企业需要在日常经营过程中重视各业务领域数据与知识的积累,提高知识建设的效率。

实现知识图谱应用场景落地。为通过知识图谱技术赋能具体业务应用实现价值,企业需要快速定位高价值应用场景,根据应用场景需求,结合业务专家知识进行知识图谱构建和最终应用价值的实现。典型场景包括银行的风控与营销、公安的刑侦与经侦、品牌商的门店运营与营销等。

厂商能力要求:

功能完整。厂商需要能够提供具备知识抽取、知识表示、知识融合、知识推理、知识存储以及知识图谱应用等完整能力的知识图谱平台,具备低门槛和易用性,以支撑知识图谱的构建和应用。

领域知识图谱积累。厂商需要在特定领域具有丰富的数据、模型与领域知识图谱积累,在此基础上针对特定业务场景为企业搭建专属领域知识图谱,完成知识赋能。

行业经验丰富。厂商需要具备在特定行业的知识图谱应用落地能力,尤其是医疗医药、能源、金融等行业。该能力需包括针对特定行业的业务场景和需求理解特定领域的预构建知识图谱、上层应用解决方案等,以及相关的客户服务案例。

入选标准:

符合知识图谱平台市场全部厂商能力要求;
2021Q2至2022Q1该市场付费客户数量≥5个
2021Q2至2022Q1该市场合同收入≥500万元

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

数库科技

厂商介绍:

数库科技成立于2009年,是一家引领产融数字化的数据科技公司,四次荣获KPMG中国Fintech 50企业。数库科技长期致力于在金融及产业领域提供基于产业逻辑的智能数据产品与系统服务,帮助金融机构、企业集团、政府部门解决业务场景中的数据和系统需求。

产品服务介绍:

数库科技基于知识图谱平台,为金融、政府等各领域客户提供产业数据、数据算法系统和场景化解决方案三类服务。在数据方面,数库科技提供多维精准的产业级、行业级和企业级知识图谱数据,可以满足各类机构对产业链应用上的各阶段需求;在系统方面,提供基于NLP、机器学习等技术的资讯标签化解析和结构化数据量产能力;在场景化应用方面,数库科技基于其强大的产业数据积累和算法能力,能够为金融行业的营销、投研、风控等业务场景,以及政府产研领域的产业规划、招商引资等业务需求提供成熟的知识图谱应用解决方案。

厂商评估:
 
数库科技以其规模庞大、高度细分的产业数据积累为核心,配合多种智能算法,在金融、政务等领域形成以业务逻辑为基础的成熟知识图谱和多样化的业务支撑能力,能以多种方式为客户提供易用、深度的知识图谱搭建和数据分析挖掘服务。

拥有大规模、高细分、多维度、可串联的产业数据网络,帮助用户全面掌握产业链信息。数库科技深耕产融大数据12年,以十二级产业分类体系,形成超过1000000个产业细分节点和超50万条上下游产业关系,涵盖A股、港股、美股、发债、新三板等近40000家公众公司和近6000万家工商企业的产业链、股东、高管、子公司、关联交易、对外投资、担保情况等核心关系数据。此外,数库知识图谱平台通过将企业经营情况、工商变更和股东信息等数据与产业图谱打通,结合数库科技成熟的算法模型,实现全领域的企业覆盖,并建立了高标准、结构化、可串联的数据体系。

具备强大的机器学习和NLP算法,能实现结构化数据量产和实时资讯精准解析。数库科技基于机器学习技术实现数据自动化量产,将数据标注、消歧、提取、清洗、质检、标准化等流程无缝衔接,能够高效实现自动化量产结构化数据。同时,数库科技具备实时资讯文本解析能力,结合数据生产引擎和NLP算法模型,能够精准高效提取文本信息当中的主体、事件及情绪等与产业和公司密切相关的标签,将人物、产品、行业、概念等高价值信息实时推送给各类使用方。

产品基于多年垂直场景逻辑框架沉淀,易用性强,帮助金融和政府等行业客户自动识别数据关系,构建知识体系。在金融领域,数库科技可支持对企业所属行业/类型/地区/资本市场/资质等的精准筛选,并展示企业画像关联图谱,同时也可以将用户方的投研框架、研究逻辑、风控模型等业务知识沉淀到知识图谱平台中,提升数据关系挖掘和知识沉淀的效率。
在政务领域,数库科技的区域产业招商数字平台可以为政府部门展示支柱产业、战略新兴产业、产业集群、龙头企业等统计数据,提供直观的可视化地图展示产业布局情况,政府部门可以利用该知识图谱平台了解地方产业链全貌、挖掘上下游供应链、赋能监管部门实现招商引资、增强区域产业协同效应,为产业发展决策提供依据推动产业发展等。

具备良好的数据准备能力和系统兼容性,产品部署便捷。数库科技对实时或离线大数据的数据调度、数据清洗、数据融合等任务都具备丰富的解决方案和实施经验,在对数据质量和安全性要求较高的金融机构中也可以完整的支持知识图谱平台的建设。此外,基于用户本地化部署的要求,数库知识图谱平台可以和金融机构内部的投研系统、资讯系统、风控系统等直接对接,实现良好的能力互补和系统集成体验。   

 
3.10 隐私计算平台

市场定义:

隐私计算平台是帮助企业用户在保护数据隐私的前提下,保障数据“可用不可见”、实现跨平台数据价值共享的软硬件平台。

甲方终端用户:

金融、政务、医疗、零售、电信、交通等各领域企业或机构的IT部门、大数据部门、科技创新部门

甲方核心需求:

数据应用场景的拓展,企业与外部机构之间的数据流通、价值共享愈发成为应对市场快速变化的重要手段。随着《数据安全法》及《个人信息保护法》相继颁布,国家对数据分享及利用的监管加强,企业在与外部机构进行数据流通过程中需要解决合规、安全问题。隐私计算技术能实现数据“可用不可见”,满足安全合规,成为企业进行跨机构数据价值共享的必要手段。在实践过程中,企业对隐私计算解决方案的需要主要体现在以下几个方面:

功能完善,提供全面数据安全解决方案。不同业务场景下企业能接受的安全假设前提不同,如风控、营销场景下,企业能接受可信第三方,采用联邦学习实现隐私计算;而在医疗多中心合作模式下,医院会面临串谋攻击、环境攻击、模型攻击等内部攻击,需要融合多方安全计算、同态加密以及可信执行环境共同满足数据安全要求。

满足安全、高精度、高性能等不同场景需求。为保障数据资产安全,以及为满足相关法律法律的要求,企业需要平台在数据安全保护、系统环境、计算流程的可解释性等方面满足较高的安全性要求。而在特殊场景如工业决策、人脸识别以及多中心全基因组分析等细分场景下,企业需要高精度、高性能的隐私计算解决方案来实现大规模数据量的传输、计算,以及保证计算准确性。

具备场景专业知识,提供建模及算法支持。金融、医疗等理论门槛较高,企业需要隐私计算厂商具备专业业务知识,能提供恰当的数据分析算法和模型,帮助企业实现产出。

提供丰富数据源。数据源也是企业实现数据协作过程中的一个主要痛点。数据质量将影响数据协作共享的价值产出,因此企业需要筛选、链接合适的数据源。企业希望厂商具有丰富的数据源网络,了解企业所在行业数据特点,能为企业提供数据链接建议并推动实现合作。

厂商能力要求:

厂商应具备完善的隐私计算解决方案,灵活满足精度、性能、安全等要求。厂商一方面需要具备联邦学习、多方安全计算、同态加密、可信执行环境等一种或多种隐私计算技术能力,能支撑联合建模、联合统计、隐私求交、匿踪查询等多种应用场景,并适应不同场景需求;另一方面厂商应具有底层隐私计算底座开发优化能力,通过提高模型计算效率优化、通信效率优化、网络带宽优化、权限控制以及引入第三方流量审计工具对数据用途进行验证等多种方式满足不同应用场景下对高精度、高性能、高安全的需求。

厂商应具备专业的隐私计算应用支持能力。随着隐私计算应用场景不同,厂商需要具备深厚的行业认知和洞察能力为企业实现隐私计算解决方案预期效果,如为泛金融行业企业提供建模支持、保证模型效果;为医疗行业设计专病特需的算法及应用。

厂商能提供第三方数据源链接。不同的行业需要厂商具备不同的数据源积累,如针对医疗行业,厂商需要具备卫健委、医院、医保局、医药公司等多方数据生态;针对金融行业,厂商需要具备运营商、支付、互联网、政务等数据源积累,厂商能根据用户业务场景提供合适的数据源链接意见,帮助企业快速提升模型效果。

入选标准:

  1. 符合隐私计算市场全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥5个
  3. 2021Q2至2022Q1该市场合同收入≥500万元。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

洞见科技

厂商介绍:

洞见科技是由中国最大的信用产业集团“中诚信”孵化、网信事业国家队“中电科”投资的领先的专精型隐私计算技术服务商,专注于为政务、金融、通信等行业客户提供隐私计算技术平台建设以及面向场景的数据智能服务。

产品服务介绍:

洞见科技的核心软件产品洞见数智联邦平台(InsightOne)是其自主研发的金融级隐私计算平台,拥有面向场景的“MPC+FL”融合引擎、可监管的分布式信任架构、全计算链路隐私安全保护、深入场景的专业化算法、无可信第三方联邦学习、区块链增信隐私计算等核心技术,提供匿踪查询、隐私求交、集合运算、联合统计与联合建模等功能。在InsightOne软件服务基础上,洞见科技还研发了融合计算、网络、存储等硬件资源的隐私计算高性能信创一体机产品InsightStation,满足客户自主可控、开箱即用的需求。基于其核心产品与技术能力,洞见科技通过“左加数据,右加场景”的模式,为客户提供全链路隐私保护数据智能服务。

厂商评估: 

洞见科技的隐私计算平台产品在安全部署、适用场景以及数据智能生态方面具有明显优势。此外,洞见科技还具备场景咨询能力,并持续打造跨平台互联互通能力,为客户提供深度隐私计算服务。

基于融合计算引擎和区块链技术,InsightOne为客户实现高安全部署。一方面InsightOne基于“MPC+FL”融合引擎架构支持无可信第三方联邦学习框架,解决多方联合建模中的第三方可信风险问题。另一方面,InsightOne中的区块链技术通过区块存储功能可对隐私计算过程记录、中间结果、数据贡献进行上链存储,实现数据可信;以及通过智能合约功能将隐私计算过程拆解为合约在链上执行,实现计算可信,消除客户对模型有效性、计算结果可信度、计算贡献度可靠等方面的顾虑,最终实现全局无损的数据智能。

具备密态数据智能的通用性和灵活性,为客户提供不同场景的数据全链路隐私安全保护。InsightOne产品矩阵平台提供了保护各方非交集信息的隐私安全求交(PSI)、保护交集信息并不泄漏特征的匿踪联邦学习(AFL)、保护模型涉及各方特征信息的多方安全计算(MPC)、保护查询条件信息的隐私安全检索(PIR)等功能,支持多种联合计算应用场景,灵活满足客户对功能、性能、安全、计算精度的不同需求,以密态数据智能为客户提供数据全链路隐私安全保护。

具备丰富的数据智能生态和建模经验,为客户提供专业场景咨询与运营服务。洞见科技基于数据链接资源的积累,一方面持续拓展银联、通信、征信、互联网等市场化数据资源基于隐私计算技术的合作模式;另一方面对接地方政府数据资源,基于隐私计算建立政务数据安全开放共享服务新模式。洞见科技核心团队具备专业的金融知识、丰富的服务经验和专精的技术积累,通过“隐私计算平台建设+业务场景建模服务”的一站式解决方案,链接数据生态侧和业务场景侧的双向资源,构建数据智能流通网络生态,提升营销、风控、精算、债指等具体应用场景的业务效果,赋能传统行业数字化转型与数智化升级。

洞见科技持续探索、打造跨平台互联互通能力,支持客户实现跨隐私计算平台合作。洞见科技首次实现“算法协议层”互联互通的实践经验,率先提出隐私计算平台互联互通的三个层次:应用层的管理系统互通、算法层的算法协议互通和原语层的计算原语互通,其中针对业界重视的算法协议互通,洞见科技支持白盒、灰盒与黑盒三种方式实现互通方式。在标准制定方面,洞见科技牵头了首个IEEE隐私计算互联互通国际标准,并积极主导和参与了信标委、信安标委、金标委、中国信通院、北京金融科技产业联盟等机构组织的互联互通标准制定工作;在应用实践方面,洞见科技率先与行业友商实现了业界首次多方异构隐私计算平台之间完全对等的算法协议互通,并积累了多个隐私计算平台互联互通标杆案例,如在国内首个大型股份制商业银行招商银行的牵头下,洞见科技与行业多家头部隐私计算厂商完成跨平台互联互通合作;与中国银联合作,赋能中国银联隐私计算平台互联互通方案设计验证与开发;以及为国家工信安全中心建设了国内首个基于隐私计算的数据要素流通生态底座。

典型客户:
招商银行、中国民生银行、北京银行、华夏银行、中国人寿

3.11城市大数据平台

市场定义:

城市大数据平台是指将海量城市大数据(包括政务大数据、产业大数据与社会公益大数据三类)进行收集、整合、存储与分析,并使用分布式存储、数据挖掘、实时动态可视化等大数据技术助力城市优化资源配置的数据平台。

甲方终端用户:

政府大数据管理部门、公安部门、工信部门等

甲方核心需求:

新型智慧城市的建设需要以数据共享与治理为基础,但在此过程中,存在各信息系统数据分散且孤立、数据治理与应用水平低等问题,严重阻碍了智慧城市的建设。因此,城市应该联通各系统底层数据,并进行统一管理与应用,为智慧城市建设提供坚实的数据基础。具体需求如下:

海量数据分散分布,需要实现数据互联互通。城市大数据来源丰富,分散于经济、社会各个领域和部门中,难以实现互通共享,导致多部门协同联动无法实现。因此,各城市应该对全量数据资源进行分级有效收集与整合,打破数据壁垒,大大提升数据使用效率。

数据来源与类型多样,需要加强统一标准化管理。由于各类城市数据类型丰富、数量庞大且增长速度极快,存在数据质量参差不齐、数据冗余、一数多源等问题,导致数据利用率大大降低。因此,各城市应该加强对多源异构数据的统一汇聚与统筹管理,提升数据使用的便捷性。

数据量激增,充分挖掘数据价值需求迫切。随着智慧城市建设的深入推进与物联网基础设施建设的不断完善,以交通、警务为代表的政府部门数据量巨大,城市数据量剧增,这对各城市对各类大数据的应用能力提出了更高要求。各城市应该以强化数据应用能力,深度挖掘数据价值,赋能疫情防控、洪涝预测、经济大脑等治理场景。

厂商能力要求:

为满足以上需求,厂商需要为各城市搭建能够实现数据联通、存储、管理与分析的城市大数据平台。具体能力如下:

实现数据共享与联通,搭建城市大数据底座。该平台需要能够打通各领域、各系统、各部门之间的数据,实现政府与企业全链路数据的双向对接,以提高数据使用效率,为产业协同与城市的精细化管理提供数据基础。

建立统一的标准,进行数据存储、分类与治理。一方面,该平台需要能够对来源不同、结构不同的各类城市数据进行标准化建模与分布式存储,保证数据的一致性、标准性与完整性;另一方面,该平台还需具备加工、分类与标签化数据的能力,实现对政务信息、资源信息等数据的统一管理与按权限开放。

以大数据为基础,多模型精准分析城市数据。该平台需要能够在交通、平安、医疗等场景下,运用聚类、回归等分析模型对相关数据进行分析、预测与评估,为税务稽查、金融监管、农业贸易、商务等场景提供支撑,提高政府部门所提供公共服务的质量与公安、交通等部门的管理效率,优化城市资源配置。同时,该平台还需能够将实时数据、数据分类与分析的结果进行实时可视化展示,以提升数据利用率。

入选标准:

符合城市大数据平台全部厂商能力要求;
2021Q2至2022Q1该市场付费客户数量≥5个
2021Q2至2022Q1该市场合同收入≥1000万元

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

中科闻歌

厂商介绍:

中科闻歌是中国科学院旗下企业,创立于2017年,定位于全球领先的数据与决策智能服务商,聚焦DI+AI+OR(数据智能+人工智能+运筹学)智能计算核心技术研发,面向数智安全、数智媒宣、数智城市、数智金税、数智商业五大领域,提供多语言、跨模态和深度认知智能的大数据与人工智能基础平台及解决方案,获中科院“弘光专项”、 国家科技创新2030“新一代人工智能”重大专项支持,被评为国家级专精特新小巨人企业。

产品服务介绍:

中科闻歌的城市大数据解决方案以天湖数据智算平台和闻海全球开源数据平台为核心技术底座。天湖数据智算平台是基于跨模态深度语义理解、社会计算与因果推理、决策推演的数据智能与决策智能技术平台。闻海全球开源数据平台融合了自主研发的跨模态AI分析、NLP深度语义计算、领域抽象建模技术,以及十余年的知识库积累,可针对不同客户需求提供基于标准产品模块的定制化数据智能服务。在天湖和闻海两大平台基础上,中科闻歌的城市大数据解决方案结合决策相关大数据技术、人工智能技术能力,实现了非结构化数据融合,构建了政务领域知识图谱,支撑政府提升社会态势感知、预警预测、科学决策和精准服务能力。

厂商评估: 

中科闻歌是中科院科技成果转化企业,团队在数据智能、人工智能、运筹学领域积累了十余年经验,经过了众多国家级项目的检验。中科闻歌数据积累和知识图谱沉淀、跨模态数据分析能力、人工智能技术研发创新能力,以及多个治理场景下积累的实践经验,能够帮助政府部门实现数据集成、数据价值挖掘和分析,为政务工作开展提质增效。

中科闻歌在政务领域具有丰富的数据和领域知识图谱积累,能够为相关部门资源统筹、工作协同提供决策支持。城市大数据解决方案融合百亿级的开源数据,打通各部门相关数据,并据此形成政务领域知识图谱,能够帮助政务部门提升社会态势感知,为相关部门实现科学决策提供支持。以防疫工作为例,中科闻歌能够根据病例接触程度的不同,对相应场所构建知识图谱,帮助防疫人员协同各部门防疫工作、统筹防疫物资,降低人工投入成本和时间成本,实现防疫流程高效运转。

中科闻歌具备跨模态数据分析能力,帮助相关部门实现数据价值充分挖掘。中科闻歌能够将非结构化数据的口径和标准统一,融合所有模态数据,构建统一数据、技术底座,形成数据技术一体化。中科闻歌能够根据不同场景下政务工作需求帮助有关部门构建起数据平台,对多模态数据进行分析,实现数据价值充分挖掘,为政务决策提供有效支持。

中科闻歌可为多个政务治理场景赋能,帮助各层次政务工作提质增效。中科闻歌城市大数据解决方案覆盖疫情防控、洪涝预测、经济大脑、税务稽查、金融监管等政府治理场景,未来还将拓展农业贸易、商务等场景,为相关部门高效精准服务提供平台和应用支持。以深圳龙华经济大脑项目为例,中科闻歌宏观上实现全区经济状况可视化,辅助经济工作统筹规划、协同开展;中观上对不同产业经济进行智能研判,为经济工作开展提供决策参考;微观上对企业诉求进行快速处理,为有关部门服务企业提供更方便快捷的途径。

中科闻歌具备卓越的人工智能技术研发创新能力,为业务开展和决策统筹提供技术保障。作为技术研发型企业,中科闻歌团队吸纳众多数据智能、人工智能、运筹科学领域的科研技术人才,以及产业经济、媒体、安全等领域的实践专家, 在国际顶级学术期刊和会议发表论文600余篇,申请发明专利近百项,研发和实现核心算法3000余个,具备深度挖掘大数据和人工智能技术的研究能力和创新能力。中科闻歌优秀的研发创新能力再结合政务领域的丰富经验,能够在政务工作各细分场景下为业务开展和决策统筹提供技术保障。

典型客户:
深圳市龙华区政务服务数据管理局、粤港澳大湾区大数据中心、上海浦东经济驾驶舱、山东潍坊市智慧潍坊建设办

3.12  智能营销

市场定义:

智能营销指在 “用户洞察-营销策略制定-用户触达与转化-效果评估” 的数字营销流程中,能够运用大数据挖掘、自然语言处理、知识图谱、机器学习等大数据与人工智能技术,通过对某类营销方式全过程或部分环节的智能化来提升营销质效,包括大数据用户洞察、舆情趋势洞察、精准投放、个性化推荐等智能营销场景。

甲方终端用户:

营销部门、运营部门、品牌部门

甲方核心需求:

对已初步搭建数字营销体系的企业而言,在用户洞察、营销策略制定、用户触达与转化、效果评估等环节仍存在痛点,需要借助更全面的数据源与先进的大数据技术更好地完成营销目标。具体需求包括:

外部数据缺失,需要合规采集与分析多维度用户数据。传统的用户洞察依托企业 CRM 或 CDP 已有会员数据,缺少合规的外部数据;用户画像和潜客预测等洞察场景很大程度上仍依赖人工经验,准确度不够高。随着数据智能技术的发展,企业希望能够合规使用人群特征偏好、行动轨迹、舆论趋势等各项数据,通过算法模型进行实时智能分析,生成更准确的洞察结论与可视化的数据展示,支撑策略制定优化。

市场洞察难度大,需要借助智能化手段进行全面分析。多样化的渠道和庞杂的市场信息给企业制定营销策略带来挑战,要了解市场全局、确保营销效果变得更困难。因此企业基于专业知识与经验去制定整体营销策略的同时,愈发强烈需要对全局市场环境形成系统性的分析方法,在客群趋势、竞品策略、市场反馈等方面获得及时准确的数据。

用户触达效率较低,智能化运营水平急需提高。随着营销精细化程度不断提高,企业需要提高用户触达与转化环节的自动化智能化水平,基于用户生命周期或基于用户分群构建丰富的营销模型,支撐拉新、促活、个性化推荐、首购、复购、交叉购买等场景,实现精准的千人千面营销,进一步提升各环节转化效果。同时,还需要充分利用长期的营销态势量化数据与各产品、活动的实时转化数据进行模型自动评估,并将量化、实时、全面的效果反馈快速应用于策路调整与优化,持续提升营销 ROl。

厂商能力要求:

厂商需要在活动营销、内容营销与整合营销等领域,提供不同的营销工具、服务和方法论,且应具备大数据挖掘、自然语言处理、知识图谱、算法模型等底层技术,对数字化营销全过程或部分环节的实现智能化升级,主要应提供以下能力:

大数据用户洞察能力。厂商应提供丰富合规的数据源以及 Al 分析模型,针对企业所需的线上线下营销场景,运用大数据与机器学习技术对客群人口属性、手机及 APP 偏好、兴趣关注、品牌关注、位置分布等维度,进行实时全面的用户洞察,为营销策划提供更敏捷可靠的数据支持。

市场环境洞察能力。厂商应具备营销业务理解和市场分析方法论,并能运用自然语言处理、知识图谱、数据挖掘等技术手段收集充分的市场信息,包括线下场景的区位、人流情况,以及线上场景的舆论趋势、媒体热点、渠道分布、KOL 详情等,代替传统的人工调研和数据分析,形成对营销态势的洞察。

智能化运营能力。厂商提供的 CDP、MA 等智能营销产品,需具备智能的标签体系、丰富的营销模型和效果监测功能。通过智能打标功能使用户标签更加丰富准确;通过个性化推荐、交叉推荐、复购预测、需求升级预测等营销模型实现精准投放,并提供细致的统计数据和指标,帮助企业提升用户运营的智能化水平。

入选标准:

符合智能营销市场全部厂商能力要求;
2021Q2至2022Q1该市场付费客户数量≥8个;
2021Q2至2022Q1该市场合同收入≥1000万元。

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

数说故事

厂商介绍:

数说故事成立于2015年,总部同时设立在广州及珠海横琴,在北京、上海、成都设有分支机构,员工800+人,60%+为大数据和AI研发团队,在“认知AI”领域占据领先地位。公司构建了从数据收集、处理、分析、建模到商业应用的全价值链解决方案,帮助10+行业的500+头部企业完成营销数字化转型。

产品服务介绍:

作为中国领先的一站式大数据及AI智能应用提供商, 数说故事构建了从数据收集、治理、分析、建模到商业应用的全价值链解决方案,基于多年的行业深耕,沉淀数说故事独有的方法论体系及宝贵实践经验,完整覆盖产品创新、品牌营销、内容营销、渠道销售、用户运营、风险预警、投资顾问等丰富的商业场景。数说故事服务日化美妆、食品饮料、连锁零售、3C互联网、汽车制造、广告营销等 10余个行业,致力于企业及政府实现业务变革和营收增长。

厂商评估: 

综合来看,基于多年来大数据技术沉淀和实践经验积累,数说故事的数据能力、算法能力、平台能力和生态构建能力在业内具备优势,可以满足企业产品创新、品牌营销、内容营销、渠道销售、用户运营、风险预警等商业应用需求。

优秀的数据采集能力,良好适配营销业务对数据的时效性、全面性需求。数说故事通过自有数据中心可搜集全网大部分的声量数据,覆盖社交平台、电商平台、视频平台、新闻媒体、论坛问答等多类型多平台数据,每日可采集数亿条数据,分钟级别的数据更新速度行业领先,良好适配当下企业对声量数据的时效性、全面性需求和对产品高度稳定性、兼容性要求。

成熟的算法平台有效降低数据训练和算法开发成本,提升企业产品分析能力。基于经年累月的算法能力积累,数说故事搭建了自助算法平台,平台具备的NLP及多模态大规模预训练模型,可大幅度降低企业训练数据和算法开发的研发成本、维护成本。经过全网数据采集以后,通过数说产品的智能文本处理技术,对数据内容进行语义理解和情感分析,构建商业常识和智能推理能力,进而可为企业提供商业知识图谱。同时,模型可辨别信息数据真实性,由此形成人群分析、时间分析、口碑分析,为企业提供专业的产品研究分析报告。

数据与业务深度结合的平台体系,推动企业营销业务迭代升级。数说故事可以运用扎实的数据整合及治理能力帮助企业实现业务数据化和数据业务化,以数据驱动企业营销业务迭代,形成数据与业务深度融合的平台体系。数说故事的数据平台产品体系完整覆盖从数据采集、处理、分析和建模所有环节,可实现短时间内快速完成营销产品研发或客户应用交付,为其商业应用生态建设打下良好基础。

开放的生态合作环境,为企业提供更完整的解决方案。数说故事将PaaS平台对生态合作伙伴进行开放,为上下游数字化厂商高效赋能。例如,在舆情场景下生态合作厂商可以利用数说已有的社媒数据库进行数据采集,在内容创作场景下,数说PaaS平台可帮助合作伙伴快速生成内容素材实现内容创作。合作厂商可依赖数说的开放平台大范围收集多维度多模态数据、快速构建互补性的场景产品,缩短厂商的产品建设研发周期,加速合作厂商为企业的服务效率。

典型客户:
伊利、腾讯、宝洁、华为、广汽等

3.13 安全大数据

市场定义:
安全大数据指利用大数据技术,在对全流量数据进行多维安全分析、风险事件分析、异常行为分析,深度识别、处理和防范网络安全风险的同时,优化传统网络安全、数据安全防控体系下的大数据架构,实现安全大数据的高效运营管理的综合性解决方案。

甲方终端用户:

企业IT部门、网络安全部门

甲方核心需求:

近年来,各行业网络安全监管收紧,网络安全法规频繁出台,而随着企业数据孤岛问题日益严重,以及外部入侵方式逐渐升级,仅通过传统访问权限、网络扫描等手段难以实现健全的网络安全管控。因此,企业需要利用大数据分析,提升对风险因素的感知、预测和防范能力,升级企业网络安全保障。具体而言,企业对安全大数据的需求主要有以下几点:

提升数据处理能力。网络安全分析所需数据有硬件设备数据、网络安全设备数据,以及系统日志、应用日志、运行和维护数据、外部攻击数据等,数据量大且存储较为分散,需要提升数据的集中处理能力,才能实现全面和及时的安全分析。

事前实现风险主动发现和预警。企业内外数据交互渠道不断丰富,交互频次不断提升,对网络中潜在恶意文件、恶意邮件等的防护也需要升级。在未发生风险时,需要通过过往经验及安全系统排查能力对潜在风险进行有效预防。

事后实现风险高效处理。企业数据系统复杂性不断提升,对于问题响应和处理即时性的要求也在不断提升,传统安全体系下,在安全问题发生后的日志和流量分析耗费时间较长,且风险追溯要通过逐一排查实现,风险处理和修复时间长。企业希望通过高效的分析和追溯,快速进行问题定位,实现精准打击。

在满足行业监管要求和业务场景需要前提下,形成集团统一的安全管控体系。不同行业网络安全和数据安全标准存在差异,业务场景不同也带来安全防控部署上的差异,且对于大型组织而言,集团、二级单位安全功能建设和部署不统一,安全等级不对称等问题较为严重,因此,企业需要建设同时满足上述条件要求的网络安全防控体系。

厂商能力要求:

具备海量多元数据处理和即时查询能力。首先,厂商要具备数据融合能力,通过多源数据分类、清洗、加工等多级处理,为安全分析提供精准可靠的数据源。其次,厂商产品需采用高可用的大数据架构,能够与企业原有大数据平台进行对接,满足国家法律规定半年以上的网络日志存储要求,实现大规模网络数据的全量采集和存储。最后,厂商产品应提供数据检索能力,通过大数据索引技术,帮助快速实现数据查询,辅助进行数据关联分析。

具备智能化的风险检测和评估能力。首先,厂商产品要能够对安全风险进行智能建模,基于历史数据行为和外部威胁情报,通过机器学习、统计学分析等多项技术,对安全行为进行场景化建模,通过攻击特征多维度分析预测、未知威胁识别等多种安全分析手段,帮助企业提前发现数据异常行为,实现风险预警。其次,厂商需要具备风险评估能力,通过对攻击行为的分析,评估该行为对网络系统的危害,辅助后期决策。

具备风险链路追踪和可视化交互能力。首先,厂商产品要具风险溯源能力,通过对风险事件逐层下钻,关联到原始日志和文件,高效定位风险源头。其次,厂商产品要具备可视化攻击链路分析能力,将分析结果以图谱等形式进行可视化呈现,清晰回溯攻击关系,方便运维人员更直观分析风险并进行针对性处理。

具备行业化、场景化安全体系建设经验和方法论,同时支持大型企业多级联安全体系搭建。首先,厂商需要熟悉不同行业网络安全标注和规范,在结合不同行业业务场景的情况下,为企业合理设计安全解决方案。其次,厂商需要根据企业组织架构和数据安全需要,搭建支撑大型企业多级级联、多分支机构的安全管理体系,考虑不同层级防御系统之间的协作,实现严密的联防联控。

入选标准:

  1. 符合安全大数据全部厂商能力要求;
  2. 2021Q2至2022Q1该市场付费客户数量≥5个
  3. 2021Q2至2022Q1该市场合同收入≥500万元 

代表厂商评估:

(注:以下代表厂商评估均按厂商简称首字音序排序)

图片

斗象科技

厂商介绍:

斗象科技创立于2014年,总部位于上海,是中国领先的网络安全数据智能与安全运营提供商,新一代网络安全领军企业。公司以斗象科技为集团中心,围绕斗象智能安全、漏洞盒子、FreeBuf三大生态打造新一代网络安全科技企业,综合运用安全数据智能、实战攻防、安全运营技术以及互联网化的白帽平台优势,持续提升公司核心竞争力,为企事业客户夯实网络安全底座。

产品服务介绍:

斗象科技旗下品牌包括安全数据智能与安全运营产品体系“斗象科技智能安全”,网络安全众测与安全运营服务平台“漏洞盒子”,网络安全行业门户“Freebuf”及“Freebuf咨询”。“斗象科技智能安全”以数据分析为基石,为企业提供安全数据智能与安全运营产品。安全数据智能与安全运营产品体系具备了全流量存储、秒级溯源、多维度安全分析与历史数据计算、综合风险管理与事件分析、资产智能识别与异常行为监测技术特性,完整覆盖事前演练、事中分析、事后追踪安全工作全流程,帮助企业构建安全运营体系,从而保障企业数据安全。

厂商评估: 

综合来看,基于多年的实践经验积累和海量安全知识沉淀,斗象科技的安全数据存储和分析能力、安全产品可扩展能力、安全攻防演练解决方案以及安全运营解决方案在业内具备优势。

优秀的数据存储、数据计算及安全分析能力,为防范威胁攻击奠定基础。斗象科技为企业提供的安全计算分析产品,可全量存储全流量数据、网络文件、PCAP、邮件等6个月以上。该产品可对数据实现流式处理,能够满足企业对数据实时分析和离线计算的需求,同时还支持PB级数据检索,对千亿规模的流量日志实现秒级查询。在安全分析层面,该产品能够实现规则特征分析、跨时间周期分析、调查溯源分析及影响面分析。斗象科技优秀的数据存储、数据计算及安全分析能力,为实现攻击预警、监测、分析、响应奠定坚实的基础。

高可用、可持续扩展的集群架构,能够支持千亿级别安全数据的计算、分析、比对。在企业业务活动流量激增情况下,斗象科技提供的安全大数据产品可根据业务需要无限横向扩展存储分析集群,支持千亿级别数据计算、分析、比对的能力,大幅提升了安全大数据产品的使用性能和可用性。

完善的攻防演练解决方案,帮助企业提升安全防御能力。斗象科技为企业提供的解决方案面向企业互联网、办公网的全攻击路径的预警、监测、分析、响应体系,能够发现主动攻击、跟踪被动威胁,建立事前预警和事后响应的协作机制,并有效监测办公网及员工安全行为,对绕过企业安全设备的潜在威胁、异常行为、违规行为进行分析和处理,能够帮助企业提升攻防对抗能力、应急响应能力、安全防御能力。

提供定制化、体系化的安全运营解决方案,满足企业个性化需求。斗象科技的安全大数据解决方案可站在企业战略角度,为企业安全部门提供一整套安全数据计算、安全运营与漏洞管理及安全监测产品矩阵。该解决方案能够对企业接收的流量、数据、邮件进行全面计算和分析,精准识别潜在威胁。并通过安全运营系统对漏洞进行自动化管理、对攻击者进行溯源反制,充分保障企业资产安全。不仅如此,斗象科技还可以根据企业自身安全能力和预期灵活调整产品架构,各产品之间自由组合,可完美适应当下企业对于安全问题的个性化需求。
斗象科技的安全大数据解决方案具有较高的易用性,能帮用户快速提升安全水位。斗象科技采用旁路布控方式,在不对其他部门的核心业务造成影响的前提下,完成安全设备的部署、安装和调试,降低安全大数据产品的使用难度,快速提升公司整体安全能力和水位。

典型客户:
中国银联、中国联通、中国外汇交易中心
 4.入选厂商列表

2022爱分析· 数据智能厂商全景报告_第7张图片

图片

2022爱分析· 数据智能厂商全景报告_第8张图片

你可能感兴趣的:(数据库)