图 | 图结构 | 图数据 | 图算法
图计算 | 图学习 | 图神经网络
随着图、图结构、图数据、图算法、图计算、图学习、图神经网络等信息技术的快速发展,各行业数字化水平的逐步提高,企业业务环境和计算场景日益复杂,数据间的关联关系也正在变得更加交错。在面对需要深度挖掘数据间复杂关联关系的场景时,传统的关系型数据往往计算效率低下,难以满足应用需求。
本文通过科研端文献研究、产业调研与专家访谈等方式,将从技术、人才、科研与产业四个维度展开分析,阐明行业发展背景、追溯技术发展历程、拆解技术原理及优势、勾勒行业格局,并研判图计算未来发展趋势。
图计算技术特点
一、图计算技术特点
1、高效地对具有复杂关联关系的数据进行深度计算
图提供了一种能够代表现实世界中绝大多数事物关联关系的独特的结构。与经典的表格或者矩阵不同,图上的节点和边并没有被赋予过多的权重,每个元素都依赖于其他元素并形成一种互联互通的关系,而这种关系是所有基于图的假设和预测的核心。在大数据计算中,通过分析图数据之间的关联性,能够高效地从噪声很多的海量数据中抽取有用的信息。
图计算系统基于顶点和边的方式存储图数据和计算,能够建构任意复杂的网络和模型并存储大量的信息,进而完整且形象地映射分析人员想要研究的问题域。经典的表格结构的数据都能够用图数据来表示,但不是所有的图数据都能够用数组或表格的形式来表示。
2、在对简单事物关系的数据进行计算时,列表型的数据尚且能够展现出高效的性能
一旦模型复杂度提升例如金融领域中的交易数据,传统的列表数据模型的劣势将显现无疑。倘若在传统的关系型数据模式下进行分析和计算,复杂的业务场景将带来冗余的表之间的关联操作和频繁的数据通信,造成成千上万倍计算量的提升,系统性能大打折扣,极大降低了计算的效率。但是,在面对高度结构化的数据时,图计算的处理能力将不及基于传统数据模型的计算,这是由于在进行图计算的过程中存在着随机访问的问题。
二、数据库演进方向:关系型数据库向非关系型发展
数据间关联趋于复杂、数据量剧增,对于图数据存储计算的需求随之增长。随着通信技术和大数据的快速发展、业务环境和计算场景趋于多样,企业的数据需求正在发生变化,除了数据量剧增之外,数据之间的关联关系也变得更加复杂交错。虽然传统的关系型数据库已经较为成熟,但在需要进行复杂关联查询的情况下,关系型数据库需要多表关联查询,计算效率低下甚至难以完成。而图数据库的基础数据结构由顶点、边组成,能更自然、准确、直观地表述数据间的关联关系,从而提高计算效果,在社交网络、知识图谱等领域得以大展身手。
三、图数据库发展历程:过往十年关注热度持续攀升
过去 40 年,以 Oracle、 SQL为代表的关系型数据库几乎垄断了全球数据库市场。随着关系型数据库在数据关联分析方面的乏力表现逐渐凸显。在业务场景的驱动下,越来越多的企业对图计算能力的需求快速增长,以增强自身商业决策能力。另一方面,自 2007 年第一款商用图数据库 Neo4j 发布以来,在学术界和产业界的共同努力下,图数据库的可扩展性、易用性等各方面能力逐渐补齐,产品成熟度逐渐提高。目前行业内已有传统数据库、公有云厂商和初创企业等进入。
各类数据库近十年来热度变化
四、图计算系统发展历程:从通用大数据计算系统到专用图计算系统
早期专门针对大型图计算的系统出现之前,业内主要通过单机图算法库或通用大数据计算系统实现。其中,Google 推出的大规模数据并行处理计算模型 MapReduce,以及加利福尼亚大学伯克利分校(UC Berkeley)AMP Lab 开发的 Spark 系统,对图计算系统发展起到了重要推进作用。但由于磁盘存储局限性等问题,通用型大数据计算系统在性能、易用性等方面都未能尽如人意。
图计算领域研究侧追究
一、研究侧追究
1、图计算领域研究侧追踪:近十年 ,热度与发表论文数量双涨
300 年前欧拉开辟了图论研究的范畴,50年前图数据库在计算机诞生之后也随即问世,进入大数据时代,数据量的指数膨胀不仅带来了大量的数据分析需求,使得图计算在面对复杂关联数据时的优势逐渐凸显;同时海量的数据也给予了深度计算发展所需的养分,图计算作为深入挖掘数据信息的有力工具,其研究进入了快速发展期。
从 2003 年到 2021 年,图计算领域论文发表数量呈现明显的上升趋势 ,尤其在 2014、2015年至2021年期间,研究论文发表数量翻倍增长达到高峰。究其本质,移动互联网和金融科技等大数据驱动型行业,以及人工智能相关技术、知识图谱和图神经网络的研究在该时间段内蓬勃发展,极大地拉动了图计算研究热度。另一方面 ,底层硬件的不断升级和图计算引擎的成熟化、公开化也为图计算的研究搭建了完善的基础设施。
图计算相关主题论文发表数量
从上图可以看出,2012 年是研究热度和发表论文数量的阶段性分水岭。近十年,以上述关键词为研究主题的论文发表数量,呈明显增长趋势,相关领域当年论文发表数量均在2020 年、2021 年达到最高峰。
2、图计算领域研究论文地域分布 :中美领衔 ,欧洲国家紧跟其后
根据 Web of Science 数据 ,近 20 年来图计算相关话题领域的论文发表主要来自于中国和美国,德国、法国等欧洲国家和印度紧随其后。在美国,以卡耐基梅隆大学 、加州大学伯克利分校以及麻省理工学院为首的计算机科学顶尖高校贡献了绝大多数图计算领域的论文发表。
在中国,清华大学、北京大学、中国科学院以及华中科技大学是图计算领域研究的先驱,贡献了中国绝大多数的高被引用图计算论文。
欧美国家在计算机科学(图计算相关领域)的研究积淀较多,积累了较为领先的学术界实力与丰富的产业界应用 。在图计算研究早期,Google 等大型互联网公司在核心业务中对于图数据分析的采用以及各类大数据分析框架的开源为图计算的发展起到了不小的推动作用。中国图计算研究的高峰起源于大数据趋势的铺展,科技型企业依据业务分析需求,逐步深耕图计算应用。与此同时中国的顶尖高校在图计算的底层理论研究上也颇有建树。
图计算相关主题论文发表数量按国家分布
二、图计算领域全球一流研究机构分布
国外涉及大学:
加拿大:University of Waterloo;新加坡:National University of Singapore、Nanyang Technological University;澳大利亚:University of New South Wales;美国:Microsoft、Facebook、University of California、University of Illinois at Urbana Google、IBM、Carnegie Mellon University University of Washington Teradata Aster
、Cornell University、Stanford University
国内涉及大学:
清华大学计算机系、哈尔滨工业大学计算机学院、北京大学王选计算机研究所、北京邮电大学计算机学院、中国科学技术大学计算机科学与技术学院、复旦大学大数据学院、华中科技大学计算机系、上海交通大学软件学院、电子科技大学、计算机科学与工程学院、香港大学计算机科学系、香港科技大学计算机科学与工程系、香港中文大学计算机科学与工程系
三、图计算领域全球一流研究人才分布
图计算的快速发展离不开研究学者们的努力和贡献。不仅在基础理论层面研究深耕,也在产业化实践方面不断更迭创新,助力图计算在大数据的沃土里生根发芽,蓬勃生长 。
陈文光
清华大学计算机系教授,国家自然科学基金杰出青年基金获得者。现任蚂蚁集团图计算技术负责人及技术研究院院长。2014年提出并实现了一种单机图处理引擎GridGraph。2016 年初,进一步成功研制了名为“Gemini ”的分布式图计算系统,其在典型大数据分析应用 (如PageRank) 上的性能是国际同类图计算系统的十倍以上 2021年,领导蚂蚁集团与清华大学共同研发大规模图计算系统 GeaGraph (蚂蚁集团 TuGraph前身) ,并获得2021世界互联网领先科技成果发布。
邹磊
中国RDF图领域的先驱研究者。北京大学王选计算机所教授,国家自然科学基金优秀青年基金项目获得者。研究领域包括图数据库,RDF知识图谱,尤其是基于图的 RDF 数据管理和自然语言问答研究。主持研发了面向知识图谱数据的图数据库系统gStore和知识图谱问答平台gAnswer。2014 年所主持的项目“海量图结构数据存储和查询优化理论研究”,获得中国计算机学会自然科学二等奖。2017 年所主持的项目“大规模图结构数据管理”获得教育部自然科学二等奖。
石川
北京邮电大学计算机学院教授、博士研究生导师,北京邮电大学图数据挖掘与机器学习实验室的创办人。主要研究方向为基于图机构数据的数据挖掘、机器学习、人工智能和大数据分析。近年来,为异质图神经网络领域的研究贡献了重要的力量。
张宇
华中科技大学计算机科学与技术学院副教授,主要研究方向是大数据处理的体系结构 和系统软件、图计算。研制了高能效软硬协同图计算引擎,性能功耗比在第18届Green Graph 500 排名中全球第一 ,单机性能在第 23 届和第 24 届 Graph 500 排名中全球第一。
金海
华中科技大学、计算机科学与技术学院教授、博士生研究导师。主要研究方向计算机体系结构 、计算系统虚拟化、 集群计算和云计算等。
郑卫国
复旦大学数据科学学院副教授。主要研究方向大规模图数据管理和挖掘、自然语言处理 ,特别是知识图谱、自然语言问答等相关算法的设计与应用。
陈海波
上海交通大学软件学院教授、华为操作系统首席科学家、操作系统内核实验室主任、SOSP首位中国学者主席。主要研究方向系统软件,系统结构与系统虚拟化。
代亚非
北京大学信息科学技术学院教授。主要研究方向分布式系统研究。
陈红阳
之江实验室图计算研究中心高级研究专家。主要研究方向大数据智能,智能网络与系统,机器学习理论与应用,无线通信与网络,LTE-A/ 5G通信技术标准化,无线定位与跟踪技术,智慧城市,统计信号处理。
图计算领域部分代表研究学者
四、图计算研究趋势
1、图神经网络
近年来,人们对深度学习方法在图数据上的应用越来越感兴趣,图神经网络也因此诞生并逐渐成为研究人员关注的热点。图神经网络是指使用神经网络来学习图结构数据,提取和发掘图结构数据中的特征和模式,满足聚类、分类、预测、分割等图学习任务需求的算法总称。图数据 正在变得越来越普遍、其蕴含的信息越来越丰富。图神经网络也被广泛应用于推荐系统、社交网络、计算机视觉和生物医学发现等领域中。
2、图数据查询语言及图数据库测试基准的标准化制定
关系型数据库的发展离不开 SQL 查询语言的标准化 。目前Neo4j 、TigerGraph 、蚂蚁集团在内的多家图计算企业都参与了标准的联合制定。ISO GQL 的制定将为今后商业应用开发提供一整套标准化的、高表现力的国际通用查询语言,大量数据库用户和开发人员将从中受益。
关键产品及行业发展现状
一、政策背景 :高性能计算及图数据处理技术受国家政策鼓励和支持
多个国家均已将高性能计算技术提升到国家战略高度 。
美国基于对计算科学发展趋势及新一轮信息技术 (IT) 革命到来的认识 ,于 2015 年颁布了著名的“国家战略计算计划”(NSCI) ,指明了在未来一段内时间围绕高性能计算技术与产业发展的战略目标、任务、方向及发展路径,同时构建了组织架构、明确了各方面的责任分工。欧盟将先进计算列为战略重点 ,定制“地平线计划”。
韩国制定了到 2030 年的高性能计算中长期发展战略《 国家超高性能计算创新战略》,旨在将韩国打造成为高性能计算强国,实现第四次工业革命时代的量子跳跃。
日本也在国家层面将先进计算纳入扶持,并展开统一研发部署。
中国通过《 国家中长期科学和技术发展规划纲要 ( 2006-2020 年) 》、“九五”至“十三五”国家科技发展及科技创新规划 、国家高技术研究发展计划 (“863”计划) 、国家重点基础研究发展计划 (“973”计划) 、国家自然科学基金重大研究计划、国家“科技创新 2030-重大项目”等一系列重大战略规划与政策,有力地支持了高性能计算技术与产业的发展。2021年11月,工信部发布《“十四 五”软件和信息技术服务业发展规划》,在“关键基础软件补短板”专栏中,指出在数据库领域,应关注大规模并行图数据处理等数据库关键技术的突破。
全球高性能计算扶持政策
二、图计算产业链
图计算产业链
上游:基础设施主要包括硬件设施、操作系统等,对于非原生图存储图数据库,还需接入其他类型数据库。
中游:目前,图计算行业内主要有两类参与者—— 图数据库和图计算系统 ( 图计算引擎) 。
下游:应用开发商负责在图数据库和图计算系统的查询分析能力基础上,为用户开发定制化应用,例如针对具体行业 (如金融等) 的知识图谱应用开发商:软件集成商负责集成应用并提供运维等服务。
图数据库与图计算系统对比
三、图计算生态参与者:数量众多,巨头和初创企业各施所长
目前,图计算行业内主要有图数据库和图计算系统 ( 图计算引擎) 两类参与者 。实际应用中,图数据库和图计算引擎的能力呈现融合趋势,图数据库企业正在将 OLAP 能力与 OLTP 能力结合,向 HTAP 混合型数据库方向发展。此外,部分巨头厂商将图数据库与图计算系统结合,提供涵盖图数据存储、查询、分析等功能的一站式平台。
图计算行业部分参与者
目前行业参与者中,既有阿里、腾讯、蚂蚁、字跳、AWS、微软等公有云、软件、数据库等领域的巨头,也有 Neo4j、TigerGraph、创邻科技、欧若数网等国内外创业企业。巨头与创业企业呈现竞争与合作并存的关系。一方面,二者在项目竞标中常同台竞争;另一方面,由于巨头产品线众多,且仍以服务内部业务需求为主,在项目实施等方面能力不足,因此也需要与创业企业合作补足能力。
四、图计算领域专利概述:以中美科技公司及高校为主
根据公开专利数据,以图数据库、图计算为核心技术主题的专利当前申请人,以美国和中国科技公司为主,它们共同的业务特性是拥有海量复杂数据,以及需要处理它们之间的交互关系。
graph computing 领域专利主要所有者的部分代表专利
五、图数据库 :图数据的高效存储与查询
图数据库是以点、边为基础存储单元,以高效存储、查询图数据为设计原理的数据管理系统。对图数据结构进行创建、读取、更新和删除 ( CRUD) 操作,是图计算技术的核心。与传统关系型数据库相比,近年来图数据库在各类数据库之中受到越来越多的关注。
图数据库是图计算行业的重要参与者。海外图数据库初创企业众多,其中部分已被收购整合;中国市场以互联网大厂和垂直初创企业为主,也有不少应用层企业和传统数据库厂商参与如:阿里集团、腾讯云、阿里云、百度安全、华为云、字节跳动等。
图数据库行业部分参与者
六、商业化现状:尚处于初期阶段,未来广阔空间尚待挖掘
目前,受制于整体市场对图计算技术的认知仍未成熟,图计算行业仍处于商业化初期阶段。一方面,客户对图数据库及图计算技术认知不足,在如何理解图能带来的价值、如何进行图数据库选型、如何做好二次开发和持续运维等问题上,依然困难重重。另一方面,图计算厂商对客户的业务场景不够了解,对于如何帮助客户明确需求,将客户业务场景存在的痛点转化为图的问题,如何在技术角度进一步提升产品力以更好满足客户需求,如何将图技术应用到更广的领域等问题,未来依然有很大潜在发展空间。
目前行业内主要以项目制形式销售,标准化产品较少,单个项目金额以十万到百万量级为主,个别项目能接近千万量级。图数据库厂商主要与应用开发商合作为客户提供服务;视实际客户和项目需求,也存在直接对接客户,或者与软件集成商、图计算系统合作等情况。
图计算企业按商业模式可分为开源和闭源。根据 DB-Engines 流行度数据,目前图数据库领域开源产品占 61.5%,闭源产品占 38.5%。开源即软件源代码按许可协议公开,开发者可在原始代码的基础上修改、使用;闭源即传统模式售卖的商用软件。目前不少项目方选择 OpenCore 的模式,即核心模块开源、进阶版功能收费的模式展开商业化;另外也有部分厂商出于对开源生态不成熟、现有产品竞争激烈等原因考虑,选择闭源策略。2022年世界人工智能大会上,蚂蚁集团大规模图计算系统中的图数据库 TuGraph宣布正式开源。
开源与闭源策略对比
七、主要应用场景
金融
过往金融机构主要通过对企业或个人等个体本身的特征进行分析以发现风险,而图计算技术可以帮助挖掘个体之间的关联关系,进一步发现潜在风险,在信贷风险评估、反洗钱、反欺诈、资金追踪、潜客发现等场景中,能帮助挖掘出企业间循环担保、薅羊毛灰黑产等重大风险。
社交
社交网络天然具备图数据结构。随着社交数据量级迅速增长,为了更好地展示并发挥社交数据作用,图计算技术也参与进来。在社交网络数据可以通过社区发现等图算法,更加深入地挖掘个体之间的联系,进行用户关系查询、潜在黑客发现、社区挖掘、根据爱好推荐好友等操作。
能源
过去电网设备规模庞大且关联关系复杂,用关系数据库管理存在模型复杂、存储冗余、检索效率低等问题。图计算技术可以帮助更高效、实时地管理电力设备并监控其运行状态,及时解决问题,同时可在潮流计算等领域提供帮助,更加合理地分配电力去向。
搜索引擎
图计算中的PageRank算法常被应用于搜索引擎领域。PageRank算法又称网页排名算法,是一种基于 “一个节点访问次数或概率越高,则重要程度更高”的假设,根据网页(节点)之间相互链接情况执行随机游走模型,计算网页(节点)的相关性和重要性以进行排名的技术,在谷歌搜索的网页排名中有重要作用。
八、典型企业案例
1、蚂蚁集团-金融风控行业案例
借助图数据对主体间复杂关系以及对多种主体时序行为特征的强刻画能力,蚂蚁集团将图技术应用于自身金融风控业务之中,以应对日益复杂的风险形势,提高对于隐形的、有组织的团伙化犯罪风险的识别和挖掘能力。但是,由于风控场景本身存在强对抗、低延时的特性,对于图数据计算的时效性提出了挑战。
蚂蚁安全团队在图技术基础上建设了全图风控架构,作为应对复杂风险形势的下一代风控基础设施,也是蚂蚁智能风控技术体系“IMAGE”的组成部分。全图风控即全域一张图,在整个风控的生命周期,包括风险感知、风险识别、风险管控、风险审理、风险分析等环节中提供保障,提供团伙挖掘、资金链路识别、交易可信识别等核心服务能力。此外,除了用传统的多度查询来进行风险链路判断外,还引入模式识别的方式(菱形/三角型等)、社区发现的算法等来应对更加复杂的场景。
同时,在丰富的数据来源和计算方式基础上,蚂蚁对在图计算的时效性上也进行了优化,TuGraph 大规模图计算平台为蚂蚁集团提供了业界领先的实时和时序大规模图分析能力。在反洗钱领域,图计算已覆盖支付宝的全部资金交易,对疑似团伙类犯罪风险识别能力提高近 10 倍,风险审理分析效率提升 90%。
蚂蚁集团风控领域的图计算应用
2、创邻科技 Galaxybase
创邻科技主要产品 Galaxybase 是一款国产高性能分布式图数据库,采用原生图存储,100%自主研发 ,已入选2022信创数据库排行榜。目前,创邻客户覆盖金融、能源、互联网等行业,标杆客户包括农行、交行、国家电网、腾讯等,在信用卡反欺诈、IoT 数据管理、微服务治理等场景下,帮助客户防控风险、提高管理效率。同时,创邻科技是腾讯云启创新生态合作伙伴的一员,与腾讯联合研发了腾讯云图数据库TGDB。
此外,创邻科技也通过与高校合作等方式,在大规模图数据计算性能方面展开研究。2022 年 5 月,创邻科技联合中山大学团队,依托国家超级计算广州中心环境,完成了 Galaxybase 的安装部署,并实现5万亿点边规模交易数据智能挖掘性能测试,打破了世界最大规模图处理记录。
3、Neo4j
Neo4j 是第一款商用图数据库,对后续图数据库发展起到了重要作用。Neo4j 采用原生设计的图存储和属性图的数据模型,并首次提出了针对属性图的描述性查询语言Cypher,后开放为 OpenCypher。
Neo4j 最初为完全开源产品,通过发展开发者社区知名度逐渐提升。2018 年 Neo4j 宣布从 Neo4j V3.5 版本开始,企业版将仅在商业许可下提供,开源策略从完全开源转向 OpenCore,即核心功能开源、企业版功能闭源。
九、图计算技术发展趋势
1、查询计算一体化
图数据库技术演进方向为查询速度更快、承载数据量更多、查询层级更深。目前图数据库以提供实时查询功能为主,对于复杂离线计算仍需和图计算引擎配合,增加了额外数据 ETL 的处理过程。随着企业业务发展、对实时交易分析需求增加,未来图数据库将与图计算引擎功能融合,结合 OLTP 与 OLAP 能力,即 HTAP 混合型数据库。HTAP 数据库基于新的计算存储框架,能同时支持 OLTP 和 OLAP场景,在一份数据上保证事务处理的同时,支持实时分析,为客户提供查询计算一体化能力。
蓝海大脑图数据一体机具有精简的高可用集群架构。软硬一体,高度集成。开箱即用。优于目前的集中式存储架构X3,高于集中式存储架构X5。专业的运维平台,深度监控管理一体机系统。分布式存储,高可靠性,全架构冗余设计,避免任意单点故障,以及跨节点数据保护等,更好地为各行各业服务。
2、图与机器学习结合
近年图神经网络在人工智能领域掀起了研究热潮,目前部分图平台除常规图计算算法外,也开始支持机器学习算法。图数据与机器学习结合,有助于解决过往机器学习算法存在的可解释性低下等问题,是人工智能符号主义和连接主义的一种结合。但目前,图机器学习仍存在内存、硬件等方面的瓶颈,尤其对于大规模的图深度学习,仍面临着一些挑战。
3、高性能图计算
随着图算法日渐复杂,图数据库及图计算对算力层的需求也随之提升。未来通过软硬件结合的方式,将高性能计算研究与图相结合,更好地提升计算效率。目前已有一些高校和企业正在这一领域积极合作开展研究。2021 年 3 月,中国工程院院士郑纬民教授带领清华大学计算机科学与技术团队,联合海致科技,宣布筹备启动高性能图计算院士专家工作站。2022 年 6 月,华中科技大学图计算团队研发的图计算机DepGraph 打破了图计算性能世界记录。
总结与展望
一、总结
作为一种理解世界的新方式,图正凭借其对复杂关联关系的强刻画能力,赢得了越来越多的关注,图数据库逐渐成为全球数据库领域竞相布局的新兴方向,图计算系统也随着图数据规模不断扩大和下游应用需求变化,逐步向前发展。中国图计算领域不仅行业入局者越来越多,也逐渐从学术界走入产业界,踏上商业化道路。应用市场正在持续探索新的场景,当前图计算在金融风控、社交网络等领域已有大规模应用;未来随着数据量级增长,数据关联关系愈加复杂,图数据作为关系最直接自然的表达将获得越来越广泛的应用。
与关系型数据库等成熟市场相比,目前中国图计算行业还处于发展初期,商业化任重而道远。未来图计算产业的发展,一方面行业生态仍需要进一步完善,拓展更多的应用场景,提高客户对图及相关技术的认知水平和接受程度,促进学术界的科研成果顺利转化为工业级产品;另一方面学术界也需要积极推动高水平的技术创新,站在技术前沿指引未来发展思路和方向,产学研联动打造优秀的图计算产品和解决方案,创建完善的图计算行业体系。
二、展望
1、图计算技术向着多(大规模)、快(低延时)、好(高可靠)、省(低成本) 的方向探索
随着云计算、大数据、物联网和人工智能等信息技术的快速发展,数据量级增长迅速,对大规模图数据的处理需求愈加迫切。在复杂业务场景下,企业对大规模图数据的查询和计算对系统的计算性能、可扩展性、可靠性等各方面提出了挑战。对此,学术界和产业界的研究者在图计算部署架构、计算模型等方面进行了大量的研究。
2、图学习作为图技术与机器学习技术的结合,体现了人工智能符号主义与连接主义两大流派的融合应用
作为图计算的一类重要应用,知识图谱属于人工智能行业符号主义流派的代表作之一,与以机器学习为代表的连接主义,共同形成人工智能两大重要流派。近年来机器学习领域的深度学习、神经网络模型等发展迅速,在计算机视觉、自然语言处理等领域大展身手,实现了继上世纪的专家系统之后人工智能行业的又一次市场爆发。同时,传统机器学习固有的可解释性低下、缺乏非欧空间数据结构处理能力等问题仍尚待解决。
3、图技术有望拓展应用至更多的行业领域,产业生态亟待进一步完善
目前图计算技术的应用集中在金融、社交网络、电力能源等数据量大且具备复杂关系的领域。随着各行业数字化水平的进一步提高,数据关联日益复杂,以及大规模图计算技术的进一步成熟,未来在供应链、政务公安、公共卫生等其他行业,或者与低代码工具、BI 商业智能等应用工具结合,或将发掘出更多市场空间。
4、提高客户采购决策者对图计算技术的认知水平
帮助大量已经习惯以关系型数据模式理解业务的一线人员顺利理解图数据并开展业务应用,同时培养出更多优秀的图数据库及图计算系统的开发、运维人员,以在底层能力基础上建立起完整的工具和应用生态,对行业来说依然是不小的挑战。图计算在市场教育方面仍任重道远。