图数据库原理虽然神秘莫测,但是其应用场景却日渐丰富多彩,应用效果直观明了。
人与人在线上和线下的联系,在汇集了海量的 “关系” 数据后,天然形成了一张图,能够支撑社区发现、舆论追踪、用户推荐等丰富的应用场景。
每个病人都会积累病情特征、电子病历、历史用药、药物成分、临床试验、保险情况等多维数据。利用这些结构化和非结构化的数据,就可以绘制以病人为中心的图数据,从而实现智能诊断,提高诊断效率和准确性。
在物联网时代,图模型通过构建人、位置、事件、物的关系图,实现智能交通、道路规划、平安城市、钓鱼网站识别等,惠及民生。
更进一步,某些犯罪是团伙作案,那么追踪团伙中某个人的行为轨迹,如乘坐的交通工具、所住酒店等信息,利用图数据库就可快速标识出整个团伙的特征。
同样利用图数据库即可查询企业股东及其关联人账户的多层行为,即穿透性管理,利用企业图谱搜集符合监管要求的关联账户,可以全面评估金融机构与企业的交易风险。
对于这些新型应用场景,传统的关系型数据库一般无能为力,或者性能表现不佳,让用户不得不舍弃。
相较于关系型数据库,图数据库在处理关联关系上性能提升上千倍,能够深挖关联关系,释放数据潜在的价值。
图数据库前景广阔,应用场景增多
5G、物联网、AI等技术的发展应用让数据呈指数倍增长,也为图数据库发展提供了更广阔的应用空间。
市场调研机构Reports and Data的最新预测表明,全球图数据库市场的规模2027年将达74亿美元,而在泛金融、IT、电信、生物医药、物流、电商零售、政府等领域的图数据库应用未来将蕴含逾千亿美元市场规模。
2019年,Gartner首次将图数据库列为 “2019 年十大数据和分析趋势” 之一。Gartner发布的2021年最新报告预测,随着对数据隐性关联实时洞察日益增长的需求,到2023年,全球30%的企业都将使用图技术来支撑其智能商业决策;到2024年,图存储和图分析将全面替代旧有的目录式数据资产管理,成为新的数据资产管理方案。
从Gartner的预测来看,未来几年,图数据库将是增速较快的数据库领域之一。
IDC最近发布的《IDC TechBrief:图数据库》则揭示了图数据库发展的基本情况。
从全球来看,图数据应用仍处于早期阶段,市场饱和度不足5%。且大多数用例是在银行、金融服务以及能源部门。
由于目前缺乏相关的图分析工具和人才,图数据库用户往往集中在能够自己独立建立的图分析的大型企业,通常服务于财务、营销和运营部门。
图数据库用例主要集中在欺诈检测、人际关系分析(执法部门)和预测分析(营销和商业计划)等。
IDC报告认为,从长远来看,中国领先的移动互联网环境、巨大的社会和市场规模,未来对图数据库的应用需求将远超其他国家。
一方面,随着数据经济的发展,在数据量增加的同时,市场上对处理海量、复杂、关联、多变的网状数据的需求不断增加,而传统的关系型数据库产品已经很难胜任这种海量复杂的分析需求。
在这类场景下,图数据库成为众多用户的首选工具,在发现和分析数据间关联关系方面,图数据库的性能远远高出传统的数据管理和分析手段。
其中,属性图可用于发现异常行为,如可疑数据访问、信用卡欺诈、身份盗窃和恶意程序;用于语义分析的图(知识图谱)通常可以摄取和描绘自然语言内容,用于查找关联文档或内容是否存在有意义的关系。
另一方面,图数据库适用的应用场景正在不断增多,在金融交易、征信、反欺诈、社交网络、智能营销、生物工程的使用需求大量涌现。
图数据库技术和市场蓬勃发展
2021年12月出炉的《“十四五” 软件和信息技术服务业发展规划》指出,软件作为信息技术关键载体和产业融合的关键纽带,将成为我国 “十四五” 时期抢抓新技术革命机遇的战略支点。
规划部署聚力攻坚基础软件,加速分布式数据库、混合事务分析处理数据库、共享内存数据库集群等产品研发和应用推广。
在数据库方面,规划专题要求突破全内存高速数据引擎、高可靠数据存储引擎、分布式数据处理与任务调度架构、大规模并行图数据处理等关键技术,推动高性能数据库在金融、 电信、能源等重点行业关键业务系统应用。
由此可见,“软件定义” 是新一轮科技革命和产业变革的新特征和新标志,已成为驱动未来发展的重要力量。加速分布式数据库、“大规模并行图数据处理” 等关键技术的研发与应用推广已被列为国家软件发展的重要战略目标。
资本是嗅觉最灵敏的,2021年国内外多家图数据库企业在获得了大笔融资,融资用于产品的技术研发和应用的市场推广,以便更好地为客户提供服务,用图数据库帮助客户赋能更多的业务场景,挖掘数据价值。
什么样的图数据库最受宠?
令人欣喜的是,目前我国图数据库领域展现良好的上升势头,出现了不少自主研发的图数据库与知识图谱平台,未来将是中国图数据库应用的主导力量。
从技术方向来看,分布式图数据库成为主流。作为国内领先的大数据基础软件供应商,星环科技向市场提供基于自主研发的分布式图数据库StellarDB,并得到了广泛的应用。
StellarDB在分布式扩展、分布式架构容灾方案等方面进行了创新设计,从多个方面确保图数据库储存、查询、分析、计算高性能运转,同时拥有可靠性高、可用性好、可扩展性好等优势。
从性能来看,拥有自主可控技术的图数据库性能表现更优异。作为一款为企业级图应用而打造的分布式图数据库,Transwarp StellarDB能够存储PB级大规模图数据,数量可以达到千亿节点万亿边,支持原生图存储。
在功能上,StellarDB可以提供高性能的图存储、计算、分析、查询和展示服务;具备10+层的深度链路分析能力,提供丰富的图分析算法和深度图算法;支持标准图查询语言并兼容openCypher,且具备高性能3D图展示能力。
从商用化程度来看上来看,自主研发的图数据库公司拥有更多的成功应用世界。StellarDB克服了海量关联图数据存储的难题,通过集群化存储和丰富算法,实现了传统数据库无法提供的低延时多层关系查询,已经用于金融、政府、交通等众多行业,用于反洗钱、风险控制、营销等多种场景。
星环科技是国内同时具备图数据库、知识图谱平台、图挖掘应用开发能力的企业,其全栈能力,可以助力金融机构快速构建知识图谱应用。
星环科技StellarDB作为一款自主研发多年的分布式图数据库,其产品能力已通过中国信息通信研究院《图数据库基础能力评测》测试,并拥有多项专利。在国产化适配方面,可兼容银河麒麟、中标麒麟等国产操作系统。
产品荣誉方面:曾获第二届浦发银行国际金融科技创新大赛金奖、2020服贸会科技创新服务示范案例、中国证券业协会2021年重点课题研究立项、作为增强数据分析代表入围Gartner《Hype Cycle for ICT in China, 2021》、入选Gartner《中国数据库市场指南》数据库领域代表厂商。
标准参编方面:星环科技产品研发团队参与编写了中国电子技术标准化研究院出版的《知识图谱标准化白皮书》、《知识图谱选型与实施指南》、IEEE-P2907课题《信息技术 人工智能 知识图谱技术框架》(国标计划号20192137-T-469),不断为行业标准制定建言献策。
近期,星环科技将正式发布StellarDB 4.0,增加更多新功能,性能将得到进一步提升,为用户带来更极致的性能体验,敬请关注。