新冠病毒可视化——图数据库能做什么

 图可视化直观、智能地展现数据之间的结构和关联

能看到从前在表格或者图表中看不到的内容

“一图胜千言”

——《新程序员》编辑部

随着大数据时代的到来,传统的关系型数据库由于其在数据建模和存储方面的限制,变得越来越难以满足大量频繁变化的需求。关系型数据库,尽管其名称中有“关系”这个词,却并不擅长处理复杂关系的查询和分析。另外,关系型数据库也缺乏在多服务器之上进行水平扩展的能力。基于此,一类非关系型数据库,统称“NoSQL”存储应运而生,并且很快得到广泛研究和应用。

NoSQL(Not Only SQL,非关系型数据库)是一类范围广泛、类型多样的数据持久化解决方案。它们不遵循关系型数据库模型,也不使用SQL作为查询语言。其数据存储不需要固定的表格模式,也经常会避免使用SQL的JOIN操作,一般都有水平可扩展的特征。

新冠病毒可视化——图数据库能做什么_第1张图片2021数据库全景图,《新程序员》新数据库时代

图数据库与关系型数据库的比较

图数据库(Graph Database)是指以图表示、存储和查询数据的一类数据库。这里的“图”,与图片、图形、图表等没有关系,而是基于数学领域的“图论”概念,通常用来描述某些事物之间的某种特定关系。比如在我们的日常生活中:

社交网络是图。每个社交网络的参与者是节点,我们在社交网络中的交互,例如“加好友”“点赞”就是连接节点的边。

城市交通是图。每个路口、门牌号、公交站点等都是节点,街道或者公交线路是边,将可以到达的地方连接起来。

知识也是图。每个名称、概念、人物、事件等都是节点,而类属关系、分类关系、因果关系等是边,将节点连接起来,形成庞大、丰富并且随时在演变的知识图谱。

“图无处不在”(Graphs are everywhere),也正因如此,传统关系型数据库不擅长处理关系的问题,能够被图数据库很好地解决,图数据库正是为解决这一问题而生。

关于新冠病毒的知识图谱

新冠病毒肆虐全球,来自Neo4j图数据库社区的一群成员,集成了多个异构生物医学和环境数据集,建立了关于新冠病毒的知识图谱

https://github.com/covid-19-net/covid-19-community

以帮助研究人员分析宿主、病原体、环境和病毒之间的相互作用。

新冠病毒可视化——图数据库能做什么_第2张图片

关于新冠病毒的知识图谱

  • 该知识图谱的部分可视化结果,图中最左边的部分是病毒暴发的地理位置子图,包含国家、地区、城市;

  • 中间绿色的部分是流行病学子图,包括有关病毒株、病原体和宿主生物的信息,病例和菌株分别与报告和发现它们的位置相关联;

  • 右边紫色的部分是生物学子图,代表生物体、基因组、染色体、变异体等。

 图数据库未来大放异彩

在金融领域,图和图分析帮助机构更高效地发现异常的关联交易,以赢得反洗钱战争。在电力、电信行业,图数据库帮助管理复杂庞大的设备和线路网络,并及时为故障分析根源、估算影响。

在制造、科研、医药等领域,图数据库广泛用于存储和查询知识图谱,成为大数据管理、数据分析和价值挖掘乃至人工智能技术领域的重要支撑。

新冠病毒可视化——图数据库能做什么_第3张图片

数据库技术发展趋势(截至2021年6月)来源:DB-Engines

在可预见的未来内,图数据库与人工智能技术的结合应用将会带来更多创新和飞跃。图数据库至少能在以下四个领域帮助提升AI能力。

第一,是知识图谱,它为决策支持提供领域相关知识/上下文,并且帮助确保答案适合于该特定情况。

第二,图提供更高的处理效率,因此借助图来优化模型并加速学习过程,可以有效地增强机器学习的效率。

第三,基于数据关系的特征提取分析可以识别数据中最具预测性的元素。基于数据中发现的强特征所建立的预测模型拥有更高的准确性。

第四,图提供了一种保证AI决策透明度的方法,这使得通过AI得到的结论更加具有可解释性。AI和机器学习具有很大的应用潜力,而图解锁了这种潜力。这是因为图数据库技术支持领域相关知识和关联数据,使AI变得更广泛适用。

就总体趋势而言,我们能够预见,大数据时代,数据缺失不再是最大的挑战,我们渴求的是挖掘数据价值的能力,而数据的价值很大一部分在于数据之间的关联。图数据库和图分析作为处理关联数据最有效的技术和方法,一定会继续大放异彩,书写数据库应用的新篇章。

新冠病毒可视化——图数据库能做什么_第4张图片

 《新程序员》本期数据库文章作者,感谢俞老师的分享

新冠病毒可视化——图数据库能做什么_第5张图片新冠病毒可视化——图数据库能做什么_第6张图片新冠病毒可视化——图数据库能做什么_第7张图片

《新程序员》杂志内页 

 欢迎更多的作者和读者加入《新程序员》

联系邀约合作大宗采购请联系yuzhong125

你可能感兴趣的:(新程序员,新数据库时代,新程序员,数据库)