本文假设用户已有RDBMS及标准SQL的基础知识。
本文不对OrientDB的下载、安装、使用作说明。具体可参考:http://orientdb.com/getting-started/
主要内容
1、什么是图数据库
2、图数据库的适用场景
3、为什么要使用图数据库
4、OrientDB的特性
5、OrientDB的数据模型
6、OrientDB的一些基本概念
7、OrientDB的查询
1、什么是图数据库
图:一些节点和关联这些节点的联系的集合。
NoSql(Not Only Sql)数据库分为四大类:
key/value 例如: Redis
column-oriented 例如: Hbase
document 例如: MongoDB
graph 例如: Neo4j,OrientDB
图数据库是NoSql数据库的一种。
2、图数据库的适用场景
世界上的大部分领域实际上都可以建模成图。
Gartner定义了商业世界的5个图:
社交 、
意向 、
消费 、
兴趣 、
移动。
3、为什么要使用图数据库?
性能
灵活性
图天生是可扩展的。
新增加节点与边对现有的模型,SQL,应用程序等没有任何影响。
敏捷性
可以与敏捷开发或者测试驱动开发模式保持一致。
我们知道现在的大型软件开发,业务模型不可能在开发初期就完美地确定下来。随着需求的变化,业务模型在后期可能会与当初设计大相径庭,而图数据库则拥抱变化。
4、OrientDB的特性
OrientDB是用JAVA语言实现的,运行在JVM之上。
Multi-Model:OrientDB支持多种模型:Key/Value, Object, Document, and Graph。
Multi-Master Replication: OrientDB集群部署时每个点都是Master,每个Master上都有完整的数据。一旦一个Master上的数据发生变更,会将发生变更的数据同步通知其它Master。
Extended SQL : OrientDB支持大部分标准的SQL,同时在标准的SQL之上扩展了部分功能以方便图的操作。
Easy Integration :使用teleporter可以很容易地将数据从RDBMS迁移到OrientDB上。
OOP:OrientDB定义数据结构的Class符合OOP(Object-oriented programming)的理念,支持继承和多态的特性。
Document-Graph:如下图API的依赖关系。
5、OrientDB的数据模型
OrientDB支持多种模型: Key/Value, Object, Document, and Graph 。
Key/Value
Object
Document
Graph
6、OrientDB的一些基本概念
Classes : 类比关系型数据库系统中的Table与传统文档数据库的collections。这个概念来自于OOP(Object-oriented programming)的理念。class用于定义数据结构的模型。
Record:record是OrientDB中最小的加载和存储的单位。record有四种类型:Document、RecordBytes(BLOB)、Vertex、Edge。
Document:是OrientDB中最灵活的record。Document支持schema-less,schemal-full,schema-mixed,即可以在定义数据结构的时候指定属性及约定条件,也可以不指定。它通过create class语法来定义一个数据结构。
Vertex:在OrientDB的graph模型下,每个结点叫作Vertex,每个Vertex也是一个Document。
Edge:在OrientDB的graph模型下,连接两个Vertex的边叫作Edge。Edge是有向性的而且仅能连接两个Vertex。
Clusters : 用于存储record。每个数据库最多有32767个cluster。每个class都必须至少有一个对应的cluster。默认情况下OrientDB会自动为每个class创建与当前cpu核数相同的cluster,其中有一个默认的cluster。
Cluster Selection:当新增加一条reocrd时OrientDB会根据cluster section为这条记录选择一个cluster。cluster section有四条类型:
detault、round-robin、balanced、local。
Record ID :每个record都有一个record id。 record id的格式如下:
#
Relationships: OrientDB中不使用join,它通过在每个reocrd中定义一个关系类型的属性来维护关系。这个关系属性存储的实际是record id,就像定义一个指针在内存中将两个record联系起来。
Inheritance & Polymorphic: OrientDB支持面向对象的继承和多态特性。
7、OrientDB的SQL
在写图数据库的SQL时,第一步是要确认起始点(这个也是图数据库比较耗时的地方),一旦起始点确认后,我们便可以近乎物理连接的方式查询这个起始点相关联的数据。
基本的SQL:OrientDB支持大部分标准的SQL查询。
例如:SELECT FROM Person WHERE name LIKE 'Luk%'
Traverse:traverse语法可以遍历获取一个record联结的reocrd。它比select使用起来更简单和快速。
例如:RAVERSE out("Friend") FROM #10:1234 WHILE $depth <= 3
Match:match是一种表述力很强的查询语法结构,类比Neo4j的Cypher语法结构。它以一种说明式的方式来查询。
例如:
MATCH {class: Person, as: person, where: (name = 'John' AND surname = 'Doe')}.both('Friend').both('Friend'){as: friendOfFriend} RETURN person, friendOfFriend
本文转自微信公众号 “GraphDB"