图形数据库Neo4j入门

Neo4j是一个高性能的,NOSQL图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎，但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎，该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。

一、基本概念

1.1 什么是图数据库

图数据库名字的由来其实与其在底层的存储方式有关，Neo4j底层会以图的方式把用户定义的节点以及关系存储起来，通过这种方式，可是高效的实现从某个节点开始，通过节点与节点间关系，找出两个节点间的联系。

从这段描述中可以猜得到，在Neo4j中最重要的两个元素就是节点和关系。说到节点和关系，就必须引出一个非常重要的概念，属性图模型(Property Graph Model)。如下所示:

一个图中会记录节点和关系
关系可以用来关联两个节点
节点和关系都可以拥有自己的属性
可以赋予节点多个标签(类别)

接下来用一个实际的例子来解释下这个模型，最近在虎扑上被吹捧的特别厉害的恩比德大帝曾经爆出过他自己PS的一张图，隔空示爱蕾哈娜，参考下图

image

我们尝试用Property Graph Model来表示这样的一个关系。

image

上图中定义了两个节点，恩比德和蕾哈娜，类别分别是球员和歌手，分别拥有身高，国籍以及生日，血型属性。两个节点之间通过一个“喜欢”关系关联，“喜欢”关系拥有自己的一个属性“自从”，属性值为2014年。

1.2 Neo4j数据库的优势

在创建节点的时候就已经把关系给建立起来，避免了在复杂查询场景下的处理
由于底层直接以图的形式存储节点和关系，在查询的时候可以使时间复杂度保持在常数级别。
基于JVM实现
提供一套易于理解的查询语言Cypher以及内置的可视化UI
很好的支持ACID，有事务机制

1.3 Neo4j安装及实践

为了方便大家搭建环境，本文还是会用Docker来运行一个包含Neo4j的容器，Docker下载安装参考这里。在下文中会根据之前引用的恩比德大帝的例子来介绍Cypher语句。

从Docker Hub上pull一个Neo4j的镜像

docker pull neo4j

启动一个Neo4j的容器, 需要在你的Home目录下建立一个/neo4j/data文件夹

docker run --publish=7474:7474 --publish=7687:7687 --volume=$HOME/neo4j/data:/data neo4j

在浏览器中访问loalhost:7474可以看到如下的UI界面，输入默认用户名和密码neo4j即可连接到neo4j数据库。

创建一个球员节点恩比德

CREATE (embiid: PLAYER {name: 'Embiid', height: '2.13m', nationality: 'Cameroon'})

image

可以通过点击Neo4j左边的侧边栏中的PLAYER标签看到刚才新建的节点。

创建歌手蕾哈娜节点以及“喜欢”关系

MATCH (embiid:PLAYER{name:'Embiid'})
MERGE (embiid)-[:LIKES{since:'2014'}]->(Rihanna: SINGER{name:'Rihanna', dob:'1988/2/20',bloodType:'O'})

创建完以后UI如下图所示，图中可以看出新建的蕾哈娜节点和之前的恩比德节点通过LIKES关系关联了起来

查询返回所有喜欢蕾哈娜的PLAYER节点

MATCH(p:PLAYER)-[:LIKES]->(:SINGER{name:'Rihanna'})
RETURN p;

image

1.4 Neo4j常用使用场景

社交网络
基于图的搜索
推荐引擎
企业基础设施及网络架构
等等

1.5 neo4j存储节点

neo4j存储节点

1.5.1 标签(Label)

在Neo4j中，一个节点可以有一个以上的标签，从现实世界的角度去看，一个标签可以认为节点的某个类别，比如BOOK、MOVIE等等。

1.5.2 节点(Node)

节点是指一个实实在在的对象，这个对象可以有好多的标签，表示对象的种类，也可以有好多的属性，描述其特征，节点与节点之间还可以形成多个有方向（或者没有方向）的关系。

1.5.3 关系(Relationship)

用来描述节点与节点之间的关系，这也是图数据与与普通数据库最大的区别，正是因为有这些关系的存在，才可以描述那些我们普通行列数据库所很难表示的网状关系，比如我们复杂的人际关系网，所谓的六度理论，就可以很方便的用图数据库进行模拟，比如我们大脑神经元之间的连接方式，都是一张复杂的网。

有一点需要重点注意，关系可以拥有属性。

1.5.4 属性(Property)

描述节点的特性，采用的是Key-Value结构，可以随意设定来描述节点的特征。

二、查询语法(CQL)

序号	关键字	关键字作用
1	CREATE	创建
2	MATCH	匹配
3	RETURN	加载
4	WHERE	过滤检索条件
5	DELETE	删除节点和关系
6	REMOVE	删除节点和关系的属性
7	ORDER BY	排序
8	SET	添加或更新属性

1. 基本查找match return

neo4j使用的查询语法是Cypher语法与我们常用的SQL查询语法不一样，但是在初步的学习之后，觉得他们之间使用的思路有很多重叠的地方，整个语句的执行流程也和SQL有比较多相似的地方。

# 创建两个节点，一个子节点（Mask），一个父节点(Old_mask)，他们之间是属于父子关系
# 其中create表示新建
# p 表示这个节点的别名
# PERSON 表示节点p的标签PERSON的属性
# {} 大括号中间的键值对，表示p这个节点作为PERSON这个标签类别所拥有的属性
# -[r:SON_OF]-> 表示节点p指向节点f，他们之间的关系是SON_OF，这个关系的别名是r，r可以拥有属于自己的属性
# return 表示执行这段语句之后，需要返回的对象，return p,r,f 表示返回 节点p,节点f，以及他们之间的关系r
create(p:PERSON {name:"Mask",age:30,heigh:180,weight:80})-[r:SON_OF]->(f:PERSON {name:"OLD_Mask",age:55,heigh:160,weight:60}) return p,r,f

两个带有关系的节点

返回数据：

返回数据列表

2. 查找指定节点、指定属性、指定关系的节点、关系

# MATCH 匹配命令
# return 后面的别名p还可以利用as 设置指定的返回值名称，如 p as userName

match (p:PERSON {name:"Mask"})-[r]-(n) return p,r,n

命令执行结果：

查找结果

where关键字类似于SQL里面的where关键字，可以通过运算符== >= ...来过滤一些查询条件。

3. 对查找结果进行排序order by，并限制返回条数 limit

order by关键字与SQL里面是一样的操作，后面跟上需要根据排序的关键字，limit的操作是指定输出前几条

# 这里利用order by来指定返回按照Person.name来排序
# limit 表示只返回前3条数据
match(p:Person) return p order by p.name limit 3

查找结果：

返回排序后前3条结果

4. 删除节点delete命令

删除节点的操作也是通过dlete来操作，如果被删除的节点存在Relationship，那么单独删除该节点的操作会不成功，所以如果想删除一个已经存在关系的节点，需要同时将关系进行删除。

删除一个不存在Relationship节点，会报错：

删除一个存在relationship的节点不成功

删除一个节点记忆与他有关的关系，成功：

删除节点以及与它有关的关系

# 删除指定条件的节点
# 先通过匹配关键字match找到匹配元素，然后通过delete关键字指定删除
match(p:PERSON {name:"teacher_wange"}) delete p

# 删除节点和节点相关的关系
match (p:Person {name:"lisi"})-[r]-() delete p,r

5. 删除属性remove命令

remove命令是用来删除节点或者关系的属性

删除属性前的节点：

删除属性前的节点

删除birthday属性后的节点：

删除birthday属性后的节点

6. neo4j的字符串函数

upper,lower,substring,replac四种字符串的操作，其中upper与lower在将来的版本中会被修改为toupper/tolower

大写转换操作结果：

大小写转换

7. 聚合函数AGGREGATION

常用的聚合函数有COUNT、MAX、MIN、AVG、SUM等五种。

match(p:Person) return p.name as name,p.age as age,count(p) as count,max(p.age) as maxAge,min(p.age) as minAge,avg(p.age) as avgAge,sum(p.age) as sumAge

聚合函数操作结果：

聚合函数

8. 关系函数

序号	函数名	函数功能描述
1	STARTNODE	查找关系的起始点
2	ENDNODE	查找关系的终点
3	ID	查找关系的ID
4	TYPE	查找关系的类型，也就是我们在图表中看到的名称

# 先获取关系，然后通过关系函数来获取关系的id、type、起始节点、终止节点等等信息

match ()-[r:SON_OF]-() return startnode(r).name as start_node, endnode(r).name as end_node,id(r) as relationship_id ,type(r) as realtionship_type

关系查询结果：

关系查询结果

三、在Java中使用

3.1 原生的Neo4j Java API

Neo4j Java API的设计思路及基本概念：

Label接口，表示标签，实现这个接口的类，就可以当标签使用；
Relationship接口，别是关系，实现这个接口的类，就可以表示关系；
通过GraphDatabaseFactory这个类的实例化对象可以获取GraphDatabaseService实例；
GraphDatabaseService实例对象，可以获取一个操作事务，通过这个事务可以实现任何操作异常的回滚，操作成功需要调用tx.success()方法；
GraphDatabaseService 对象可以创建节点node;
节点node可以设置属性setProperty(key,value);
节点node可以创建关系Relationship,Relationship也可以通过setProperty(key,value)来设置属性；

枚举标签Label

package com.tp.ne4oj.java.examples;
import org.neo4j.graphdb.Label;
public enum Tutorials implements Label {
    JAVA,SCALA,SQL,NEO4J;
}

枚举关系Realationship

package com.tp.neo4j.java.examples;
import org.neo4j.graphdb.RelationshipType;
public enum TutorialRelationships implements RelationshipType{
    JVM_LANGIAGES,NON_JVM_LANGIAGES;
}

获取操作对象

GraphDatabaseFactory dbFactory = new GraphDatabaseFactory();
GraphDatabaseService db= dbFactory.newEmbeddedDatabase("C:/TPNeo4jDB");

启动neo4j数据库事务

try (Transaction tx = graphDb.beginTx()) {
    // Perform DB operations                
    tx.success();
}

整体代码

package com.tp.neo4j.java.examples;

import org.neo4j.graphdb.GraphDatabaseService;
import org.neo4j.graphdb.Node;
import org.neo4j.graphdb.Relationship;
import org.neo4j.graphdb.Transaction;
import org.neo4j.graphdb.factory.GraphDatabaseFactory;

public class Neo4jJavaAPIDBOperation {
public static void main(String[] args) {
    GraphDatabaseFactory dbFactory = new GraphDatabaseFactory();
    GraphDatabaseService db= dbFactory.newEmbeddedDatabase("C:/TPNeo4jDB");
    try (Transaction tx = db.beginTx()) {

        Node javaNode = db.createNode(Tutorials.JAVA);
        javaNode.setProperty("TutorialID", "JAVA001");
        javaNode.setProperty("Title", "Learn Java");
        javaNode.setProperty("NoOfChapters", "25");
        javaNode.setProperty("Status", "Completed");                

        Node scalaNode = db.createNode(Tutorials.SCALA);
        scalaNode.setProperty("TutorialID", "SCALA001");
        scalaNode.setProperty("Title", "Learn Scala");
        scalaNode.setProperty("NoOfChapters", "20");
        scalaNode.setProperty("Status", "Completed");

        Relationship relationship = javaNode.createRelationshipTo
        (scalaNode,TutorialRelationships.JVM_LANGIAGES);
        relationship.setProperty("Id","1234");
        relationship.setProperty("OOPS","YES");
        relationship.setProperty("FP","YES");

        tx.success();
    }
       System.out.println("Done successfully");
}
}

3.2 Cypher执行引擎，让Java执行原生CQL语句

package com.tp.neo4j.java.cql.examples;

import org.neo4j.cypher.javacompat.ExecutionEngine;
import org.neo4j.cypher.javacompat.ExecutionResult;
import org.neo4j.graphdb.GraphDatabaseService;
import org.neo4j.graphdb.factory.GraphDatabaseFactory;

public class JavaNeo4jCQLRetrivalTest {
   public static void main(String[] args) {
      // 1\. 获取graphDB
      GraphDatabaseFactory graphDbFactory = new GraphDatabaseFactory();
      GraphDatabaseService graphDb = graphDbFactory.newEmbeddedDatabase("C:/TPNeo4jDB");
      // 2\. 获取Cypher执行引擎
      ExecutionEngine execEngine = new ExecutionEngine(graphDb);
      ExecutionResult execResult = execEngine.execute("MATCH (java:JAVA) RETURN java");
      // 3\. 获取执行结果
      String results = execResult.dumpToString();
      System.out.println(results);
   }
}

3.3 Spring Data neo4j 的操作

操作思路：

创建一个与图数据库存储数据对应的实体类entity，并进行必要的注解;
dao层接口继承Spring data Neo4j类GraphRepository、GraphTemplate、CrudRepository、PaginationAndSortingRepository，这个和springDataJPA也比较类似;

基本导包操作，pom.xml



    4.0.0 
    com.tp.neo4j 
    springdata-neo4j 
    1.0   

   
         
          org.springframework.data 
          spring-data-neo4j 
          3.1.2.RELEASE 
      

      
          org.neo4j 
          neo4j-kernel 
          2.1.3 
        

      
          javax.transaction 
          jta 
          1.1 
      

      
         javax.validation
         validation-api
         1.0.0.GA

最后

neo4j与java的结合有很多的方式，据目前我所知道的就有原生api、driver方式、springData neo4j等三种方式。

图形数据库Neo4j入门

一、基本概念

1.1 什么是图数据库

1.2 Neo4j数据库的优势

1.3 Neo4j安装及实践

1.4 Neo4j常用使用场景

1.5 neo4j存储节点

1.5.1 标签(Label)

1.5.2 节点(Node)

1.5.3 关系(Relationship)

1.5.4 属性(Property)

二、查询语法(CQL)

1. 基本查找match return

2. 查找指定节点、指定属性、指定关系的节点、关系

3. 对查找结果进行排序order by，并限制返回条数 limit

4. 删除节点delete命令

5. 删除属性remove命令

6. neo4j的字符串函数

7. 聚合函数AGGREGATION

8. 关系函数

三、 在Java中使用

3.1 原生的Neo4j Java API

枚举标签Label

枚举关系Realationship

获取操作对象

启动neo4j数据库事务

整体代码

3.2 Cypher执行引擎，让Java执行原生CQL语句

3.3 Spring Data neo4j 的操作

基本导包操作，pom.xml

最后

你可能感兴趣的:(图形数据库Neo4j入门)

三、在Java中使用