Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下,而不是严格、静态的表中。但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。Neo4j因其嵌入式、高性能、轻量级等优势,越来越受到关注。
现实中很多数据都是用图来表达的,比如社交网络中人与人的关系、地图数据、或是基因信息等等。RDBMS并不适合表达这类数据,而且由于海量数据的存在,让其显得捉襟见肘。NoSQL数据库的兴起,很好地解决了海量数据的存放问题,图数据库也是NoSQL的一个分支,相比于NoSQL中的其他分支,它很适合用来原生表达图结构的数据。
通常来说,一个图数据库存储的结构就如同数据结构中的图,由顶点和边组成。
Neo4j是图数据库中一个主要代表,其开源,且用Java实现(需安装JDK)。经过几年的发展,已经可以用于生产环境。其有两种运行方式,一种是服务的方式,对外提供REST接口;另外一种是嵌入式模式,数据以文件的形式存放在本地,可以直接对本地文件进行操作。
Neo4j分三个版本:社区版(community)、高级版(advanced)和企业版(enterprise)。社区版是基础,本文主要对其作出介绍,它使用的是GPLv3协议,这意味着修改和使用其代码都需要开源,但是这是建立在软件分发的基础上,如果使用Neo4j作为服务提供,而不分发软件,则不需要开源。这实际上是GPL协议本身的缺陷。高级版和企业版建立在社区版的基础上,但多出一些高级特性。高级版包括一些高级监控特性,而企业版则包括在线备份、高可用集群以及高级监控特性。要注意它们使用了AGPLv3协议,也就是说,除非获得商业授权,否则无论以何种方式修改或者使用Neo4j,都需要开源。
安装好java 后,要下载 neo4j,下载地址:Windows 3.3.9 社区版、Linux 3.3.9 社区版。然后执行以下操作:
[root@hadoop100 ~]# tar -zxvf neo4j-community-3.3.9-unix.tar
[root@hadoop100 ~]# cd neo4j-community-3.3.9/
[root@node02 neo4j-community-3.3.9]# bin/neo4j start
Active database: graph.db
Directories in use:
home: /mnt/neo4j-community-3.3.9
config: /mnt/neo4j-community-3.3.9/conf
logs: /mnt/neo4j-community-3.3.9/logs
plugins: /mnt/neo4j-community-3.3.9/plugins
import: /mnt/neo4j-community-3.3.9/import
data: /mnt/neo4j-community-3.3.9/data
certificates: /mnt/neo4j-community-3.3.9/certificates
run: /mnt/neo4j-community-3.3.9/run
Starting Neo4j.
Started neo4j (pid 62239). It is available at http://localhost:7474/
There may be a short delay until the server is ready.
See /mnt/neo4j-community-3.3.9/logs/neo4j.log for current status.
解决:参考:https://www.pianshen.com/article/81132039512/
[root@hadoop100 neo4j-community-3.3.9]# vim conf/neo4j.conf
# 修改如下配置为:
dbms.connector.http.listen_address=0.0.0.0:7474
然后重启 neo4j,执行命令 bin/neo4j restart
,但紧接着遇到如下问题:
解决:参考官网:https://neo4j.com/developer/kb/explanation-of-error-websocket-connection-failure/
[root@hadoop100 neo4j-community-3.3.9]# vim conf/neo4j.conf
# 修改如下配置为:
dbms.connector.bolt.listen_address=0.0.0.0:7687
# 然后重启neo4j,执行命令 bin/neo4j restart
来自:Neo4j 安装、使用教程
CREATE (n:Person {name:'John'}) RETURN n
CREATE 是创建操作,Person 是标签,代表节点的类型。花括号 {}
代表节点的属性,属性类似 Python 的字典。这条语句的含义就是创建一个标签为 Person 的节点,该节点具有一个 name 属性,属性值是 John。
CREATE (n:Person {name:'Sally'}) RETURN n;
CREATE (n:Person {name:'Steve'}) RETURN n;
CREATE (n:Person {name:'Mike'}) RETURN n;
CREATE (n:Person {name:'Liz'}) RETURN n;
CREATE (n:Person {name:'Shawn'}) RETURN n;
CREATE (n:Location {city:'Miami', state:'FL'});
CREATE (n:Location {city:'Boston', state:'MA'});
CREATE (n:Location {city:'Lynn', state:'MA'});
CREATE (n:Location {city:'Portland', state:'ME'});
CREATE (n:Location {city:'San Francisco', state:'CA'});
如图所示,共有6个人物节点、5个地区节点,Neo4j 贴心地使用不同的颜色来表示不同类型的节点。
MATCH (a:Person {name:'Liz'}),
(b:Person {name:'Mike'})
MERGE (a)-[:FRIENDS]->(b)
这里的方括号 []
即为关系,FRIENDS 为关系的类型。注意这里的箭头 -->
是有方向的,表示是从 a 到 b 的关系。 如图,Liz 和 Mike 之间建立了 FRIENDS 关系,通过 Neo4j 的可视化很明显的可以看出:
MATCH (a:Person {name:'Shawn'}),
(b:Person {name:'Sally'})
MERGE (a)-[:FRIENDS {since:2001}]->(b)
在关系中,同样的使用花括号 {}
来增加关系的属性,也是类似 Python 的字典,这里给 FRIENDS 关系增加了 since 属性,属性值为 2001,表示他们建立朋友关系的时间。
MATCH (a:Person {name:'Shawn'}), (b:Person {name:'John'}) MERGE (a)-[:FRIENDS {since:2012}]->(b);
MATCH (a:Person {name:'Mike'}), (b:Person {name:'Shawn'}) MERGE (a)-[:FRIENDS {since:2006}]->(b);
MATCH (a:Person {name:'Sally'}), (b:Person {name:'Steve'}) MERGE (a)-[:FRIENDS {since:2006}]->(b);
MATCH (a:Person {name:'Liz'}), (b:Person {name:'John'}) MERGE (a)-[:MARRIED {since:1998}]->(b);
MATCH (a:Person {name:'John'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1978}]->(b)
MATCH (a:Person {name:'Liz'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1981}]->(b);
MATCH (a:Person {name:'Mike'}), (b:Location {city:'San Francisco'}) MERGE (a)-[:BORN_IN {year:1960}]->(b);
MATCH (a:Person {name:'Shawn'}), (b:Location {city:'Miami'}) MERGE (a)-[:BORN_IN {year:1960}]->(b);
MATCH (a:Person {name:'Steve'}), (b:Location {city:'Lynn'}) MERGE (a)-[:BORN_IN {year:1970}]->(b);
# 我们查询下所有在Boston出生的人物
MATCH (a:Person)-[:BORN_IN]->(b:Location {city:'Boston'}) RETURN a,b
MATCH (a)-->() RETURN a
# 注意:这里箭头的方向,返回结果不含任何地区节点,因为地区并没有指向其他节点(只是被指向)
MATCH (a)--() RETURN a
MATCH (a)-[r]->() RETURN a.name, type(r)
MATCH (n)-[:MARRIED]-() RETURN n
MATCH n=allshortestPaths((a:Person {name:'Liz'})-[*]->(b:Person {name:'Steve'})) return n
CREATE (a:Person {name:'Todd'})-[r:FRIENDS]->(b:Person {name:'Carlos'})
MATCH (a:Person {name:'Mike'})-[r1:FRIENDS]-()-[r2:FRIENDS]-(friend_of_a_friend) RETURN friend_of_a_friend.name AS fofName
match (n:Person) where n.name=~'S.*' return n
MATCH (a:Person {name:'Liz'}) SET a.age=34;
MATCH (a:Person {name:'Shawn'}) SET a.age=32;
MATCH (a:Person {name:'John'}) SET a.age=44;
MATCH (a:Person {name:'Mike'}) SET a.age=25;
# 这里SET表示修改操作
MATCH (a:Person {name:'Mike'}) SET a.test='test'
MATCH (a:Person {name:'Mike'}) REMOVE a.test
# 删除属性操作主要通过 REMOVE
MATCH (a:Location {city:'Portland'}) DELETE a
# 除节点操作是 DELETE
MATCH (a:Person {name:'Todd'})-[rel]-(b:Person) DELETE a,b,rel
MATCH (n) DETACH DELETE n
# 这里,MATCH 是匹配操作,而小括号() 代表一个节点node(可理解为括号类似一个圆形),括号里面的n为标识符。
MATCH (r)
WHERE id(r) = 501
RETURN r
MATCH (r)
WHERE id(r) = 501
DELETE r
RETURN r
# 这个样例只删除该节点,要想删和这个节点与其他节点的关系,请看下个例子
MATCH (r)
WHERE id(r) = 501
DETACH DELETE r
RETURN r
match (a:RH) where ((a)-->(:RH) and not (:RH)-->(a)) return a
在安装目录的 import 目录中放入你想要导入的文件。
这里导入两个CSV,一个是人物名称,一个为人物关系。
vim import/test1.csv
孙悟空
猪八戒
唐僧
沙和尚
金角大王
银角大王
vim import/test2.csv
孙悟空,唐僧,徒弟
孙悟空,猪八戒,师兄
猪八戒,唐僧,徒弟
沙和尚,唐僧,徒弟
孙悟空,沙和尚,师兄
金角大王,银角大王,哥哥
孙悟空,金角大王,敌人
执行导入命令:
LOAD CSV FROM "file:///test1.csv" as line
CREATE (p:xiyouperson{name:line[0]})
LOAD CSV FROM "file:///test2.csv" as line
CREATE (p:xiyourelation{name:line[0],to:line[1],relation:line[2]})
match (n:xiyouperson),(m:xiyourelation),(s:xiyouperson)
where n.name=m.name and s.name=m.to
create (n)-[:关系{relation:m.relation}]->(s)
return n.name,m.relation,s.name
我们有时候在生成较大的图谱时,会产生大量的节点以及与之关联的关系,可能会遇到 由于初始节点显示设置, 并非所有返回节点都被显示. 仅显示 300 个节点中的 300 个 的问题。解决的话修改如下设置
原参数为300,100,1000,上述为自行设置,此时再执行 MATCH (n) RETURN n LIMIT 10000
一条一条的执行语句很费事,想一下执行多条语句,结果报错
原来需要打开该设置才可以
在页面输入框里执行::style node.Person {diameter: 300px}
MATCH (a:Person {name:'Liz'}),
(b:Person {name:'Mike'})
MERGE (a)-[:`a.FR and = b.IENDS`]->(b)
# 关系属性中包含特殊字符
MATCH (a:Person {name:'Liz'}),
(b:Person {name:'Mike'})
MERGE (a)-[:FRIENDS {join: “a.FR and = b.IENDS”}]->(b)