由于最近项目需要使用
Neo4j
数据库但是鉴于并没有相对来说较为完善的使用教程,本人在哔哩哔哩学习相关课程后将其整理以供学习,课程链接附于文末。
随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,传统数据库很难处理关系运算。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长, 急需一种支持海量复杂数据关系运算的数据库,图数据库应运而生。在各个领域都具有重要的作用。图数据库是基于图论实现的一种**NoSQL**
数据库,其数据存储结构和数据查询方式都是以图论为基础的,图数据库主要用于存储更多的连接数据。
图论〔Graph Theory〕是数学的一个分支。它以图为研究对象图论中的图是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物, 用连接两点的线表示相应两个事物间具有这种关系。
例如我们使用圆圈来表示某个应用程序中的个人资料(家庭圈和朋友圈)
类似于上述的具有多种连接关系的复杂关系圈,这些应用程序包含大量的结构化,半结构化和非结构化的连接数据。 在 RDBMS
数据库中表示这种非结构化连接数据并不容易。如果我们在RDBMS
数据库中存储这种更多连接的数据,那么检索或遍历是非常困难和缓慢的。所以要表示或存储这种多连接的数据,我们应该选择一个流行的图数据库。
图数据库非常容易地存储这种更多连接的数据。 它将每个配置文件数据作为节点存储在内部,它与相邻节点连接的节点,它们通过关系相互连接。他们存储这种连接的数据与上面的图表中的相同,这样检索或遍历是非常容易和更快的。
其在概念上与传统的RDBMS
的对应关系如表所示:
**关系型数据库(RDBMS) ** | 图数据库 |
---|---|
表 | 图 |
行 | 节点 |
列和数据 | 属性和数据 |
约束 | 关系 |
如下图所示,:Persion
和:Department
都是节点的标签,:BELONGS_TO
则是节点和节点之间的关系,而Alice P0815 A42 4FUTURE
则是节点的属性,其中节点的标签和节点的属性共同组成了一个节点的要素,节点之间通过关系形成图,这就是图数据库的形成概念。
Neo4j
是一个开源的NoSQL
图形数据库,2003 年开始开发,使用 Scala
和Java
语言,2007年开始发布,其具备的基本信息如下:
和其他的数据库一样Neo4j
也具备很多通用的特性:
SQL
就像简单的查询语言Neo4j CQL
Apache Lucence
支持索引UNIQUE
约束CQL
命令的UI:Neo4j
数据浏览器ACID
(原子性,一致性,隔离性和持久性)规则GPE
(图形处理引擎)JSON
和XLS
格式REST API
可以被任何编程语言(如Java
,Scala
、Python
等)访问UI MVC
框架(如Node JS
)访问的Java
脚本Java API
:Cypher API
和Native Java API
来开发Java应用程序Neo4j
数据库的常见使用场景和相对的优势:
Neo4j CQL
查询语言易于学习前文已经提到了Neo4j
的图论基础,因此该部分主要介绍其属性图模型,该模型的一般规则为:
在属性图数据模型中,关系应该是定向的。如果我们尝试创建没有方向的关系,那么它将抛出一个错误消息。在Neo4j
中,关系也应该是有方向性的。如果我们尝试创建没有方向的关系,那么Neo4j
会抛出一个错误消息“关系应该是方向性的”。
Neo4j
图数据库将其所有数据存储在节点和关系中,我们不需要任何额外的RDBMS
数据库或NoSQL
数据库来存储Neo4j
数据库数据,它以图的形式存储数据。Neo4j
使用本机GPE
(图形处理引擎)来使用它的本机图存储格式。
图数据库数据模型的主要构建块是:节点、关系和属性
**Neo4j**
数据模型的主要构建块是:节点、关系属性、标签和数据浏览器
Node
是图数据库中的一个基本元素,用来表示一个实体记录,就像关系数据库中的一条记录一样。在Neo4j
中节点可以包含多个属性Property
和多个标签Label
。节点是主要的数据元素;节点通过关系连接到其他节点;节点可以具有一个或多个属性(即,存储为键/值对的属性);节点有一个或多个标签,用于描述其在图表中的作用。Relationship
同样是图数据库的基本元素。当数据库中已经存在节点后,需要将节点连接起来构成图。关系就是用来连接两个节点,关系也称为图论的边Edge
,其始端和末端都必须是节点,关系不能指向空也不能从空发起。关系和节点一样可以包含多个属性,但关系只能有一个类型Type
。关系连接两个节点;关系是方向性的;节点可以有多个甚至递归的关系 ;关系可以有一个或多个属性(即存储为键/值对的属性)。基于方向性,关系一般被分为单向关系和双向关系。Label
将一个公共名称与一组节点或关系相关联, 节点或关系可以包含一个或多个标签。 我们可以为现有节点或关系创建新标签, 我们可以从现有节点或关系中删除标签。标签用于将节点分组;一个节点可以具有多个标签;对标签进行索引以加速在图中查找节点;本机标签索引针对速度进行了优化。Neo4j
就可以通过指定的端口访问其数据浏览器Neo4j
的安装方式一般来说有四种即:
本文主要介绍的是通过第二种方式来安装Neo4j
因为相对而言较为简单且免费。
下载地址:https://neo4j.com/download-center/
在下载对应的版本之前需要特别注意的问题是:首先需要确保本计算机中拥有Java
的JDK
因为在运行其服务的时候需要使用,其次需要注意的是版本对应问题,Neo4j 3.X
的版本对应的是JDK 8
而Neo4j 4.X
的版本对应的是JDK 11
。因此需要确保在计算机的环境变量中存在JDK
当下载了对应的压缩包后即可简单地将其解压缩在对应的目录下即可(注意路径不含中文),此后即可在对应的\bin
目录下执行相应的命令即可:
# 将Neo4j作为控制台应用程序运行
<NEO4J_HOME>\bin:neo4j console
# 将Neo4j作为服务使用进行安装
<NEO4J_HOME>\bin:neo4j install-service
console: 直接启动 Neo4j 服务器
install-service | uninstall-service | update-service : 安装/卸载/更新 neo4j 服务
start/stop/restart/status: 在安装了对应的服务后可以对其启动/停止/重启/查看状态
-V 输出更多信息
通过在浏览器中输入http://localhost:7474/browser/
来访问数据浏览器即可,使用用户名neo4j
和默认密码neo4j
进行连接,然后会提示更改密码。Neo4j Browser
是开发人员用来探索Neo4j
数据库、执行Cypher
查询并以表格或图形形式查看结果的工具。这里更推荐使用服务的方式,因为这样可以避免让控制台一直开着,对于不喜欢底栏一直挂着终端的用户来说简直不要太好。
如果想要直接在默认控制台中直接执行命令,那么需要将Neo4j
的安装路径放到系统的环境变量中,即在高级系统设置中定义变量值为D:\develop\Neo4j\neo4j-community-3.5.35
(安装路径)的名为NEO4J_HOME
的系统变量,并在Path
系统变量中添加%NEO4J_HOME%\bin;
即可不需要进入到其目录也可以直接执行命令。
在介绍其具体的使用方法前先简单介绍一个Neo4j
数据浏览器的使用方法:
首先是红色箭头所指向的界面,其代表的就是当前图数据库中的所有数据,Node Labels
表示数据库中所有代表节点的标签类型,Relationship Types
表示数据库中所有节点之间的关系的标签类型。当点击某个标签类型后会将该标签的节点显示出来,比如此时我点击的是Disease
类型那么会将该类型的节点显示在界面上。
一般来说我们是需要在下图框起来的地方写CQL
语句的,比如通过图示的语句查询出标签为Disease
的节点并返回25
条数据。
其次介绍蓝色箭头所指向的界面。其代表的是本地收藏的一些脚本,比如点击了右侧黄色箭头所指向的按钮那么就会将该条语句收藏在左边的界面中,方便下次再调用。
当点击某个节点的时候会出现如图所示的三个按钮,其中红色箭头所指向的按钮点击后会将该节点隐藏,绿色的则会将其锁定,蓝色的比较特殊,单独再放一张图表示。
当点击蓝色箭头所指向的按钮时会将与该节点有关的所有节点和关系展开,如下所示:
Neo4j
的Cypher
语言是为处理图形数据而构建的,CQL
代表Cypher
查询语言。像Oracle
数据库具有查询语言SQL
,Neo4j
具有CQL
作为查询语言。
Neo4j
图形数据库的查询语言。SQL
语法。CQL命令 | 用法 |
---|---|
CREATE | 创建节点,关系和属性 |
MATCH | 检索有关节点,关系和属性数据 |
RETURN | 返回查询结果 |
WHERE | 提供条件过滤检索数据 |
DELETE | 删除节点和关系 |
REMOVE | 删除节点和关系的属性 |
ORDER BY | 排序检索数据 |
SET | 添加或更新标签 |
#创建简单节点
create (n)
#创建多个节点
create (n),(m)
#创建带标签和属性的节点并返回节点
create (n:person {name:'xzh'}) return n
Neo4j
图数据库遵循属性图模型来存储和管理其数据。 根据属性图模型,关系应该是定向的,否则Neo4j
将抛出一个错误消息。 基于方向性,Neo4j
关系被分为两种主要类型:单向关系和双向关系#使用新节点创建关系
CREATE (n:person {name:'杨戬'})-[r:师傅]->(m:person {name:'玉鼎真人'}) return
type(r)
#使用已知节点创建带属性的关系
match (n:person {name:'沙僧'}),(m:person{name:'唐僧'})
create (n)-[r:`师傅`{relation:'师傅'}]->(m) return r
#检索关系节点的详细信息
match (n:person)-[r]-(m:person) return n,m
create p=(:person{name:'蛟魔王'})-[:义兄]->(:person{name:'牛魔王'})<-[:义兄]-
(:person {name:'鹏魔王'}) return p
Neo4j CQL MATCH
命令用于:
MATCH (n:`西游`) RETURN n LIMIT 25
Neo4j CQL RETURN
子句用于
需要注意的是id
属性的获取不能使用.
运算符,Neo4j
为我们提供了id(n)
函数
MATCH (n:`西游`) RETURN id(n),n.name,n.tail,n.relation
类似SQL
,Neo4j CQL
在CQL MATCH
命令中提供了WHERE
子句来过滤MATCH
查询的结果。
MATCH (n:person) where n.name='孙悟空' or n.name='猪八戒' RETURN n
#创建关系
match (n:person),(m:person) where n.name='孙悟空' and m.name='猪八戒'
create (n)-[r:师弟]->(m) return n.name,type(r),m.name
Neo4j使用CQL DELETE子句
# 删除节点 (前提:节点不存在关系)
MATCH (n:person{name:"白龙马"}) delete n
# 删除关系
MATCH (n:person{name:"沙僧"})<-[r]-(m) delete r return type(r)
有时基于客户端要求,我们需要向现有节点或关系添加或删除属性。我们使用Neo4j CQL REMOVE子句来删除节点或关系的现有属性。
#删除属性
MATCH (n:role {name:"fox"}) remove n.age return n
#创建节点
CREATE (m:role:person {name:"fox666"})
#删除标签
match (m:role:person {name:"fox666"}) remove m:person return m
有时根据我们的客户端要求,我们需要向现有节点或关系添加新属性。要做到这一点,Neo4j CQL
提供了一个SET
子句。
MATCH (n:role {name:"fox"}) set n.age=32 return n
Neo4j CQL
在MATCH
命令中提供了ORDER BY
子句,对MATCH
查询返回的结果进行排序。 我们可以按升序或降序对行进行排序。默认情况下,它按升序对行进行排序。 如果我们要按降序对它们进行排序,我们需要使用DESC
子句。一般来说ORDER BY
语句都是写在RETURN
子句内的。
MATCH (n:`西游`) RETURN id(n),n.name order by id(n) desc
与SQL
一样,Neo4j CQL
有两个子句,将两个不同的结果合并成一组结果
UNION :它将两组结果中的公共行组合并返回到一组结果中。 它不从两个节点返回重复的行。 但是限制就是结果列类型和来自两组结果的名称必须匹配,这意味着列名称应该相同,列的数据类型应该相同。
UNION ALL :它结合并返回两个结果集的所有行成一个单一的结果集。它还返回由两个节点重复行。但是限制就是结果列类型,并从两个结果集的名字必须匹配,这意味着列名称应该是相同的,列的数据类型应该是相同的。
MATCH (n:role) RETURN n.name as name
UNION
MATCH (m:person) RETURN m.name as name
MATCH (n:role) RETURN n.name as name
UNION all
MATCH (m:person) RETURN m.name as name
Neo4j CQL
已提供 LIMIT
子句和 SKIP
来过滤或限制查询返回的行数。LIMIT
返回前几行,SKIP
忽略前几行。
# 前两行
MATCH (n:`西游`) RETURN n LIMIT 2
# 忽略前两行
MATCH (n:person) RETURN n SKIP 2
Neo4j CQL
将空值视为对节点或关系的属性的缺失值或未定义值。当我们创建一个具有现有节点标签名称但未指定其属性值的节点时,它将创建一个具有NULL
属性值的新节点。
match (n:`西游`) where n.label is null return id(n),n.name,n.tail,n.label
与SQL
一样,Neo4j CQL
提供了一个IN
运算符,以便为CQL
命令提供值的集合。
match (n:`西游`) where n.name in['孙悟空','唐僧'] return
id(n),n.name,n.tail,n.label
Neo4j SQL
支持节点或关系属性上的索引,以提高应用程序的性能。 我们可以为具有相同标签名称的所有节点的属性创建索引。我们可以在MATCH
或WHERE
或IN
运算符上使用这些索引列来改进CQL Command
的执行。
# 创建索引
create index on :`西游` (name)
# 删除索引
drop index on :`西游` (name)
在Neo4j
数据库中,CQL CREATE
命令始终创建新的节点或关系,这意味着即使您使用相同的值,它也会插入一个新行。 根据我们对某些节点或关系的应用需求,我们必须避免这种重复。像SQL
一样,Neo4j
数据库也支持对NODE
或Relationship
的属性的UNIQUE
约束。
UNIQUE约束的优点:
#创建唯一约束
create constraint on (n:xiyou) assert n.name is unique
#删除唯一约束
drop constraint on (n:xiyou) assert n.name is unique
这个函数的用法就像SQL中的distinct关键字,返回的是所有不同值。
match (n:`西游`) return distinct(n.name)
函数 | 用法 |
---|---|
String 字符串 | 它们用于使用String字面量 |
Aggregation 聚合 | 它们用于对CQL查询结果执行一些聚合操作 |
Relationship 关系 | 他们用于获取关系的细节,如startnode,endnode等 |
与SQL
一样,Neo4J CQL
提供了一组String
函数,用于在CQL
查询中获取所需的结果。
功能 | 描述 |
---|---|
UPPER | 它用于将所有字母更改为大写字母 |
LOWER | 它用于将所有字母改为小写字母 |
SUBSTRING | 它用于获取给定String的子字符串 |
REPLACE | 它用于替换一个字符串的子字符串 |
#使用的例子
MATCH (e) RETURN id(e),e.name,substring(e.name,0,2)
聚集功能 | 描述 |
---|---|
COUNT | 它返回由MATCH命令返回的行数 |
MAX | 它从MATCH命令返回的一组行返回最大值 |
MIN | 它返回由MATCH命令返回的一组行的最小值 |
SUM | 它返回由MATCH命令返回的所有行的求和值 |
AVG | 它返回由MATCH命令返回的所有行的平均值 |
#使用的例子
MATCH (e) RETURN count(e)
功能 | 描述 |
---|---|
STARTNODE | 它用于知道关系的开始节点 |
ENDNODE | 它用于知道关系的结束节点 |
ID | 它用于知道关系的ID |
TYPE | 它用于知道字符串表示中的一个关系的TYPE |
match (a)-[r] ->(b) return id(r),type(r)
对Neo4j
数据进行备份操作时,要关闭Neo4j
服务
cd %NEO4J_HOME%/bin
#关闭neo4j
neo4j stop
#备份
neo4j-admin dump --database=graph.db --to=/neo4j/backup/graph_backup.dump
对Neo4j
数据进行还原、迁移操作时,要关闭Neo4j
服务
#数据导入
neo4j-admin load --from=/neo4j/backup/graph_backup.dump --database=graph.db --
force
#重启服务
neo4j start
哔哩哔哩相关教程的链接:https://www.bilibili.com/video/BV1HQ4y1h78j?share_source=copy_web对于本课程的本人的客观评价(不代表其他舆论)为:老师讲课水平一般,会翻车,但是PPT相对而言还算不错,对于
Neo4j
来说市面上的入门教程并不多,官方文档不宜入门,该课程也还算勉勉强强了。对于不想听课的人来说本文章完全能够满足使用的需求。