1,Cypher概述
Cypher是一种声明式图数据库查询语言,它具有丰富的表现力,能高效地查询和更新图数据。
Cypher借鉴了SQL语言的结构——查询可由各种各样的语句组合。
例如,下面是查找名为'John'的人和他的朋友的朋友。
MATCH (john {name: 'John'})-[:friend]->()-[:friend]->(fof)
RETURN john.name, fof.name
接下来在语句中添加一些过滤。给定一个用户名列表,找到名字在列表中的所有节点。匹配他们的朋友,仅返回他们朋友的name属性以'S'开头的用户。
MATCH (user)-[:friend]->(follower)
WHERE user.name IN ['Joe', 'John', 'Sara', 'Maria', 'Steve'] AND follower.name =~ 'S.*'
RETURN user.name, follower.name
模式(Patterns)
Neo4j图由节点和关系构成。节点可能还有标签和属性,关系可能还有类型和属性。节点和关系都是简单的低层次的构建块。单个节点或者关系只能编码很少的信息,但模式可以将很多节点和关系编码为任意复杂的想法。
Cypher查询语言很依赖于模式。只包含一个关系的简单模式连接了一对节点。例如,一个人LIVES_IN在某个城市或者某个城市PART_OF一个国家。使用了多个关系的复杂模式能够表达任意复杂的概念,可以支持各种有趣的使用场景。例如,下面的Cypher代码将两个简单的模式连接在一起:
(:Person)-[:LIVES_IN]->(:City)-[:PART_OF]->(:Country)
像关系数据库中的SQL一样,Cypher是一种文本的声明式查询语言。它使用ASCII art的形式来表达基于图的模式。采用类似SQL的语句,如MATCH,WHERE和DELETE,来组合这些模式以表达所预期的操作。
节点语法
Cypher采用一对圆括号来表示节点。如:(), (foo)。下面是一些常见的节点表示法:
()
(matrix)
(:Movie)
(matrix:Movie)
(matrix:Movie {title: "The Matrix"})
(matrix:Movie {title: "The Matrix", released: 1997})
match (matrix:Movie {title: "The Matrix"}) return matrix
关系语法
Cypher使用一对短横线(即“--”)表示:一个无方向关系。有方向的关系在其中一端加上一个箭头(即“<--”或“-->”)。方括号表达式[…]可用于添加关系信息。里面可以包含变量、属性和或者类型信息。关系的常见表达方式如下:
--
-->
-[role]->
-[:ACTED_IN]->
-[role:ACTED_IN]->
-[role:ACTED_IN {roles: ["Neo"]}]->
# 找出"Hugo Weaving"参演的电影
match (n:Person{name:"Hugo Weaving"})-[r:ACTED_IN]->(m) return n,r,m
模式语法
将节点和关系的语法组合在一起可以表达模式。
(keanu:Person {name: "Keanu Reeves"})-[role:ACTED_IN {roles: ["Neo"]}]->(matrix:Movie {title: "The Matrix"})
事务
任何更新图的查询都运行在一个事务中。一个更新查询要么全部成功,要么全部失败。Cypher或者创建一个新的事务,或者运行在一个已有的事务中:
- 如果运行上下文中没有事务,Cypher将创建一个,一旦查询完成就提交该事务。
- 如果运行上下文中已有事务,查询就会运行在该事务中。直到该事务成功地提交之后,数据才会持久化到磁盘中去。
兼容性
Cypher不是一成不变的语言。新版本引入了很多新的功能,一些旧的功能可能会被移除。如果需要,旧版本依然可以访问到。这里有两种方式在查询中选择使用哪个版本:
- 为所有查询设置版本:可以通过neo4j.conf中cypher.default_language_version参数来配置Neo4j数据库使用哪个版本的Cypher语言。
- 在查询中指定版本:简单地在查询开始的时候写上版本,如Cypher 2.3。
2,cypher基本语法
类型
Cypher处理的所有值都有一个特定的类型,它支持如下类型:
- 数值型
- 字符串
- 布尔型
- 节点
- 关系
- 路径
- 映射(Map)
- 列表(List)
表达式
- Cypher中的表达式如下:
- 十进制(整型和双精度型)的字面值:13, -4000, 3.14, 6.022E23
- 十六进制整型字面值(以0x开头):0x13zf, 0xFC3A9, -0x66eff
- 八进制整型字面值(以0开头):01372, 02127, -05671
- 字符串字面值:'Hello', "World"
- 布尔字面值:true, false, TRUE, FALSE
- 变量:n, x, rel, myFancyVariable
- 属性:n.prop, x.prop, rel.thisProperty
- 动态属性:n["prop"], rel[n.city + n.zip], map[coll[0]]
- 参数:0
- 表达式列表:['a', 'b'], [1, 2, 3], ['a', 2, n.property, $param], [ ]
- 函数调用:length(p), max(p)
- 聚合函数:avg(x.prop), count()
- 路径-模式:(a)-->()<--(b)
- 算式:1 + 2 >3 and 3 < 4.
- 返回true或者false的断言表达式:a.prop = 'Hello', length(p) >10, exists(a.name)
- 正则表达式:a.name =~ 'Tob.*'
- 大小写敏感的字符串匹配表达式:a.surname STARTS WITH 'Sven', a.surname ENDS WITH 'son'
- CASE表达式
转义字符
Cypher中的字符串可以包含如下转义字符:
字符 | 含义 |
---|---|
\t | 制表符 |
\b | 退格 |
\n | 换行 |
\r | 回车 |
\f | 换页 |
' | 单引号 |
" | 双引号 |
\ | 反斜杠 |
\uxxxx | Unicode UTF-16编码点(4位的十六进制数字必须跟在\u后面) |
\Uxxxxxxxx | Unicode UTF-32 编码点(8位的十六进制数字必须跟在\U后面) |
Case表达式
计算表达式的值,然后依次与WHEN语句中的表达式进行比较,直到匹配上为止。如果未匹配上,则ELSE中的表达式将作为结果。如果ELSE语句不存在,那么将返回null。
语法:
CASE test.value
WHEN value1 THEN result1
WHEN value2 THEN result2
[WHEN ...]
[ELSE default]
END AS result
例子:
MATCH (p:Person)
return
CASE p.born
WHEN 1997 THEN 1
WHEN '1942' THEN 2
ELSE 3 END AS result
变量
当需要引用模式(pattern)或者查询的某一部分的时候,可以对其进行命名。针对不同部分的这些命名被称为变量。例如:
# 这里的n和b和r就是变量。
MATCH (n)-[r]->(b)
RETURN b
参数
Cypher支持带参数的查询。这意味着开发人员不是必须用字符串来构建查询。此外,这也让执行计划的缓存更容易。
参数能够用于WHERE语句中的字面值和表达式,START语句中的索引值,索引查询以及节点和关系的id。参数不能用于属性名、关系类型和标签,因为这些模式(pattern)将作为查询结构的一部分被编译进查询计划。
合法的参数名是字母,数字以及两者的组合。下面是一个使用参数的完整例子。参数以JSON格式提供。具体如何提交它们取决于所使用驱动程序。
{
"name" : "Johan"
}
match (n:Person) where n.name=$name return n
运算符
数学运算符
包括+,-,*,/ 和%,^。
比较运算符
包括=,<>,<,>,<=,>=,IS NULL和IS NOT NULL。
布尔运算符
包括AND,OR,XOR和NOT。
字符串运算符
连接字符串的运算符为+。
正则表达式的匹配运算符为=~。
列表运算符
列表的连接也可以通过+运算符。
可以用IN来检查列表中是否存在某个元素。
值的相等与比较
Cypher支持使用=和<>来比较两个值的相等/不相等关系。同类型的值只有它们是同一个值的时候才相等,如3 = 3和"x" <> "xy"。
值的排序与比较
比较运算符<=,<(升序)和>=,>(降序)可以用于值排序的比较。如下所示:
- 数字型值的排序比较采用数字顺序
- java.lang.Double.NaN大于所有值
- 字符串排序的比较采用字典顺序。如"x" < "xy"
- 布尔值的排序遵循false < true
- 当有个参数为null的时候,比较结果为null。如null < 3的结果为null
- 将其他类型的值相互比较进行排序将报错
链式比较运算
比较运算可以被任意地链在一起。如x < y <= z等价于x < y AND y <= z。如:
MATCH (n) WHERE 21 < n.age <= 30 RETURN n
等价于:
MATCH (n) WHERE 21 < n.age AND n.age <= 30 RETURN n
注释
Cypher语言的注释类似其他语言,用双斜线//来注释行。例如:
MATCH (n) RETURN n //这是行末尾注释
MATCH (n)
//这是整行注释
RETURN n
MATCH (n) WHERE n.property = '//这不是注释' RETURN n
模式(Patterns)
使用模式可以描述你期望看到的数据的形状。例如,在MATCH、CREATE、DELETE等语句中,当用模式描述一个形状的时候,Cypher将按照模式来获取相应的数据。
模式描述数据的形式很类似在白板上画出图的形状。通常用圆圈来表达节点,使用箭头来表达关系。节点模式
模式能表达的最简单的形状就是节点。节点使用一对圆括号表示,然后中间含一个名字。例如:
(a)
//这个模式描述了一个节点,其名称使用变量a表示。
关联节点的模式
模式可以描述多个节点及其之间的关系。Cypher使用箭头来表达两个节点之间的关系。例如:
(a)-->(b)
(a)-->(b)<--(c)
(a)-->()<--(c)
标签
模式除了可以描述节点之外,还可以用来描述标签。例如:
(a:User)-->(b)
(a:User:Admin)-->(b)
指定属性
属性在模式中使用键值对的映射结构来表达,然后用大括号包起来。例如,一个有两个属性的节点如下所示:
(a {name: 'Andres', sport: 'Brazilian Ju-Jitsu'})
// 关系中的属性
(a)-[{blocked: false}]->(b)
描述关系
如前面的例子所示,可以用箭头简单地描述两个节点之间的关系。它描述了关系的存在性和方向性。但如果不关心关系的方向,则箭头的头部可以省略。例如:
(a)--(b)
与节点类似,如果后续需要引用到该关系,则可以给关系赋一个变量名。变量名需要用方括号括起来,放在箭头的短横线中间,如下所示:
(a)-[r]->(b)
就像节点有标签一样,关系可以有类型(type)。给关系指定类型,如下所示:
(a)-[r:REL_TYPE]->(b)
不像节点可以有多个标签,关系只能有一个类型。但如果所描述的关系可以是一个类型集中的任意一种类型,可以将这些类型都列入到模式中,它们之间以竖线“|”分割。如:
(a)-[r:TYPE1|TYPE2]->(b)
注意:这种模式仅适用于描述已经存在的数据(如在MATCH语句中),而在CREATE或者MERGE语句中是不允许的,因为一个关系不能创建多个类型。
与使用一串节点和关系来描述一个长路径的模式不同,很多关系(以及中间的节点)可以采用指定关系的长度的模式来描述。例如:
(a)-[*2]->(b)
它描述了一张三个节点和两个关系的图。这些节点和关系都在同一条路径中(路径的长度为2)。它等同于:
(a)-->()-->(b)
关系的长度也可以指定一个范围,这被称为可变长度的关系。例如:
(a)-[*3..5]->(b)
长度的边界也是可以省略的,如描述一个路径长度大于等于3的路径:
(a)-[*3..]->(b)
路径长度小于等于5的路径,如:
(a)-[*..5]->(b)
两个边界都可以省略,这允许任意长度的路径,如:
(a)-[*]->(b)
列表
Cypher对列表(list)有很好的支持。可以使用方括号和一组以逗号分割的元素来创建一个列表。如:
RETURN [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] AS list