jsonpath是json格式数据中使用的一种键值提取工具。在python中,封装已经好了jsonpath库,供我们安装使用。下面唠唠怎么使用它——
安装:
pip install jsonpath
或者在pycharm的解释器中下载安装包
函数定义:
def jsonpath(obj, expr, result_type='VALUE', debug=0, use_eval=True): """traverse JSON object using jsonpath expr, returning values or paths"""
参数含义:
obj:实际需要处理的数据
expr:jsonpath表达式
result_type:返回结果的类型,默认为 'VALUE' 表示返回数据的值,'IPATH'表示返回数据的键
debug:是否开启调试模式 默认为0 关闭 ,非0都表示开启
use_eval:debug=1时,配合调试
(后两个参数不常用,想要了解的可以查阅官方文档)
常用语法:
jsonpath | 解释 |
$ | 根元素 |
. 或 [] | 子元素 |
.. | 递归查询 |
@ | 当前元素 |
* | 所有元素 |
?() | 应用过滤表达式;一般需要结合[?(@ )]来使用 |
[] | (数组)下标操作符 |
[,] | 选择多个字段 也可以切片[m:n],但是不能这样使用[-1] |
() | 脚本表达式,使用在脚本引擎下面 |
** 加上参数 result_type='IPATH' 可以返回键名
代码实例:
import jsonpath
a = {
"score": [
{"name": "张三",
"语文": 75,
"数学": 90,
"英语": 91, },
{"name": "李四",
"语文": 78,
"数学": 95,
"英语": 90, },
{"name": "王五",
"语文": 90,
"数学": 95,
"英语": 90, },
{"name": "王六",
"语文": 90,
"数学": 95,
"英语": 90,
"extra": 80},
{"name": "老李",
"语文": 90,
"数学": 95,
"英语": 90,
"extra": 90}
],
"school": "社会大学"
}
# 字典对象[键名],可以获取到对应键值。
# 所以,a["name"]可以取到'张三',a["score"]["语文"]
# $ 表示根键,键和键之间使用 . 链接,如 $.score 表示根键下的score键中的所有的值
print(jsonpath.jsonpath(a, "$.score"))
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90}]]
# $.score[0] 表示根键下的第一个score值
print(jsonpath.jsonpath(a, "$.score[0]"))
# [{'name': '张三', '语文': 75, '数学': 90, '英语': 91}]
# $.score[0] 表示根键下的第一个score中的语文的值,下面两种写法都可以
print(jsonpath.jsonpath(a, "$.score[0].语文"))
print(jsonpath.jsonpath(a, "$.[score][0]['语文']"))
# [75]
# $.score[1,3],表示根键下的第2个和第4个score键,一次性取多个数组下标的值
print(jsonpath.jsonpath(a, "$.score[1,3]"))
# [{'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90}]
# $.score[1:3],表示根键下的第2个和第3个score键,使用切片取值,注意区别于 $.score[1,4],二者得到的结果不一样
print(jsonpath.jsonpath(a, "$.score[1:3]"))
# [{'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}]
# $.score[0:3:2],表示根键下的从第0个score键开始、到第4个score键结束(不包括)、每2个取1个,即取的是第0和第2个score键
print(jsonpath.jsonpath(a, "$.score[0:3:2]"))
# [{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}]
# 条件筛选:?()为应用条件筛选器,@表示当前键,一般结合使用?(@ )
# 取name为 ’张三‘ 的 ’数学‘成绩
print(jsonpath.jsonpath(a, "$.score[?(@.name=='张三')].'数学'"))
# [90]
# 取成绩中有 extra 键的数据,如果key为中文 $.score[?(@.'数学')],则筛选表达式返回结果会为 False ,哪位大神知道是为什么?可以评论区告诉我一下答案
print(jsonpath.jsonpath(a, "$.score[?(@.extra)]"))
# [{'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}]
# 取成绩中有 extra 分数大于85的数据
print(jsonpath.jsonpath(a, "$.score[?(@.extra>85)]"))
# [{'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}]
# 递归取值,获取所有键为 extra 的值
print(jsonpath.jsonpath(a, "$..extra"))
# [80, 90]
# * 表示所有 $.* 表示获取根键下所有的值
print(jsonpath.jsonpath(a, "$.*"))
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}], '社会大学']
# 加上参数 result_type='IPATH' 可以返回键名
print(jsonpath.jsonpath(a, "$.*", result_type='IPATH'))
# [['score'], ['school']]
# 加上参数 debug=1 开启调试模式,默认为 debug=0 关闭
print(jsonpath.jsonpath(a, "$.*", debug=1))
# trace * / $
# *
# trace score; / $
# score
# trace / $;score
# trace school; / $
# school
# trace / $;school
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}], '社会大学']