python中jsonpath模块函数的解析及常用语法汇总

jsonpath是json格式数据中使用的一种键值提取工具。在python中,封装已经好了jsonpath库,供我们安装使用。下面唠唠怎么使用它——

安装:

pip install jsonpath

或者在pycharm的解释器中下载安装包

python中jsonpath模块函数的解析及常用语法汇总_第1张图片

 
函数定义:

def jsonpath(obj, expr, result_type='VALUE', debug=0, use_eval=True):
    """traverse JSON object using jsonpath expr, returning values or paths"""

参数含义:

obj:实际需要处理的数据

expr:jsonpath表达式

result_type:返回结果的类型,默认为 'VALUE' 表示返回数据的值,'IPATH'表示返回数据的键

debug:是否开启调试模式 默认为0 关闭 ,非0都表示开启

use_eval:debug=1时,配合调试

(后两个参数不常用,想要了解的可以查阅官方文档)

常用语法:

jsonpath 解释                                  
$ 根元素
.  或 [] 子元素
.. 递归查询
@ 当前元素
* 所有元素
?() 应用过滤表达式;一般需要结合[?(@  )]来使用
[] (数组)下标操作符
[,] 选择多个字段
也可以切片[m:n],但是不能这样使用[-1]
() 脚本表达式,使用在脚本引擎下面

** 加上参数 result_type='IPATH' 可以返回键名

代码实例:

import jsonpath


a = {
    "score": [
        {"name": "张三",
         "语文": 75,
         "数学": 90,
         "英语": 91, },
        {"name": "李四",
         "语文": 78,
         "数学": 95,
         "英语": 90, },
        {"name": "王五",
         "语文": 90,
         "数学": 95,
         "英语": 90, },
        {"name": "王六",
         "语文": 90,
         "数学": 95,
         "英语": 90,
         "extra": 80},
        {"name": "老李",
         "语文": 90,
         "数学": 95,
         "英语": 90,
         "extra": 90}
    ],
    "school": "社会大学"
}

# 字典对象[键名],可以获取到对应键值。
# 所以,a["name"]可以取到'张三',a["score"]["语文"]

# $ 表示根键,键和键之间使用 . 链接,如 $.score 表示根键下的score键中的所有的值
print(jsonpath.jsonpath(a, "$.score"))
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90}]]

# $.score[0] 表示根键下的第一个score值
print(jsonpath.jsonpath(a, "$.score[0]"))
# [{'name': '张三', '语文': 75, '数学': 90, '英语': 91}]

# $.score[0] 表示根键下的第一个score中的语文的值,下面两种写法都可以
print(jsonpath.jsonpath(a, "$.score[0].语文"))
print(jsonpath.jsonpath(a, "$.[score][0]['语文']"))
# [75]

# $.score[1,3],表示根键下的第2个和第4个score键,一次性取多个数组下标的值
print(jsonpath.jsonpath(a, "$.score[1,3]"))
# [{'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90}]

# $.score[1:3],表示根键下的第2个和第3个score键,使用切片取值,注意区别于 $.score[1,4],二者得到的结果不一样
print(jsonpath.jsonpath(a, "$.score[1:3]"))
# [{'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}]

# $.score[0:3:2],表示根键下的从第0个score键开始、到第4个score键结束(不包括)、每2个取1个,即取的是第0和第2个score键
print(jsonpath.jsonpath(a, "$.score[0:3:2]"))
# [{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}]

# 条件筛选:?()为应用条件筛选器,@表示当前键,一般结合使用?(@ )
# 取name为 ’张三‘ 的 ’数学‘成绩
print(jsonpath.jsonpath(a, "$.score[?(@.name=='张三')].'数学'"))
# [90]

# 取成绩中有 extra 键的数据,如果key为中文 $.score[?(@.'数学')],则筛选表达式返回结果会为 False ,哪位大神知道是为什么?可以评论区告诉我一下答案
print(jsonpath.jsonpath(a, "$.score[?(@.extra)]"))
# [{'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}]

# 取成绩中有 extra 分数大于85的数据
print(jsonpath.jsonpath(a, "$.score[?(@.extra>85)]"))
# [{'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}]

# 递归取值,获取所有键为 extra 的值
print(jsonpath.jsonpath(a, "$..extra"))
# [80, 90]

# * 表示所有 $.* 表示获取根键下所有的值
print(jsonpath.jsonpath(a, "$.*"))
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}], '社会大学']

# 加上参数 result_type='IPATH' 可以返回键名
print(jsonpath.jsonpath(a, "$.*", result_type='IPATH'))
# [['score'], ['school']]

# 加上参数 debug=1 开启调试模式,默认为 debug=0 关闭
print(jsonpath.jsonpath(a, "$.*", debug=1))
# trace * / $
# 	 * 
# trace score; / $
# 	 score 
# trace  / $;score
# trace school; / $
# 	 school 
# trace  / $;school
# [[{'name': '张三', '语文': 75, '数学': 90, '英语': 91}, {'name': '李四', '语文': 78, '数学': 95, '英语': 90}, {'name': '王五', '语文': 90, '数学': 95, '英语': 90}, {'name': '王六', '语文': 90, '数学': 95, '英语': 90, 'extra': 80}, {'name': '老李', '语文': 90, '数学': 95, '英语': 90, 'extra': 90}], '社会大学']

你可能感兴趣的:(经验分享,python,开发语言,json)