Python解析Json文件

Python解析Json文件

写在前面

  在项目开发中,难免会遇到需要解析别人发过来的Json文件或将自己的输出打包成Json发生给别人,(尤其是做算法,50%-70%的工作量都在数据处理,而数据标注文件大多是Json、XML、txt类型),如果你试图直接用记事本或其他编辑器打开Json文件找里面的内容,那恭喜你,你的工作任务将从此刻开始指数级增长,里面密密麻麻都是字符,本文将介绍怎么利用Python解析和打包Json.

一、解析

下面是一个Json文件的内容:

{“path”:“E:\Datasets\YOLO\person\imgs\15.jpg”,“outputs”:{“object”:[{“name”:“face”,“bndbox”:{“xmin”:48,“ymin”:41,“xmax”:74,“ymax”:77}},{“name”:“face”,“bndbox”:{“xmin”:185,“ymin”:16,“xmax”:216,“ymax”:57}},{“name”:“person”,“bndbox”:{“xmin”:15,“ymin”:31,“xmax”:179,“ymax”:366}},{“name”:“person”,“bndbox”:{“xmin”:153,“ymin”:6,“xmax”:298,“ymax”:375}}]},“time_labeled”:1575946134777,“labeled”:true,“size”:{“width”:416,“height”:416,“depth”:3}}

该文件的内容是图片的路径,以及图片里面有两张人脸,两个人,人脸的位置,人的位置,图片的大小,图片的深度

  仔细观察不难发现,里面就是一些字典的嵌套,知道了这一点,那接下来就好办了
首先导入处理json需要的类库json

import json

接下来以文件的形式打开json文件

f_path = r'H:\Datasets\YOLO\person\outputs\json\15.json'
with open(f_path) as f

然后用json类库提取全部内容,并打印出来看下

labels = json.load(f)
print(labels)

print结果:

{‘path’: ‘E:\Datasets\YOLO\person\imgs\15.jpg’, ‘outputs’: {‘object’: [{‘name’: ‘face’, ‘bndbox’: {‘xmin’: 48, ‘ymin’: 41, ‘xmax’: 74, ‘ymax’: 77}}, {‘name’: ‘face’, ‘bndbox’: {‘xmin’: 185, ‘ymin’: 16, ‘xmax’: 216, ‘ymax’: 57}}, {‘name’: ‘person’, ‘bndbox’: {‘xmin’: 15, ‘ymin’: 31, ‘xmax’: 179, ‘ymax’: 366}}, {‘name’: ‘person’, ‘bndbox’: {‘xmin’: 153, ‘ymin’: 6, ‘xmax’: 298, ‘ymax’: 375}}]}, ‘time_labeled’: 1575946134777, ‘labeled’: True, ‘size’: {‘width’: 416, ‘height’: 416, ‘depth’: 3}}

到此,就把整个文件的内容全部加载到label这个字典里了,接下来就用字典的技术遍历这个字典。

先我们看下这个字典里有哪些键:

keys = labels.keys()
# print(labels.keys())
print(keys)

>dict_keys(['path', 'outputs', 'time_labeled', 'labeled', 'size'])	# print输出

知道这些键以后,就可以根据键查找对应的值。

# 查看path
path = labels['path']
# print(labels['path'])
print(path)

>E:\Datasets\YOLO\person\imgs\15.jpg				# print输出
# 查看 outputss
outputs = labels['outputs']
print(outputs)

>{'object': [{'name': 'face', 'bndbox': {'xmin': 48, 'ymin': 41, 'xmax': 74, 'ymax': 77}}, {'name': 'face', 'bndbox': {'xmin': 185, 'ymin': 16, 'xmax': 216, 'ymax': 57}}, {'name': 'person', 'bndbox': {'xmin': 15, 'ymin': 31, 'xmax': 179, 'ymax': 366}}, {'name': 'person', 'bndbox': {'xmin': 153, 'ymin': 6, 'xmax': 298, 'ymax': 375}}]}

What?这么长一串是什么鬼,看不懂。
没关系,只要你认出 { 这个玩意儿表示字典就行。既然是字典,那就有键值,就可以查看里面的键

print(outputs.keys())

>dict_keys(['object'])		# print输出

里面只要一个键‘object’,输出看看

object = outputs['object']
print(object)

> [{'name': 'face', 'bndbox': {'xmin': 48, 'ymin': 41, 'xmax': 74, 'ymax': 77}}, 
   {'name': 'face', 'bndbox': {'xmin': 185, 'ymin': 16, 'xmax': 216, 'ymax': 57}}, 
   {'name': 'person', 'bndbox': {'xmin': 15, 'ymin': 31, 'xmax': 179, 'ymax': 366}}, 
   {'name': 'person', 'bndbox': {'xmin': 153, 'ymin': 6, 'xmax': 298, 'ymax': 375}}
  ]

貌似有点头绪了,里面是个列表,列表里面有四个元素(也就是那四个字典),分别是两个人脸和两个人。列表就可以用循环遍历了,字典继续用键取值。试试

for obj in object:
    print('{0}  box({1}, {2}, {3}, {4})'.format(obj['name'], obj['bndbox']['xmin'], 
          obj['bndbox']['ymin'], obj['bndbox']['xmax'], obj['bndbox']['ymax']))

> face  box(48, 41, 74, 77)
  face  box(185, 16, 216, 57)
  person  box(15, 31, 179, 366)
  person  box(153, 6, 298, 375)

到此,怎么解析json文件就算是结束了,自己动手试试吧
把上面的文件内容复制到记事本里面,保存为 “文件名.json”,然后把文件的路径复制到代码里的f_path的地方,运行代码看看吧

附:解析代码
import json
f_path = r'H:\Datasets\YOLO\person\outputs\json\15.json'
with open(f_path) as f:
    labels = json.load(f)
    keys = labels.keys()
    print(labels.keys())
    
    path = labels['path']
    print(path)

    size = labels['size']
    print(size)

    width = size['width']
    print(width)

    outputs = labels['outputs']
    print(outputs.keys())
    
    object = outputs['object']
    print(object)
    for obj in object:
        print('{0}  box({1}, {2}, {3}, {4})'.format(obj['name'], obj['bndbox']['xmin'],
                obj['bndbox']['ymin'], obj['bndbox']['xmax'], obj['bndbox']['ymax']))

你可能感兴趣的:(人工智能,AI,Windows常见,深度神经网络)