在项目开发中,难免会遇到需要解析别人发过来的Json文件或将自己的输出打包成Json发生给别人,(尤其是做算法,50%-70%的工作量都在数据处理,而数据标注文件大多是Json、XML、txt类型),如果你试图直接用记事本或其他编辑器打开Json文件找里面的内容,那恭喜你,你的工作任务将从此刻开始指数级增长,里面密密麻麻都是字符,本文将介绍怎么利用Python解析和打包Json.
下面是一个Json文件的内容:
{“path”:“E:\Datasets\YOLO\person\imgs\15.jpg”,“outputs”:{“object”:[{“name”:“face”,“bndbox”:{“xmin”:48,“ymin”:41,“xmax”:74,“ymax”:77}},{“name”:“face”,“bndbox”:{“xmin”:185,“ymin”:16,“xmax”:216,“ymax”:57}},{“name”:“person”,“bndbox”:{“xmin”:15,“ymin”:31,“xmax”:179,“ymax”:366}},{“name”:“person”,“bndbox”:{“xmin”:153,“ymin”:6,“xmax”:298,“ymax”:375}}]},“time_labeled”:1575946134777,“labeled”:true,“size”:{“width”:416,“height”:416,“depth”:3}}
该文件的内容是图片的路径,以及图片里面有两张人脸,两个人,人脸的位置,人的位置,图片的大小,图片的深度
仔细观察不难发现,里面就是一些字典的嵌套,知道了这一点,那接下来就好办了
首先导入处理json需要的类库json
import json
接下来以文件的形式打开json文件
f_path = r'H:\Datasets\YOLO\person\outputs\json\15.json'
with open(f_path) as f
然后用json类库提取全部内容,并打印出来看下
labels = json.load(f)
print(labels)
print结果:
{‘path’: ‘E:\Datasets\YOLO\person\imgs\15.jpg’, ‘outputs’: {‘object’: [{‘name’: ‘face’, ‘bndbox’: {‘xmin’: 48, ‘ymin’: 41, ‘xmax’: 74, ‘ymax’: 77}}, {‘name’: ‘face’, ‘bndbox’: {‘xmin’: 185, ‘ymin’: 16, ‘xmax’: 216, ‘ymax’: 57}}, {‘name’: ‘person’, ‘bndbox’: {‘xmin’: 15, ‘ymin’: 31, ‘xmax’: 179, ‘ymax’: 366}}, {‘name’: ‘person’, ‘bndbox’: {‘xmin’: 153, ‘ymin’: 6, ‘xmax’: 298, ‘ymax’: 375}}]}, ‘time_labeled’: 1575946134777, ‘labeled’: True, ‘size’: {‘width’: 416, ‘height’: 416, ‘depth’: 3}}
到此,就把整个文件的内容全部加载到label这个字典里了,接下来就用字典的技术遍历这个字典。
先我们看下这个字典里有哪些键:
keys = labels.keys()
# print(labels.keys())
print(keys)
>dict_keys(['path', 'outputs', 'time_labeled', 'labeled', 'size']) # print输出
知道这些键以后,就可以根据键查找对应的值。
# 查看path
path = labels['path']
# print(labels['path'])
print(path)
>E:\Datasets\YOLO\person\imgs\15.jpg # print输出
# 查看 outputss
outputs = labels['outputs']
print(outputs)
>{'object': [{'name': 'face', 'bndbox': {'xmin': 48, 'ymin': 41, 'xmax': 74, 'ymax': 77}}, {'name': 'face', 'bndbox': {'xmin': 185, 'ymin': 16, 'xmax': 216, 'ymax': 57}}, {'name': 'person', 'bndbox': {'xmin': 15, 'ymin': 31, 'xmax': 179, 'ymax': 366}}, {'name': 'person', 'bndbox': {'xmin': 153, 'ymin': 6, 'xmax': 298, 'ymax': 375}}]}
What?这么长一串是什么鬼,看不懂。
没关系,只要你认出 { 这个玩意儿表示字典就行。既然是字典,那就有键值,就可以查看里面的键
print(outputs.keys())
>dict_keys(['object']) # print输出
里面只要一个键‘object’,输出看看
object = outputs['object']
print(object)
> [{'name': 'face', 'bndbox': {'xmin': 48, 'ymin': 41, 'xmax': 74, 'ymax': 77}},
{'name': 'face', 'bndbox': {'xmin': 185, 'ymin': 16, 'xmax': 216, 'ymax': 57}},
{'name': 'person', 'bndbox': {'xmin': 15, 'ymin': 31, 'xmax': 179, 'ymax': 366}},
{'name': 'person', 'bndbox': {'xmin': 153, 'ymin': 6, 'xmax': 298, 'ymax': 375}}
]
貌似有点头绪了,里面是个列表,列表里面有四个元素(也就是那四个字典),分别是两个人脸和两个人。列表就可以用循环遍历了,字典继续用键取值。试试
for obj in object:
print('{0} box({1}, {2}, {3}, {4})'.format(obj['name'], obj['bndbox']['xmin'],
obj['bndbox']['ymin'], obj['bndbox']['xmax'], obj['bndbox']['ymax']))
> face box(48, 41, 74, 77)
face box(185, 16, 216, 57)
person box(15, 31, 179, 366)
person box(153, 6, 298, 375)
到此,怎么解析json文件就算是结束了,自己动手试试吧
把上面的文件内容复制到记事本里面,保存为 “文件名.json”,然后把文件的路径复制到代码里的f_path的地方,运行代码看看吧
import json
f_path = r'H:\Datasets\YOLO\person\outputs\json\15.json'
with open(f_path) as f:
labels = json.load(f)
keys = labels.keys()
print(labels.keys())
path = labels['path']
print(path)
size = labels['size']
print(size)
width = size['width']
print(width)
outputs = labels['outputs']
print(outputs.keys())
object = outputs['object']
print(object)
for obj in object:
print('{0} box({1}, {2}, {3}, {4})'.format(obj['name'], obj['bndbox']['xmin'],
obj['bndbox']['ymin'], obj['bndbox']['xmax'], obj['bndbox']['ymax']))