数据导入与预处理-第4章-Python标准库之json

文章目录

  • 资源
  • json概述
  • json案例
    • dumps案例
    • dump案例
      • 中文编码问题
      • 格式化问题
    • loads案例
    • load案例

资源

参考:https://zhuanlan.zhihu.com/p/436465279
https://blog.csdn.net/impoijimlq/article/details/130445399

json概述

什么是json

json是一种轻量级的文本数据
交换格式json独立于其他语言
json具有自我描述性,更好理解
json比xml更小、更快,更容易解析

json格式

{
    "name""lhh",
    "age":"20"
}

json标准库的作用

使用json字符串生成python对象(load)
由python对象格式成为json字符串(dump)

数据的类型转换

将数据从python转换到json格式,在数据类型上会有什么变化呢,如下表所示:

Python JSON
dict object
list,tuple array
str string
int,float,int- number
True true
False false
None null

使用方式

方法 功能
json.dump(obj,fp) 将python数据类型转换并保存到json格式的文件内
json.dumps(obj) 将python数据类型转换为json格式的字符串
json.load(obj) 将json格式的文件中读取数据并转换为python类型
json.loads(s) 将json格式的字符串转换为python的类型

json案例

dumps案例

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)

#转换为json字符串
jsonStr = json.dumps(person,)
print(jsonStr)

#转换为json字符串 中文编码避免
jsonStr = json.dumps(person,ensure_ascii=False)
print(jsonStr)

输出为:
在这里插入图片描述

在python中定义json的时候,可以使用单引号,也可以使用双引号。但是最后在输出的时候,输出的是一个单引号,以字典的方式进行输出的。
我们进行json格式转换之后,我们就会变成一个标准的json格式的字符串,即双引号修饰的字符串
对于包含中文的内容,会被转码为\u开头,这时可以通过ensure_ascii=False完成中文输出。json_dumps(dict)时,如果dict包含有汉字,一定加上ensure_ascii=False。否则按参数默认值True,意思是保证dumps之后的结果里所有的字符都能够被ascii表示,汉字在ascii的字符集里面,因此经过dumps以后的str里,汉字会变成对应的unicode。

dump案例

中文编码问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)

#转换为json文件
json.dump(person,open("data.json","w"))


#转换为json文件,文件内容为中文  
json.dump(person,open("data1.json","w",encoding="utf-8"),ensure_ascii=False)

输出为:
数据导入与预处理-第4章-Python标准库之json_第1张图片

格式化问题

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)

#转换为json文件
json.dump(person,open("data.json","w"))


#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4)

输出为:
数据导入与预处理-第4章-Python标准库之json_第2张图片

import json
#从python对象格式化一个json  string
person = {"name":"张某某","gender":"man","age":25}
print(person)

#转换为json文件,文件内容为中文  
json.dump(person,
          open("data1.json","w",encoding="utf-8"),
          ensure_ascii=False,
          indent=4,
          sort_keys=True)

输出为:
数据导入与预处理-第4章-Python标准库之json_第3张图片

loads案例

import json
 
data = {'name':'张某某','gender':'man','age':18}
# 将Python对象编码成json字符串
# print(json.dumps(data))
# 将json字符串解码成Python对象
a = json.dumps(data)
print(json.loads(a))
print('+'*10)
 
data = (1,2,3,4)
data_json = [1,2,3,4]
#将Python对象编码成json字符串
print(json.dumps(data))
print(json.dumps(data_json))
print('+'*10)
 
#将Python对象编码成json字符串
a = json.dumps(data)
b = json.dumps(data_json)
print('+'*10)
#将json字符串编码成Python对象
print(json.loads(a))
print(json.loads(b))

输出为
数据导入与预处理-第4章-Python标准库之json_第4张图片

load案例

你可能感兴趣的:(数据处理与数据分析,数据导入与预处理,python,json,开发语言)