1、json转化为dataframe
简单json转化方法:
import pandas as pd
df = pd.read_json("test.json",encoding="utf-8", orient='records')
print(df)
复杂json转化方法2,中间可以对json做一些转化处理使其满足dataframe的格式要求:
import json
from pandas.io.json import json_normalize
data=open("test.json",encoding="utf-8").read()
data_list = json.loads(data)
df = json_normalize(data_list)
print(df)
2、dataframe转json
通常情况下,我们使用的都是pandas中的to_json()函数,可以通过设置orient参数来转换成为我们想要的json格式,orient函数有以下几个参数:"split", "records", "index", "columns", "values",无论哪一个参数,返回的结果为json字符串,而非json对象。
Series可选参数为:"index"(默认), "split", "records",
DataFrame可选参数:"columns"(默认),split","records", "index","values"
首先,取一个DataFrame来进行测试(这里采用张三兄弟的数据),数据信息如下:
1.columns
df.to_json(orient="columns",force_ascii=False)
按照column进行转换,效果图如下:
{"宠物":{"李四":"汪星人","王五":"喵星人"},"年龄":{"李四":25,"王五":23}}
2.split
df.to_json(orient="split",force_ascii=False)
按照split进行转换,效果图如下:
{"columns":["宠物","年龄"],"index":["李四","王五"],"data":[["汪星人",25],["喵星人",23]]}
3.records
df.to_json(orient="records",force_ascii=False)
按照records进行转换,效果图如下:
[{"宠物":"汪星人","年龄":25},{"宠物":"喵星人","年龄":23}]
4.index
df.to_json(orient="index",force_ascii=False)
按照index进行转换,效果图如下:
{"李四":{"宠物":"汪星人","年龄":25},"王五":{"宠物":"喵星人","年龄":23}}
5.values
df.to_json(orient="values",force_ascii=False)
按照values进行数据转换,效果如下,其对应的为json字符串,而非json对象:
[["汪星人",25],["喵星人",23]]
通过对上面方法的描述,可以发现在进行数据转换的时候,首先要弄清楚的是转换的方式,其次再去调用相应的方法。道路千万条,逻辑第一条。