Python将Excel转成Json格式

Json(JavaScript Object Notation) 是一种轻量级的数据交换格式,简洁和清晰的层次结构使其成为理想的数据交换语言,易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。然而我们很多数据经常是用Excel处理或保存的,为了更好的让研发人员使用,需要将数据转成Json格式。Python中提供了json模块,可用json.dumps()和json.loads()函数分别编码和解码Json对象,详细用法可参见网站。下面以示例的形式介绍用Python将Excel数据转成Json格式,基本思路:用pandas读取数据,然后collections.OrderedDict()构建有序字典,再用json.dumps()将字典编码成Json对象。

  • 示例1:将Excel数据转换成格式:{ “area”: “滨海新区”, “lng”: “39.0094”, “lat”: “117.7174”, “indicators”: [ “基础竞争力”,“产业效能竞争力”,“发展潜能竞争力”,“产业创新竞争力”,“产业政策竞争力”, “综合竞争力”], “values”: [“94.33”, “98.18”, “52.95”, “86.94”, “67.8”, “75.71” ]}。
    Python将Excel转成Json格式_第1张图片
# -*- coding:utf-8 -*-
import pandas as pd
import numpy as np
import json
import collections

area_data=pd.read_csv('1_data.csv',encoding='gb18030',sep=',')
print (area_data.head())
indicator=area_data.columns[3:].tolist()
print (indicator)

f = open("newAreaData.json", "w+")
for i in range(len(area_data)):
    area_dict=collections.OrderedDict()  ##利用OrderedDict()建立有序词典
    area_dict['area']=area_data.ix[i,'新区名称']
    area_dict['lng']=str(area_data.ix[i,'纬度'])
    area_dict['lat']=str(area_data.ix[i,'经度'])
    
    area_dict['indicators']=indicator
    value_list=area_data.iloc[i,3:].tolist()
    value_list_new=[str(x) for x in value_list]
    #value_list.append(area_data.iloc[i,3:].tolist().astype(str))
    area_dict['values']= value_list_new
    #print (area_dict)

    #使用json模块将构造好的字典保存到文件中
    #area_dict.encode("utf-8")
    f.writelines(json.dumps(area_dict,ensure_ascii=False, indent=4)+',\n')  
f.close()   #将文件关闭

Python将Excel转成Json格式_第2张图片

  • 示例2:将Excel数据转换成格式:{ “AreaCode”: “230102”,“AreaName”: “道里区”, “lat”: “126.378”,“lng”: “45.6685”, “indicators”: [ { “name”: “地区生产总值(亿元)”, “values”: [ “518.4”, “562.5”, “609.3”, “663.1”,“699.8”, “745.7”, “791.6”, “837.5” ], “years”: [ “2013年”, “2014年”, “2015年”, “2016年”, “2017年”, “2018年”, “2019年”,“2020年” ]}, {“name”: “第二产业增加值(亿元)”, “values”: [ “154.3”, “171.8”,“171.8”, “185.0”, “204.6”, “218.47”,“232.33”, “246.2” ], “years”: [“2013年”,“2014年”,“2015年”, “2016年”,“2017年”, “2018年”,“2019年”, “2020年” ] },…,]}。
    Python将Excel转成Json格式_第3张图片
# -*- coding:utf-8 -*-
import pandas as pd
import numpy as np
import json
import collections
#dic = collections.OrderedDict()

area_data=pd.read_csv('2_data.csv',encoding='gb18030',sep=',')
print (area_data.head())
years=area_data.columns[5:].tolist()
#print (years)
area=area_data['地区'].unique()
#print (area)
f = open("hebDistrictsData.json", "w+")
for a in area:
    #print (a)
    area_dict=collections.OrderedDict()
    area_dict['AreaCode']=str(area_data[area_data['地区']==a]['地区代码'].unique()[0])
    area_dict['AreaName']=a
    area_dict['lat']=str(area_data[area_data['地区']==a]['经度'].unique()[0].round(3))
    area_dict['lng']=str(area_data[area_data['地区']==a]['纬度'].unique()[0].round(4))
    #print(area_dict)
    indi=area_data[area_data['地区']==a]['指标'].tolist()
    indicators=[]
    #print (indi)
    for i in indi:
        #print (i)
        ind_dict=collections.OrderedDict()
        ind_dict['name']=i
        index_num=area_data[(area_data['地区']==a) & (area_data['指标']==i)].index
        #print(index_num)
        value_list=area_data.iloc[index_num,5:].values
        #print (value_list)
        value_list_new=[str(x) for x in value_list[0]]
        ind_dict['values']=value_list_new
        ind_dict['years']=years
        #value_list.append(area_data.iloc[i,3:].tolist().astype(str))
        indicators.append(ind_dict)
    area_dict['indicators']= indicators   
    
    f.writelines(json.dumps(area_dict,ensure_ascii=False, indent=4)+',\n')  
f.close()   #将文件关闭
#print (area_dict)

Python将Excel转成Json格式_第4张图片

  • 示例3:将Excel数据转换成格式:{“area”: “哈尔滨市”, “lat”: “126.5416”,“lng”: “45.8088”,“industry”: [{“name”: “农林牧渔业”, “value”:“1.23”},{ “name”: “采矿业”,“value”: “0.07”},{“name”: “制造业”, “value”: “0.47”},…]}。
    Python将Excel转成Json格式_第5张图片
# -*- coding:utf-8 -*-
import pandas as pd
import numpy as np
import json
import collections
#dic = collections.OrderedDict()

area_data=pd.read_csv('3_data.csv',encoding='gb18030',sep=',')
print (area_data.head())
indicator=area_data.columns[3:].tolist()
print (indicator)

f = open("chanyeHljCitiesDataBar.json", "w+")
for i in range(len(area_data)):
    area_dict=collections.OrderedDict()
    area_dict['area']=area_data.ix[i,'地区']
    area_dict['lat']=str(area_data.ix[i,'经度'].round(4))
    area_dict['lng']=str(area_data.ix[i,'纬度'].round(4))
    data_list=[]
    for j in  indicator:
        data_dict=collections.OrderedDict()
        data_dict['name']=j
        data_dict['value']=str(area_data.loc[i,j])
        data_list.append(data_dict)
    area_dict['industry']= data_list

    #使用json模块将构造好的地区配置字典保存到TXT文件中
    #area_dict.encode("utf-8")
    f.writelines(json.dumps(area_dict,ensure_ascii=False, indent=4)+',\n')  
f.close()   #将文件关闭

Python将Excel转成Json格式_第6张图片
数据和源码可自行下载。链接:https://pan.baidu.com/s/1fdw1Ep4XYBrjcNBQNzHmag; 提取码:uywp 。

ps:初衷是通过撰写博文记录自己所学所用,实现知识的梳理与积累;将其分享,希望能够帮到面临同样困惑的小伙伴儿。如发现博文中存在问题,欢迎随时交流~~

你可能感兴趣的:(Python,数据处理,JSON,数据处理)