项目数据集课程比赛社区9+中 | En访问飞桨官网文档教育合作
课程>我的课程>Python小白逆袭大神>[作业]Day3-《青春有你2》选手数据分析
Day3-《青春有你2》选手数据分析
课程: Python小白逆袭大神
请在下方提示位置,补充代码,对《青春有你2》对选手体重分布进行可视化,绘制饼状图,如下图所示:
不要求跟下图样式一模一样
任务描述:
基于第二天实践使用Python来爬去百度百科中《青春有你2》所有参赛选手的信息,进行数据可视化分析。
In[15]
#!mkdir /home/aistudio/external-libraries
#!pip install matplotlib -t /home/aistudio/external-libraries
In[16]
import sys
sys.path.append(’/home/aistudio/external-libraries’)
In[17]
!wget https://mydueros.cdn.bcebos.com/font/simhei.ttf
!cp simhei.ttf /opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/mpl-data/fonts/ttf/
!mkdir .fonts
!cp simhei.ttf .fonts/
!rm -rf .cache/matplotlib
–2020-04-24 10:58:37-- https://mydueros.cdn.bcebos.com/font/simhei.ttf
Resolving mydueros.cdn.bcebos.com (mydueros.cdn.bcebos.com)… 182.61.128.198
Connecting to mydueros.cdn.bcebos.com (mydueros.cdn.bcebos.com)|182.61.128.198|:443… connected.
HTTP request sent, awaiting response… 200 OK
Length: 9753388 (9.3M) [application/octet-stream]
Saving to: ‘simhei.ttf.3’
simhei.ttf.3 100%[===================>] 9.30M 52.7MB/s in 0.2s
2020-04-24 10:58:37 (52.7 MB/s) - ‘simhei.ttf.3’ saved [9753388/9753388]
mkdir: cannot create directory ‘.fonts’: File exists
绘制选手区域分布柱状图
In[18]
import matplotlib.pyplot as plt
import numpy as np
import json
import matplotlib.font_manager as font_manager
#显示matplotlib生成的图形
%matplotlib inline
with open(‘data/data31557/20200422.json’, ‘r’, encoding=‘UTF-8’) as file:
json_array = json.loads(file.read())
#绘制小姐姐区域分布柱状图,x轴为地区,y轴为该区域的小姐姐数量
zones = []
for star in json_array:
zone = star[‘zone’]
zones.append(zone)
print(len(zones))
print(zones)
zone_list = []
count_list = []
for zone in zones:
if zone not in zone_list:
count = zones.count(zone)
zone_list.append(zone)
count_list.append(count)
print(zone_list)
print(count_list)
plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 指定默认字体
plt.figure(figsize=(20,15))
plt.bar(range(len(count_list)), count_list,color=‘r’,tick_label=zone_list,facecolor=’#9999ff’,edgecolor=‘white’)
plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)
plt.legend()
plt.title(’’’《青春有你2》参赛选手’’’,fontsize = 24)
plt.savefig(’/home/aistudio/work/result/bar_result.jpg’)
plt.show()
No handles with labels found to put in legend.
109
[‘中国湖北’, ‘中国四川’, ‘中国山东’, ‘中国浙江’, ‘中国山东’, ‘中国台湾’, ‘中国陕西’, ‘中国广东’, ‘中国黑龙江’, ‘中国上海’, ‘中国四川’, ‘中国山东’, ‘中国安徽’, ‘中国安徽’, ‘中国安徽’, ‘中国北京’, ‘中国贵州’, ‘中国吉林’, ‘中国四川’, ‘中国四川’, ‘中国江苏’, ‘中国山东’, ‘中国山东’, ‘中国山东’, ‘中国山东’, ‘中国江苏’, ‘中国四川’, ‘中国山东’, ‘中国山东’, ‘中国广东’, ‘中国浙江’, ‘中国河南’, ‘中国安徽’, ‘中国河南’, ‘中国北京’, ‘中国北京’, ‘马来西亚’, ‘中国湖北’, ‘中国四川’, ‘中国天津’, ‘中国黑龙江’, ‘中国四川’, ‘中国陕西’, ‘中国辽宁’, ‘中国湖南’, ‘中国上海’, ‘中国贵州’, ‘中国山东’, ‘中国湖北’, ‘中国黑龙江’, ‘中国黑龙江’, ‘中国上海’, ‘中国浙江’, ‘中国湖南’, ‘中国台湾’, ‘中国台湾’, ‘中国台湾’, ‘中国台湾’, ‘中国山东’, ‘中国北京’, ‘中国北京’, ‘中国浙江’, ‘中国河南’, ‘中国河南’, ‘中国福建’, ‘中国河南’, ‘中国北京’, ‘中国山东’, ‘中国四川’, ‘中国安徽’, ‘中国河南’, ‘中国四川’, ‘中国湖北’, ‘中国四川’, ‘中国陕西’, ‘中国湖南’, ‘中国四川’, ‘中国台湾’, ‘中国湖北’, ‘中国广西’, ‘中国江西’, ‘中国湖南’, ‘中国湖北’, ‘中国北京’, ‘中国陕西’, ‘中国上海’, ‘中国四川’, ‘中国山东’, ‘中国辽宁’, ‘中国辽宁’, ‘中国台湾’, ‘中国浙江’, ‘中国北京’, ‘中国黑龙江’, ‘中国北京’, ‘中国安徽’, ‘中国河北’, ‘马来西亚’, ‘中国四川’, ‘中国湖南’, ‘中国台湾’, ‘中国广东’, ‘中国上海’, ‘中国四川’, ‘日本’, ‘中国辽宁’, ‘中国黑龙江’, ‘中国浙江’, ‘中国台湾’]
[‘中国湖北’, ‘中国四川’, ‘中国山东’, ‘中国浙江’, ‘中国台湾’, ‘中国陕西’, ‘中国广东’, ‘中国黑龙江’, ‘中国上海’, ‘中国安徽’, ‘中国北京’, ‘中国贵州’, ‘中国吉林’, ‘中国江苏’, ‘中国河南’, ‘马来西亚’, ‘中国天津’, ‘中国辽宁’, ‘中国湖南’, ‘中国福建’, ‘中国广西’, ‘中国江西’, ‘中国河北’, ‘日本’]
[6, 14, 13, 6, 9, 4, 3, 6, 5, 6, 9, 2, 1, 2, 6, 2, 1, 4, 5, 1, 1, 1, 1, 1]
In[19]
import matplotlib.pyplot as plt
import numpy as np
import json
import matplotlib.font_manager as font_manager
import pandas as pd
#显示matplotlib生成的图形
%matplotlib inline
df = pd.read_json(‘data/data31557/20200422.json’)
#print(df)
grouped=df[‘name’].groupby(df[‘zone’])
s = grouped.count()
zone_list = s.index
count_list = s.values
plt.rcParams[‘font.sans-serif’] = [‘SimHei’] # 指定默认字体
plt.figure(figsize=(20,15))
plt.bar(range(len(count_list)), count_list,color=‘r’,tick_label=zone_list,facecolor=’#9999ff’,edgecolor=‘white’)
plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)
plt.legend()
plt.title(’’’《青春有你2》参赛选手’’’,fontsize = 24)
plt.savefig(’/home/aistudio/work/result/bar_result02.jpg’)
plt.show()
No handles with labels found to put in legend.
请在下面完成作业,对选手体重分布进行可视化,绘制饼状图
In[ ]
In[ ]
、