问:你问什么要分析《青春有你2》的小姐姐们?
回:不,我不想,不要问为什么,问就是我不想
青春有你2,一共有109位练习生,(不要问他们是干什么的,我也不知道)
接下来看看他们的有关数据⑧!!!
三岁给你的一天一个分手小技巧:
哎,兄嘚,感觉你今天又又又胖了,不不不不是根据,就是!!!
快试试吧,医院的网速挺快的!!!
话不多说上图:
emmm,这就是传说中的女孩子嫌弃自己体重的原因?吃起东西真香,一称体重,我的天,以后再也不吃了!!!
这种也是要看身高的,给大家一个机会
最高的175 ,最低的158,众数168
那些四舍五入两米的小姐姐们不要说自己矮了,给小编这种四舍五入一米的一个面子
不要说什么矮了,胖了,只要自己不嫌弃自己就行,如果自己嫌弃自己了,那那那你加油!
古话说的好:江南盛产美女,不知道现在盛不盛产“练习生”,看看青春有你2的练习生都来自哪里!
上图
鸭,结果一目了然,湖北夺冠啦,每个地方的小姐姐都不少呦!
再来看看星座,什么星座在青春有你2中特别多
在这里面最多的是狮子座,其次是摩羯座,emmm
小编爬取了,青春有你2在爱奇艺的评论,共搜集了1483条,得到以下数据
评论区出现的最多的几个词汇
以上数据源于评论区,涉及到数据处理,清洗等过程,不能够代表什么,只是一个较为直观的表现形式。
emmm,我看到了,喻言,然后想到了《冰糖炖雪梨》喻言
我的天
什么情况
图片源于网络
然后我爬取了所有小姐姐的图 一共482张(其实是作业要求)
我找找这里是哪个小姐姐
这就是喻言嗯,看了这么多小姐姐的照片发现,都长一个样[捂脸]
那么就到这里吧,啥也不是,就这样了,再见!!!
数据可视化分为以下几个步骤
以上是小白三岁在百度飞桨课堂的作业及课外拓展,接下来对几个重要的点进行分析
分为文献资料,网络资料……
这里就是小姐姐们的数据,图片,评论……
都是源于网络,一般使用爬虫
requests
库bs4
库 (资料参考),json关于小姐姐照片爬取和数据爬取可以点击下面链接查看
飞桨学院Python小白逆袭大神第二天《青春有你2》练习生照片爬取
至于数据分析,可视化就看这里吧
上面会获得一个json文件,里面有我们要的
身高、 体重、星座、地址等信息
我们那地址和体重进行解析,算了再来一个星座吧
import matplotlib.pyplot as plt
import numpy as np
import json
import matplotlib.font_manager as font_manager
import pandas as pd
df = pd.read_json('data/data31557/20200422.json')
# print(df)
grouped=df['name'].groupby(df['zone'])
s = grouped.count()
zone_list = s.index
count_list = s.values
print('s',s)
print('zone:',zone_list)
print('cont:',count_list)
# 设置显示中文
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
plt.figure(figsize=(20,15))
plt.bar(range(len(count_list)), count_list,color='r',tick_label=zone_list,facecolor='#9999ff',edgecolor='white')
# 这里是调节横坐标的倾斜度,rotation是度数,以及设置刻度字体大小
plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)
plt.legend()
plt.title('''《青春有你2》参赛选手''',fontsize = 24)
plt.savefig('/home/aistudio/work/result/bar_result02.jpg')
plt.show()
就可以获得上面的地址图
import matplotlib.pyplot as plt
import numpy as np
import json
import matplotlib.font_manager as font_manager
import pandas as pd
import math
#显示matplotlib生成的图形
%matplotlib inline
df = pd.read_json('data/data31557/20200422.json')
grouped=df['name'].groupby(df['weight'])
s = grouped.count().sort_values()
# print(s)
weight_list = s.index
count_list = s.values
name_list = ['<45kg', '45kg~50kg', '50kg~55kg', '>55kg']
explode=[0,0.1,0,0]
color=['RoyalBlue','orange','brown','green','red']
plt.axes(aspect='equal')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.pie(x=weight_list,labels=count_list,autopct='%.1f%%',
explode =explode, colors=color, shadow=True, labeldistance=1.1, startangle = 90,pctdistance = 0.6)
#plt.title('''《青春有你2》参赛选手''',fontsize = 24)
plt.savefig('/home/aistudio/work/result/pie_result.png')
plt.show()
import matplotlib.pyplot as plt
import pandas as pd
df = pd.read_json('20200423.json',encoding='utf-8')
# print(df)
grouped=df['name'].groupby(df['constellation'])
s = grouped.count()
print(s)
constellation_list = s.index
count_list = s.values
print('s',s)
print('height:',constellation_list)
print('cont:',count_list)
#
# 设置显示中文
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体
plt.figure(figsize=(20,15))
plt.title('青春有你选手星座统计',fontsize = 24)
plt.plot(constellation_list, count_list, label = '星座', color = 'red', linewidth = 5)
plt.xticks(constellation_list)
plt.show()
好了,就到这里吧!!!
关注我!一天一个分手小技巧[坏笑]