精神小伙python小白用python可视化分析青春有你2小姐姐有关数据

精神小伙可视化分析青春有你2小姐姐数据

      • 数据分析之路
      • 女孩子的体重,那可是大忌啊!!!
      • 青春有你小姐姐身高数据
      • 美女盛产地
      • 星座
      • 评论大赏
      • 小白分享:
        • 资料搜集
        • 地址:
        • 体重
        • 星座

大家好这里是三岁,python届的小白,今天的精神小伙,再被青春有你2练习生“折磨”了一周后我准备反击!!!

数据分析之路

问:你问什么要分析《青春有你2》的小姐姐们?
回:不,我不想,不要问为什么,问就是我不想

青春有你2,一共有109位练习生,(不要问他们是干什么的,我也不知道)
接下来看看他们的有关数据⑧!!!

女孩子的体重,那可是大忌啊!!!

三岁给你的一天一个分手小技巧:
哎,兄嘚,感觉你今天又又又胖了,不不不不是根据,就是!!!
快试试吧,医院的网速挺快的!!!

话不多说上图:
精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第1张图片
emmm,这就是传说中的女孩子嫌弃自己体重的原因?吃起东西真香,一称体重,我的天,以后再也不吃了!!!

这种也是要看身高的,给大家一个机会

青春有你小姐姐身高数据

精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第2张图片
最高的175 ,最低的158,众数168
那些四舍五入两米的小姐姐们不要说自己矮了,给小编这种四舍五入一米的一个面子

不要说什么矮了,胖了,只要自己不嫌弃自己就行,如果自己嫌弃自己了,那那那你加油!

美女盛产地

古话说的好:江南盛产美女,不知道现在盛不盛产“练习生”,看看青春有你2的练习生都来自哪里!
上图
精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第3张图片

鸭,结果一目了然,湖北夺冠啦,每个地方的小姐姐都不少呦!

星座

再来看看星座,什么星座在青春有你2中特别多
精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第4张图片
在这里面最多的是狮子座,其次是摩羯座,emmm

评论大赏

小编爬取了,青春有你2在爱奇艺的评论,共搜集了1483条,得到以下数据
精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第5张图片
评论区出现的最多的几个词汇

精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第6张图片
以上数据源于评论区,涉及到数据处理,清洗等过程,不能够代表什么,只是一个较为直观的表现形式。

emmm,我看到了,喻言,然后想到了《冰糖炖雪梨》喻言
我的天
什么情况
精神小伙python小白用python可视化分析青春有你2小姐姐有关数据_第7张图片
图片源于网络

然后我爬取了所有小姐姐的图 一共482张(其实是作业要求)
我找找这里是哪个小姐姐
在这里插入图片描述
在这里插入图片描述
这就是喻言嗯,看了这么多小姐姐的照片发现,都长一个样[捂脸]

那么就到这里吧,啥也不是,就这样了,再见!!!

小白分享:

数据可视化分为以下几个步骤

  1. 明确目标,确定方向
  2. 搜集数据,整理资料
  3. 数据清洗,汇总
  4. 可视化
  5. 总结

以上是小白三岁在百度飞桨课堂的作业及课外拓展,接下来对几个重要的点进行分析

资料搜集

分为文献资料,网络资料……
这里就是小姐姐们的数据,图片,评论……
都是源于网络,一般使用爬虫

  • 小白爬虫专用:requests
  • 数据解析:bs4库 (资料参考),json
  • 抓包:开发者工具,network

关于小姐姐照片爬取和数据爬取可以点击下面链接查看
飞桨学院Python小白逆袭大神第二天《青春有你2》练习生照片爬取

至于数据分析,可视化就看这里吧

上面会获得一个json文件,里面有我们要的
身高、 体重、星座、地址等信息
我们那地址和体重进行解析,算了再来一个星座吧

地址:

import matplotlib.pyplot as plt
import numpy as np 
import json
import matplotlib.font_manager as font_manager
import pandas as pd

df = pd.read_json('data/data31557/20200422.json')
# print(df)

grouped=df['name'].groupby(df['zone'])
s = grouped.count()

zone_list = s.index
count_list = s.values
print('s',s)
print('zone:',zone_list)
print('cont:',count_list)

# 设置显示中文
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体

plt.figure(figsize=(20,15))

plt.bar(range(len(count_list)), count_list,color='r',tick_label=zone_list,facecolor='#9999ff',edgecolor='white')

# 这里是调节横坐标的倾斜度,rotation是度数,以及设置刻度字体大小
plt.xticks(rotation=45,fontsize=20)
plt.yticks(fontsize=20)

plt.legend()
plt.title('''《青春有你2》参赛选手''',fontsize = 24)
plt.savefig('/home/aistudio/work/result/bar_result02.jpg')
plt.show()

就可以获得上面的地址图

体重

import matplotlib.pyplot as plt
import numpy as np 
import json
import matplotlib.font_manager as font_manager
import pandas as pd
import math

#显示matplotlib生成的图形
%matplotlib inline


df = pd.read_json('data/data31557/20200422.json')

grouped=df['name'].groupby(df['weight'])
s = grouped.count().sort_values()

# print(s)
weight_list = s.index
count_list = s.values

name_list = ['<45kg', '45kg~50kg', '50kg~55kg', '>55kg']
explode=[0,0.1,0,0]
color=['RoyalBlue','orange','brown','green','red']
plt.axes(aspect='equal')
plt.rcParams['font.sans-serif'] = ['SimHei']

plt.pie(x=weight_list,labels=count_list,autopct='%.1f%%',
explode =explode, colors=color, shadow=True, labeldistance=1.1, startangle = 90,pctdistance = 0.6)

#plt.title('''《青春有你2》参赛选手''',fontsize = 24)
plt.savefig('/home/aistudio/work/result/pie_result.png')
plt.show()

星座

import matplotlib.pyplot as plt
import pandas as pd


df = pd.read_json('20200423.json',encoding='utf-8')
# print(df)

grouped=df['name'].groupby(df['constellation'])
s = grouped.count()
print(s)

constellation_list = s.index
count_list = s.values
print('s',s)
print('height:',constellation_list)
print('cont:',count_list)
#
# 设置显示中文
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体

plt.figure(figsize=(20,15))
plt.title('青春有你选手星座统计',fontsize = 24)
plt.plot(constellation_list, count_list, label = '星座', color = 'red', linewidth = 5)
plt.xticks(constellation_list)
plt.show()

好了,就到这里吧!!!
关注我!一天一个分手小技巧[坏笑]

你可能感兴趣的:(总结)