考研刚刚结束,本期我们通过分析各大高校考研招生信息数据,看看:
涉及到的库:
Pandas — 数据处理
Pyecharts — 数据可视化
可视化部分:
柱状图 — Bar
象形图 — PictorialBar
组合组件 — Grid
词云图 — stylecloud
目录
import re
import stylecloud
from PIL import Image
import numpy as np
import pandas as pd
from collections import Counter
from pyecharts.charts import Line,PictorialBar,Bar,Grid
from pyecharts import options as opts
from pyecharts.globals import ThemeType
from pyecharts.globals import SymbolType
from pyecharts.commons.utils import JsCode
df = pd.read_csv('考研信息.csv')
df.head(10)
df.info()
一共有44931条专业招生信息,学校名称、院系名称、专业代码列存在部分缺失值。
df.dropna(inplace=True)
df_2020 = df[df['年份'] == 2020]
df_2020.info()
2020年一共有17394条专业招生信息。
这里我们以学校名称和专业代码列为例:
df_2020.duplicated(subset=["学校名称","专业代码"]).sum()
武汉大学、吉林大学以超过200个研究生招生专业排名前两位,厦门大学、西南大学以180+专业数量分列第三、第四位,北京大学、四川大学、山东大学、复旦大学紧随其后,云南大学排名第九,南开大学以141个招生专业挤进前十。
此外,招生专业前十的学校中,双一流(985/211)学校占8所、非双一流(211)为2所(西南大学、云南大学)。
df_2020['专业名称'].value_counts()[:15].to_frame('数量')
从开设专业数量角度来看:计算机科学与技术、(专业学位)工商管理、(专业学位)会计、管理科学与工程、(专业学位)金融、(专业学位)法律(非法学)、(专业学位)法律(法学)、材料科学与工程、(专业学位)公共管理、机械工程、数学、(专业学位)英语笔译、设计学、统计学、环境科学与工程等专业的研究生招生学校比较多。
从分数要求来看:语言学及应用语言学、法语语言文学、社会保障教育经济与管理、日语语言文学、公共关系学、心理学、国民经济学、比较教育学、土地资源管理、中国语言文学、工业设计、语言学及应用语言学、中国现当代文学、日语语言文学等专业总分要求比较高,均在400分以上(总分500)。
按招生专业的平均分排序,可以看出:金融信息工程、高分子材料科学与工程、金融服务法、法学、经济、数学等学科的分数要普遍更高一些,最高分在380分以上,最低分在340左右。
‘清华大学’, ‘北京航空航天大学’, ‘东北大学’, ‘湖南大学’, ‘北京理工大学’, ‘广东工业大学’, ‘华南师范大学’,‘大连海事大学’, ‘华南理工大学’, ‘四川大学’, ‘上海交通大学’, ‘中国科学技术大学’, ‘东华大学’, ‘北京科技大学’, ‘中南财经政法大学’,‘哈尔滨工程大学’, ‘浙江大学’, ‘哈尔滨工业大学’, ‘重庆大学’, ‘苏州大学’
‘苏州大学’, ‘东北大学’, ‘华中科技大学’, ‘清华大学’, ‘武汉理工大学’, ‘西南交通大学’,‘华南理工大学’,‘湖南大学’, ‘暨南大学’, ‘河北工业大学’, ‘北京理工大学’, ‘武汉大学’, ‘北京航空航天大学’, ‘南京航空航天大学’,‘南京理工大学’, ‘东南大学’, ‘清华大学’, ‘厦门大学’, ‘北方工业大学’, ‘北京工业大学’
‘北京科技大学’, ‘中国海洋大学’, ‘对外经济贸易大学’, ‘暨南大学’, ‘武汉大学’, ‘北京交通大学’, ‘东南大学’,‘南京航空航天大学’, ‘南京大学’, ‘厦门大学’, ‘中国矿业大学’, ‘中国农业科学院’, ‘西南交通大学’,‘中国人民大学’, ‘吉林大学’, ‘南开大学’, ‘江西财经大学’, ‘上海大学’, ‘江苏大学’, ‘山东大学’
‘湖南大学’, ‘华中科技大学’, ‘北京理工大学’, ‘武汉理工大学’, ‘东南大学’, ‘郑州大学’,‘河北工业大学’,‘上海交通大学’, ‘河北师范大学’, ‘东北大学’, ‘重庆大学’, ‘东华大学’,‘复旦大学’, ‘深圳大学’, ‘江南大学’,‘清华大学’, ‘合肥工业大学’, ‘哈尔滨工业大学’, ‘天津大学’, ‘中山大学’
‘四川大学’, ‘武汉大学’, ‘南开大学’, ‘武汉大学’, ‘中国政法大学’, ‘中国政法大学’, ‘对外经济贸易大学’,‘浙江大学’, ‘浙江大学’, ‘中国人民大学’, ‘南开大学’, ‘吉林大学’, ‘吉林大学’, ‘吉林大学’, ‘复旦大学’, ‘武汉大学’, ‘华南理工大学’, ‘西南大学’, ‘中南财经政法大学’, ‘甘肃政法学院’
‘安徽工程大学’, ‘北京航空航天大学’, ‘上海交通大学’, ‘武汉理工大学’, ‘北京科技大学’, ‘东北大学’,‘北京理工大学’, ‘中南大学’, ‘重庆大学’, ‘哈尔滨工业大学’, ‘西南交通大学’, ‘华南理工大学’, ‘天津大学’,‘东南大学’, ‘苏州大学’, ‘湖南大学’, ‘同济大学’, ‘武汉大学’, ‘南京大学’, ‘郑州大学’
‘华中科技大学’, ‘西南交通大学’, ‘北京航空航天大学’, ‘上海交通大学’, ‘湖南大学’, ‘湖北师范大学’,‘北京工业大学’, ‘重庆大学’, ‘中南大学’, ‘哈尔滨工业大学’, ‘哈尔滨工程大学’, ‘南京航空航天大学’, ‘东北大学’,‘江苏大学’, ‘北京理工大学’, ‘同济大学’, ‘北京科技大学’, ‘中国矿业大学’, ‘中国科学技术大学’, ‘华东理工大学’
pic_name = '学校名称.png'
stylecloud.gen_stylecloud(
text=' '.join(s_list),
font_path=r'STXINWEI.TTF',
palette='cartocolors.qualitative.Bold_5',
max_font_size=100,
icon_name='fas fa-yen-sign',
background_color='#212529',
output_name=pic_name,
)
篇幅原因,部分代码未展示,如果需要可在下方获取,也可在线运行(含全部代码):
https://www.heywhale.com/mw/project/61dd05963debcb0022df70ab
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享(注明出处)让更多人知道。
Pandas+Pyecharts | 某直聘平台招聘信息数据可视化
Pandas+Pyecharts | 医院药品销售数据可视化
爬取《白蛇2:青蛇劫起》20000+影评数据分析可视化
可视化 | Python分析中秋月饼,这几种口味才是yyds!!!
123个Pandas常用基础指令,真香!
爬虫+可视化 | 动态展示2020东京奥运会奖牌世界分布
Pandas+Pyecharts | 北京某平台二手房数据分析+可视化
Pandas+Pyecharts | 2021中国大学综合排名分析+可视化
可视化 | Python绘制高颜值台风地理轨迹图
可视化 | 用Python分析近5000个旅游景点,告诉你假期应该去哪玩
可视化 | Python精美地图动态展示近20年全国各省市GDP
可视化 | Python陪你过520:在你身边,你在身边
爬虫 | Python送你王者荣耀官网全套皮肤
爬虫 | 用python构建自己的IP代理池,再也不担心IP不够用啦!
技巧 | 20个Pycharm最实用最高效的快捷键(动态展示)
技巧 | 5000字超全解析Python三种格式化输出方式【% / format / f-string】
技巧 | python定时发送邮件(自动添加附件)
爬虫 | Python送你王者荣耀官网全套皮肤
爬虫 | 用python构建自己的IP代理池,再也不担心IP不够用啦!
文章首发微信公众号 “Python当打之年” ,每天都有python编程技巧推送,希望大家可以喜欢