案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作

案例---北京高考分数线统计分析

本案例主要的任务是对北京市近年来高考数据进行一些简单的操作,具体分析要求包括:

(1)一本文理科与二本文理科最高的分数线是多少?最低分数线是多少?相差多少分。

(2)今年与去年相比,一本文理科与二本文理科变化了多少分?

(3)求2006-2018年近13年每科分数线的平均值

解答:(1)

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第1张图片

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第2张图片

要求二者一样,这就需要传入对应的参数

df=pd.read_excel("地址内容",index_col=0,header=[0,1])#index_col=0,不需要默认索引,
#header=[0,1]表示第0行和第一行为标题

 接下来就是如何求取一本文理科与二本文理科最高的分数线是多少?最低分数线是多少?

很简单,直接使用df特有函数,max和min即可。

df.min()
df.max()

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第3张图片

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第4张图片

一本文理科与二本文理科的最高分与最低分相差多少,使用np的函数ptp(df)

print(np.ptp(s1,axis=0))#df为pd读取文件的对象,按着列读
print(np.ptp(s2,axis=1))

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第5张图片

 解答:(2)

今年与去年相比,一本文理科与二本文理科变化了多少分?

首先,需要提出第0行和第一行的内容

df.loc[[2018,2017]]

接着,之间使用ptp函数即可

s1=df.loc[[2018,2017]]
print(np.ptp(s1))

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第6张图片

解答:(3)

2006-2018年近13年每科分数线的平均值

df.describle()

案例1:北京高考分数线统计分析本案例主要的任务是对北京市近年来高考数据进行一些简单的操作_第7张图片

你可能感兴趣的:(大数据,python,数据分析,机器学习)