基本统计分析又叫描述性统计分析,一般统计某个变量的最小值,第一个四分位值,中值,第三个四分位值以及最大值。
描述性统计分析函数为describe,该函数返回值有均值,标准差,最大值,最小值,分位数等。括号中可以带一些参数,如percentitles=[0.2,0.4,0.6,0.8]就是指定只计算0.2, 0.6, 0.8 分位数,而不是默认的1/4, 1/2, 3/4分位数。
常用的统计函数有:
import pandas as pd
df = pd.read_excel(r'/pylearn/examples/i_nuc.xls', sheet_name='Sheet7')
print(df)
print(df.数分.describe()) #查看 数分 列 的基本统计
print(df.describe()) # 查 各列 的基本统计
print(df.解几.size) #
print("最大值", df['解几'].max()) #
print("最小值",df['解几'].min()) #
print("求总和",df['解几'].sum()) #
print("求均值",df['解几'].mean()) #
print("求方差",df['解几'].var()) #
print("标准差",df['解几'].std()) #
"""
Numpy数组也可以使用mean函数计算样本均值,也可以使用average函数计算加权的样本均值
"""
#用mean函数计算“数分“的平均函数
import numpy as np
print(np.mean(df['数分']))
#还可以使用average函数计算“数分“的平均成绩
print(np.average(df['数分']))
#也可以使用pandas的DataFrame对象的mean方法求均值。
print(df['数分'].mean())
#计算中位数
print(df.median())
"""
对于定性数据来说,众数是出现次数最多的值,使用mode()计算众数。
"""
print(df.mode())