python 计算均值、方差、标准差 Numpy,Pandas

Python 中的 numpy 包 和 pandas 包都能够计算均值、方差等,本文总结一下它们的用法。
#1. Numpy 计算均值、方差、标准差
一般的均值可以用 numpy 中的 mean 方法求得:

	>>> import numpy as np

	>>> a = [5, 6, 16, 9]

	>>> np.mean(a)

	9.0

	 

numpy 中的 average 方法不仅能求得简单平均数,也可以求出加权平均数。average 里面可以跟一个 weights 参数,里面是一个权数的数组,例如:

	>>> np.average(a)

	>>> 9.0

	>>> np.average(a, weights = [1, 2, 1, 1])

	>>> 8.4

	 

计算方差时,可以利用 numpy 中的 var 函数,默认是总体方差(计算时除以样本数 N),若需要得到样本方差(计算时除以 N - 1),需要跟参数 ddo f= 1,例如

	>>> import pnumpy as np

	>>> a = [5, 6, 16, 9]

	>>> np.var(a) # 计算总体方差

	18.5

	 

	>>> np.var(a, ddof = 1) # 计算样本方差

	24.666666666666668

	 

	>>> b = [[4, 5], [6, 7]]

	>>> b

	[[4, 5], [6, 7]]

	 

	>>> np.var(b) # 计算矩阵所有元素的方差

	1.25

	 

	>>> np.var(b, axis = 0) # 计算矩阵每一列的方差

	array([1., 1.])

	 

	>>> np.var(b, axis = 1) # 计算矩阵每一行的方差

	array([0.25, 0.25])

	 

计算标准差时,可以利用 numpy 中的 std 函数,使用方法与 var 函数很像,默认是总体标准差,若需要得到样本标准差,需要跟参数 ddof =1,

	>>> import pnumpy as np

	>>> a = [5, 6, 16, 9]

	>>> np.std(a) # 计算总体标准差

	4.301162633521313

	 

	>>> np.std(a, ddof = 1 ) # 计算样本标准差

	4.96655480858378

	 

	>>> np.std(b) # 计算矩阵所有元素的标准差

	1.118033988749895

	 

	>>> np.std(b, axis = 0) # 计算矩阵每一列的标准差

	array([1., 1.])

	 

	>>> np.std(b, axis = 1) # 计算矩阵每一列的标准差

	array([0.5, 0.5])

	 

#2. Pandas 计算均值、方差、标准差
对于 pandas ,也可以用里面的 mean 函数可以求得所有行或所有列的平均数,例如:

	>>> import pandas as pd

	>>> df = pd.DataFrame(np.array([[85, 68, 90], [82, 63, 88], [84, 90, 78]]), columns=['统计学', '高数', '英语'], index=['张三', '李四', '王五'])

	>>> df

	    统计学  高数  英语

	张三   85  68  90

	李四   82  63  88

	王五   84  90  78

	 

	>>> df.mean() # 显示每一列的平均数

	 

	统计学    83.666667

	高数     73.666667

	英语     85.333333

	dtype: float64

	 

	>>> df.mean(axis = 1) # 显示每一行的平均数

	张三    81.000000

	李四    77.666667

	王五    84.000000

	dtype: float64

	 

若要得到某一行或某一列的平均值,则可以使用 iloc 选取改行或该列数据,后面跟 mean 函数就能得到,例如:

	>>> df

	    统计学  高数  英语

	张三   85  68  90

	李四   82  63  88

	王五   84  90  78

	 

	>>> df.iloc[0, :].mean()  # 得到第 1 行的平均值

	81.0

	 

	>>> df.iloc[:, 2].mean() # 得到第 3 列的平均值

	85.33333333333333

	 

pandas 中的 var 函数可以得到样本方差(注意不是总体方差),std 函数可以得到样本标准差,若要得到某一行或某一列的方差,则也可用 iloc 选取某行或某列,后面再跟 var 函数或 std 函数即可,例如:

	>>> df.var() # 显示每一列的方差

	统计学      2.333333

	高数     206.333333

	英语      41.333333

	dtype: float64

	 

	>>> df.var(axis = 1) # 显示每一行的方差

	张三    133.000000

	李四    170.333333

	王五     36.000000

	dtype: float64

	 

	>>> df.std() # 显示每一列的标准差

	统计学     1.527525

	高数     14.364308

	英语      6.429101

	dtype: float64

	 

	>>> df.std(axis = 1) # 显示每一行的标准差

	张三    11.532563

	李四    13.051181

	王五     6.000000

	dtype: float64

	 

	>>> df.iloc[0, :].std() # 显示第 1 行的标准差

	11.532562594670797

	 

	>>> df.iloc[:, 2].std() # 显示第 3 列的标准差

	6.429100507328636

题外话

在此疾速成长的科技元年,编程就像是许多人通往无限可能世界的门票。而在编程语言的明星阵容中,Python就像是那位独领风 骚的超级巨星, 以其简洁易懂的语法和强大的功能,脱颖而出,成为全球最炙手可热的编程语言之一。


Python 的迅速崛起对整个行业来说都是极其有利的 ,但“人红是非多”,导致它平添了许许多多的批评,不过依旧挡不住它火爆的发展势头。

​ 最后

为了帮助大家更好的学习Python,小编给大家准备了一份Python学习资料,里面的内容都是适合零基础小白的笔记和资料,不懂编程也能听懂、看懂,需要获取方式:点击这里【 Python全套资料】 即可获取。

CSDN大礼包:《Python开发全套学习笔记/实战项目/安装工具》免费分享

Python学习路线汇总

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。


​Python必备开发工具


精品Python学习书籍

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

温馨提示:篇幅有限,已打包文件夹,获取方式:点击这里【 Python全套资料】 即可获取。

CSDN大礼包:《Python开发全套学习笔记/实战项目/安装工具》免费分享

Python学习视频600合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

​​​100道Python练习题


面试刷题


​​​
实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

Python副业兼职与全职路线
在这里插入图片描述

​​​获取方式:点击这里【 Python全套资料】 或扫描下方即可获取。

CSDN大礼包:《Python开发全套学习笔记/实战项目/安装工具》免费分享

你可能感兴趣的:(python,均值算法,numpy,数据库,算法,开发语言,pandas)