Python 中的 numpy 包 和 pandas 包都能够计算均值、方差等,本文总结一下它们的用法。
#1. Numpy 计算均值、方差、标准差
一般的均值可以用 numpy 中的 mean 方法求得:
>>> import numpy as np
>>> a = [5, 6, 16, 9]
>>> np.mean(a)
9.0
numpy 中的 average 方法不仅能求得简单平均数,也可以求出加权平均数。average 里面可以跟一个 weights 参数,里面是一个权数的数组,例如:
>>> np.average(a)
>>> 9.0
>>> np.average(a, weights = [1, 2, 1, 1])
>>> 8.4
计算方差时,可以利用 numpy 中的 var 函数,默认是总体方差(计算时除以样本数 N),若需要得到样本方差(计算时除以 N - 1),需要跟参数 ddo f= 1,例如
>>> import pnumpy as np
>>> a = [5, 6, 16, 9]
>>> np.var(a) # 计算总体方差
18.5
>>> np.var(a, ddof = 1) # 计算样本方差
24.666666666666668
>>> b = [[4, 5], [6, 7]]
>>> b
[[4, 5], [6, 7]]
>>> np.var(b) # 计算矩阵所有元素的方差
1.25
>>> np.var(b, axis = 0) # 计算矩阵每一列的方差
array([1., 1.])
>>> np.var(b, axis = 1) # 计算矩阵每一行的方差
array([0.25, 0.25])
计算标准差时,可以利用 numpy 中的 std 函数,使用方法与 var 函数很像,默认是总体标准差,若需要得到样本标准差,需要跟参数 ddof =1,
>>> import pnumpy as np
>>> a = [5, 6, 16, 9]
>>> np.std(a) # 计算总体标准差
4.301162633521313
>>> np.std(a, ddof = 1 ) # 计算样本标准差
4.96655480858378
>>> np.std(b) # 计算矩阵所有元素的标准差
1.118033988749895
>>> np.std(b, axis = 0) # 计算矩阵每一列的标准差
array([1., 1.])
>>> np.std(b, axis = 1) # 计算矩阵每一列的标准差
array([0.5, 0.5])
#2. Pandas 计算均值、方差、标准差
对于 pandas ,也可以用里面的 mean 函数可以求得所有行或所有列的平均数,例如:
>>> import pandas as pd
>>> df = pd.DataFrame(np.array([[85, 68, 90], [82, 63, 88], [84, 90, 78]]), columns=['统计学', '高数', '英语'], index=['张三', '李四', '王五'])
>>> df
统计学 高数 英语
张三 85 68 90
李四 82 63 88
王五 84 90 78
>>> df.mean() # 显示每一列的平均数
统计学 83.666667
高数 73.666667
英语 85.333333
dtype: float64
>>> df.mean(axis = 1) # 显示每一行的平均数
张三 81.000000
李四 77.666667
王五 84.000000
dtype: float64
若要得到某一行或某一列的平均值,则可以使用 iloc 选取改行或该列数据,后面跟 mean 函数就能得到,例如:
>>> df
统计学 高数 英语
张三 85 68 90
李四 82 63 88
王五 84 90 78
>>> df.iloc[0, :].mean() # 得到第 1 行的平均值
81.0
>>> df.iloc[:, 2].mean() # 得到第 3 列的平均值
85.33333333333333
pandas 中的 var 函数可以得到样本方差(注意不是总体方差),std 函数可以得到样本标准差,若要得到某一行或某一列的方差,则也可用 iloc 选取某行或某列,后面再跟 var 函数或 std 函数即可,例如:
>>> df.var() # 显示每一列的方差
统计学 2.333333
高数 206.333333
英语 41.333333
dtype: float64
>>> df.var(axis = 1) # 显示每一行的方差
张三 133.000000
李四 170.333333
王五 36.000000
dtype: float64
>>> df.std() # 显示每一列的标准差
统计学 1.527525
高数 14.364308
英语 6.429101
dtype: float64
>>> df.std(axis = 1) # 显示每一行的标准差
张三 11.532563
李四 13.051181
王五 6.000000
dtype: float64
>>> df.iloc[0, :].std() # 显示第 1 行的标准差
11.532562594670797
>>> df.iloc[:, 2].std() # 显示第 3 列的标准差
6.429100507328636
在此疾速成长的科技元年,编程就像是许多人通往无限可能世界的门票。而在编程语言的明星阵容中,Python就像是那位独领风 骚的超级巨星, 以其简洁易懂的语法和强大的功能,脱颖而出,成为全球最炙手可热的编程语言之一。
Python 的迅速崛起对整个行业来说都是极其有利的 ,但“人红是非多
”,导致它平添了许许多多的批评,不过依旧挡不住它火爆的发展势头。
为了帮助大家更好的学习Python,小编给大家准备了一份Python学习资料,里面的内容都是适合零基础小白的笔记和资料,不懂编程也能听懂、看懂,需要获取方式:点击这里【 Python全套资料】 即可获取。
CSDN大礼包:《Python开发全套学习笔记/实战项目/安装工具》免费分享
Python学习路线汇总
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
Python必备开发工具
精品Python学习书籍
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
温馨提示:篇幅有限,已打包文件夹,获取方式:点击这里【 Python全套资料】 即可获取。
CSDN大礼包:《Python开发全套学习笔记/实战项目/安装工具》免费分享
Python学习视频600合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
100道Python练习题
面试刷题
实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
Python副业兼职与全职路线
获取方式:点击这里【 Python全套资料】 或扫描下方即可获取。
CSDN大礼包:《Python开发全套学习笔记/实战项目/安装工具》免费分享