Pandas-DataFrame描述统计函数

测试数据采用豆瓣电影的部分数据
Pandas-DataFrame描述统计函数_第1张图片

求和

求投票人数的总和
在这里插入图片描述

求最值

求最高评分
在这里插入图片描述
求评分最高的电影信息
Pandas-DataFrame描述统计函数_第2张图片
求最低评分
在这里插入图片描述

获取最值索引

先将索引换成字母
Pandas-DataFrame描述统计函数_第3张图片
Pandas-DataFrame描述统计函数_第4张图片

中位数和平均数

Pandas-DataFrame描述统计函数_第5张图片

方差和标准差

方差和标准差可以看出数据的离散程度
Pandas-DataFrame描述统计函数_第6张图片

相关系数和协方差

相关系数可以判断两者的相关性,越接近1,相关性越强
Pandas-DataFrame描述统计函数_第7张图片
协方差
Pandas-DataFrame描述统计函数_第8张图片

计数

统计共有多少产地
先列出所有产地
在这里插入图片描述
计算产地总和
在这里插入图片描述
列出各个产地的电影数量
Pandas-DataFrame描述统计函数_第9张图片

describe()描述信息

describe()会自动计算所有数字类型的列的统计信息
count: 该列(行)非NA值的个数
mean :该列(行)的均值
std :    该列(行)的方差
25% : 上四分位数
50% :  非NA值的平均数
75% : 下四分位数
max :  最大值
Pandas-DataFrame描述统计函数_第10张图片
在进行数据统计的时候,有些数据是空值或非法的,这时候就需要进行数据清洗,参考上一篇DataFrame删除操作、空值处理

你可能感兴趣的:(数据分析,python,pandas,数据分析)