箱型图

一、箱型图

1、是一种用作显示一组连续数据分散情况资料的统计图,因形状如箱子而得名。

2、它主要用于反映原始数据分布的特征,常可以进行按类分组的多组数据分布特征的比 较。

3、箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。箱须为四分位+或-1.5倍四分位。箱须外为离群值。

二、matplotlib实现

import pandas as pd

import matplotlib.pyplot as plt 

path = 'train.csv'

data= pd.read_csv(path,sep=',')

data.boxplot(column='ApplicantIncome',by='Education')

plt.show()

三、参数说明

column为dataframe数据的数据列

by为dataframe数据的分组列

你可能感兴趣的:(箱型图)