几种统计图表的作用和区别

直方图展示数据的分布,柱状图比较数据的大小。直方图X轴为定量数据,柱状图X轴为分类数据。因此,直方图上的每根柱子都是不可移动的,X轴上的区间是连续的、固定的。而柱状图上的每根柱子是可以随意排序的,有的情况下需要按照分类数据的名称排列,有的则需要按照数值的大小排列。直方图柱子无间隔,柱状图柱子有间隔直方图柱子宽度可不一,柱状图柱子宽度须一致。柱状图柱子的宽度因为没有数值含义,所以宽度必须一致。但是在直方图中,柱子的宽度代表了区间的长度,根据区间的不同,柱子的宽度可以不同,但理论上应为单位长度的倍数。

密度图,它是通过计算“可能会产生观测数据的连续概率分布的估计”而产生。一般的过程是将该分布近似为一组核(诸如正态(高斯)分布之类的较为简单的分布)。因此密度图也被称作KDE(Kernel Density Estimate,核密度估计)图。

Series和DataFrame的线型图、柱状图、密度图都可以通过Series.plot,DataFrame.plot来画,plot函数基本的参数有kind,style,alpha
而要画直方图,需要Series.hist,DataFrame.hist函数来画,基本的参数有bins,color,alpha
而画散布图,需要plt.scatter函数来画,基本的参数有X轴数据(某一列的特征),Y轴数据(某一列特征),color,alpha

你可能感兴趣的:(几种统计图表的作用和区别)