偏度(skewness)和峰度(kurtosis)

偏度

偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩。

偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏分布(也叫负偏分布,其偏度<0)。

偏度(skewness)和峰度(kurtosis)_第1张图片

Python代码实现方法:

pandas的Series 数据结构可以直接调用skew()方法来查看

df.iloc[:,1].skew()

峰度

峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。随机变量的峰度计算方法为:随机变量的四阶中心矩与方差平方的比值。

峰度包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)。注意,个别的软件会将峰度值减3,ArcGIS默认正态分布的峰度为3。MS Excel的计算公式与上面略有不同。

偏度(skewness)和峰度(kurtosis)_第2张图片

 

Python代码实现方法:

pandas的Series 数据结构可以直接调用kurt()方法来查看

df.iloc[:,1].kurt()

 

转载地址:https://blog.csdn.net/xbmatrix/article/details/69360167

你可能感兴趣的:(数据挖掘)