2021-04-23

首先,Train_data.skew()计算出每个特征的偏度值(峰度值同理)。图是直方图,展示离散型分组数据的分布情况。至于为什么要把所有特征的偏度值放到一张直方图上,是为了告诉我们 我们手里的这些特征的偏度分布情况,根据图能看出,大部分特征偏度集中在0附近,说明大部分特征分布对称,没有问题。当然也存在偏度异常情况,针对偏移严重的数据

你可能感兴趣的:(2021-04-23)