偏态数据处理

对于需要正态分布的数据模型建模时,如何取得正态分布的数据或者与正态分布没有严重偏差的数据,对于现实生活中的数据来说,基本不会按照我们的意愿进行数据的直接使用,即使使用归一化与标准化处理,那下面几种方法无疑给我们解决了这一问题。
描述数据峰态偏态的数据量为峰度偏度,改善数据的峰度与偏度无疑使得我们的数据更加规整,更加利于建模
对数变换:适用于相乘关系的数据、高度偏态的数据
平方根变换:适用于泊松分布(方差与均数近似相等)的数据、轻度偏态的数据
反正弦变换:适用于百分比的数据、中度偏态的数据
倒数变换1/x:适用于两端波动较大的数据

你可能感兴趣的:(数据挖掘算法,数据分析,数据挖掘)