数据质量管理_第四篇 对数变换

目录

  • 1. 对数变换 log transformation
  • 2. 数据取对数的原因
  • 3. 取对数的意义
  • 4. 计算公式

1. 对数变换 log transformation

对数变换是一种特殊的数据变换方式,它可以将一类理论上未解决的模型问题转化为已经解决的问题。

2. 数据取对数的原因

基于对数函数在其定义域内是单调递增函数。取对数后不会改变数据的相对关系。它们的主要作用在于它能帮助稳定方差,始终保持分布接近于正态分布并使得数据与分布的平均值无关。

3. 取对数的意义

  • 缩小数据的绝对数值,方便计算
  • 取对数后,可以将乘法计算转换为加法计算
  • 某些情况下,在数据的整个值域中的不用区间的差异带来的影响不同
  • 取对数后,不会改变数据的性质和相关关系,但压缩了变量的尺度。

4. 计算公式

在这里插入图片描述
Log变换倾向于拉伸那些落在较低的幅度范围内自变量值的范围,压缩或减少较高幅度范围内的自变量值的范围。从而使得倾斜分布尽可能的接近正态分布。
参考链接:https://www.zhihu.com/question/22012482

你可能感兴趣的:(数据质量)