数据处理中的中心化

数据处理中的中心化,就是将原数据减去平均值,得到新的数据,新的数据的平均值为0。

假设原数据是x(x可以是多维的),其平均值是\mu,新的数据{x}'=x-\mu,那么新数据{x}'的平均值是为0的。下面证明下:

假设数据的数量是N,那么

数据处理中的中心化_第1张图片

举例:设数据是2维的,原数据是(x,y),中心化以后的数据是(x2,y2):

x y x2 y2
10 8 9.75 8.375
6 -5 5.75 -4.625
-2 3 -2.25 3.375
-12 -16 -12.25 -15.625
1 0 0.75 0.375
0 6 -0.25 6.375
2 2 1.75 2.375
-3 -1 -3.25 -0.625
平均值 0.25 -0.375 0 0

你可能感兴趣的:(统计,数据处理)