标准差归一化的python实现

标准差归一化的处理实现

在数据的归一化的处理中,用到的较多的方法就是标准差归一化。

什么是标准差归一化

通过计算一组数据的标准差和均值来达到将数据能够映射到[0,1],或是[-1,1]的范围内。这种归一化的方式能够使不同数量级的数据都映射到同一个范围内,有利于后续的数据分析。

标准差的实现

标准差是方差的算术平方根,能够反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
通过numpy库中的 std 函数实现标准差的计算。

item_std = numpy.std(a, axis=None, dtype=None, out=None, ddof=0)

'''
a: array_like,需计算标准差的数组
axis: int, 可选,计算标准差的轴。默认情况是计算扁平数组的标准偏差。
dtype: dtype, 可选,用于计算标准差的类型。对于整数类型的数组,缺省值为Float 64,对于浮点数类型的数组,它与数组类型相同。
out: ndarray, 可选,将结果放置在其中的替代输出数组。它必须具有与预期输出相同的形状,但如果有必要,类型(计算值的类型)将被转换。
ddof: int, 可选,Delta的自由度。一般选择ddof = 1,使用无偏样本标准差
'''

均值的实现

均值即为平均数,通过numpy库中的 mean 函数实现。

item_mean = numpy.mean(a, axis, dtype, out,keepdims)

'''
以对矩阵就均值为例
axis 不设置值,对 m*n 个数求均值,返回一个实数
axis = 0 :压缩行,对各列求均值,返回 1* n 矩阵
axis = 1 :压缩列,对各行求均值,返回 m *1 矩阵
'''

标准差归一化的实现

import numpy as np

item = [1, 2, 3, 4, 5]
item_mean = np.mean(item)
item_std = np.std(item, ddof=1)
item = [((j - item_mean) / item_std) for j in item]
print(item)

'''
输出
[-1.2649110640673518, -0.6324555320336759, 0.0, 0.6324555320336759, 1.2649110640673518]
'''

你可能感兴趣的:(python,numpy,开发语言)