TensorFlow2入门到进阶—— 归一化实现

归一化有多种,最常用的就是最大最小值和正态分布归一化,下面将利用sklearn来实现数据归一化。

# x=(x-u)/std   符合正态分布

from sklearn.preprocessing import StandardScaler
#之前x_train为np.int型,所以先转为float32

scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(
    x_train.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)
x_valid_scaled = scaler.transform(
    x_valid.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)
x_test_scaled = scaler.transform(
    x_test.astype(np.float32).reshape(-1,1)).reshape(-1,28,28)

fit_transform()为归一化函数,要求输入为一维数组,并将记录均值和方差,所以第一次使用归一化时要调用这个函数,并将输入数据转换为1维数组。

transform()为归一化函数,但不记录均值和方差,使用之前的均值和方差,所以在第二次及以后归一化时直接调用该函数。

reshape(-1,1)表示将原数据转为n行1列的数组,-1根据原数组的数据量决定。

reshape(-1,28,28) :归一化之后再按照之前数据集的格式恢复。

你可能感兴趣的:(机器学习,智能计算,python)