梅飞飞飞的假期学习日记DAY5

在重新回归到了深度学习状态后,今天我打算继续回归到当时的聚类工作,将工作的进度与该本书的学习同步进行

回归问题处理方法回顾

利用波士顿房价数据集再次对预测连续值,如气象值这类的问题进行熟悉

1 加载训练数据和对应标签值

from tensorflow.keras.datasets import boston_housing
(train_data, train_targets), (test_data, test_targets) = boston_housing.load_data())

2 数据标准化

mean = train_data.mean(axis=0)
train_data -= mean
std = train_data.std(axis=0)
train_data /= std
test_data -= mean
test_data /=std

从原数据集中计算得到均值和标准差,并利用从原数据集计算出的这些值完成标准化

3 构建模型

def build_model():
    model = keras.Sequential([
        layers.Dense(64, activation="relu"),
        layers.Dense(64, activation="relu"),
        layers.Dense(1)
])
    model.compile(optimizer="rmsprop", loss="mse", metrics=["mae"])
    return model

由于此处是预测一个值波动较大,且值区间也较大的数值,所以我们不在最后一层加激活函数sigmoid

其次,在回归问题中我们经常会使用"mse"来判断预测值和标准值之差的平方,这是在回归问题中常用的损失函数,并且利用mae评价指标来判断预测值和实际值的差异情况

其次就是当数据集过少的时候,我们可以考虑K折交叉验证方法来尽可能的减小因为数据集样本数量少产生的影响

你可能感兴趣的:(学习,深度学习)