深度学习——keras模型的保存和加载

深度学习——keras模型的保存和加载_第1张图片

​在上一篇关于深度学习的推文中,我们介绍了使用Keras来实现机器学习中的线性回归和非线性回归算法。不过在那期的推文当中我们没有介绍如何保存我们的训练的模型和加载我们训练的模型,所以在本次的推文中我们将向大家介绍一下Keras中如何进行模型的保存、加载和接着训练。

一、Keras模型的保存

我们将使用手写字体识别的案例来进行说明。

我们先看一下之前的代码:

from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense,Activation
path = r'F:\kerasdataset\mnist.npz'
(X_train, y_train), (X_test, y_test) = mnist.load_data(path)
X_train = X_train.reshape(len(X_train),-1)
X_test = X_test.reshape(len(X_test), -1)
X_train = X_train.astype('float32')/255
X_test = X_test.astype('float32')/255
y_train = np_utils.to_categorical(y_train)
y_test = np_utils.to_categorical(y_test)
model = Sequential()
model.add(Dense(512, input_shape=(28*28,),activation='relu'))
model.add(Dense(10,activation='softmax'))
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10, batch_size=64, verbose=1, validation_split=0.05)
loss, accuracy = model.evaluate(X_test, y_test)
Testloss, Testaccuracy = model.evaluate(X_test, y_test)
print('Testloss:', Testloss)
print('Testaccuracy:', Testaccuracy)

在Keras中,我们常用到的保存模型的方式有四种:

model.save()
model.save_weights()
model.to_json()
model.to_yaml()

1.1 model.save()

这种方法是将Keras模型和权重保存在一个HDF5文件中,具体的方法:

save_path = r'F:\kerasdataset\mnist_test.h5'
model.save(save_path)

我们只要在手写字体识别的代码最后加上上述代码即可。在上述的两行代码中我们设置了“mnist_test.h5”文件的保存路径,并且使用model.save()进行模型的保存。我们可以使用HDFView软件来打开这个保存的文件,如下所示。我们可以使用这个软件来查看模型中的dense和相应的权重信息:

深度学习——keras模型的保存和加载_第2张图片

当然了,除了这种方法以外,我们也可以使用代码来进行读取:

import h5py
# 模型地址
MODEL_PATH = r'F:\kerasdataset\mnist_test.h5'
# 获取每一层的连接权重及偏重
print("读取模型中...")
with h5py.File(MODEL_PATH, 'r') as f:
   dense_1 = f['/model_weights/dense_1/dense_1']
   dense_1_bias =  dense_1['bias:0'][:]
   dense_1_kernel = dense_1['kernel:0'][:]

   dense_2 = f['/model_weights/dense_2/dense_2']
   dense_2_bias = dense_2['bias:0'][:]
   dense_2_kernel = dense_2['kernel:0'][:]

print("第一层的连接权重矩阵:\n%s\n"%dense_1_kernel)
print("第一层的连接偏重矩阵:\n%s\n"%dense_1_bias)
print("第二层的连接权重矩阵:\n%s\n"%dense_2_kernel)
print("第二层的连接偏重矩阵:\n%s\n"%dense_2_bias)

1.2 model.save_weights()

这种也是获取网络权重的方法,其使用方法如下:

model_save_path =r'F:\kerasdataset\mnist_test.h5'
model.save_weights(model_save_path, by_name=True)

by_name这个参数有两种情况,默认为False:

by_name=False 的时候按照网络的拓扑结构来进行加载权重的。

by_name=True 的时候就是按照网络层名称进行加载权重的。

1.3 model.to_json()

这种方法只保存了模型结构,没有包含其权重信息,其使用方法如下:

json_save = model.to_json()
with open("modelsave.json", "w") as f:
  f.write(json_save)

JSON中的字符内容如下所示:

深度学习——keras模型的保存和加载_第3张图片

1.4 model.to_yaml()

这种方法和model.to_json()一样,其用法如下:

yaml_save = model.to_yaml()
with open("modelsave.yaml", "w") as f:
  f.write(yaml_save)

上述方法中,最常用的还是model.save() 和model.save_weights()两种方式。

二、Keras模型的加载

模型的加载很简单,我们对不同的保存方式进行不同的加载即可:

2.1 model.save()方式模型的加载

from keras.models import load_model
save_path = r'F:\kerasdataset\mnist_test.h5'
model = load_model(save_path)

2.2 model.save_weights()方式模型的加载

model_save_path =r'F:\kerasdataset\mnist_test.h5'
model = model.load_weights(model_save_path)

2.3 model.to_json()和model.to_yaml()方式模型的加载

from keras.models import model_from_json
from keras.models import model_from_yaml
model_json = model_from_json(json_save)
model_yaml = model_from_yaml(yaml_save)

我们来总结一下他们的区别:

深度学习——keras模型的保存和加载_第4张图片

三、Keras模型的继续训练

在实际的项目中,如果一个模型的训练时间很长(或者某种情况先要暂停),我们可以训练到某一个周期以后暂停模型的训练,等到需要的时候接着训练。那么这样的方案该怎么解决:

假设我们在模型的训练结尾使用

model.save(r'F:\kerasdataset\mnist_test.h5')

保存模型的操作。

接下来我们来看怎么继续加载这个模型进行训练,我们只需load后进行fit:

# 载入模型
model = load_model(r'F:\kerasdataset\mnist_test.h5')
# 继续训练模型2个epochs
model.fit(X_train, y_train, batch_size=64, epochs=2)

以上就是模型的加载和接着训练,下面如果要进行模型的评价和预测的话,可以参照手写字体识别的代码。

你可能感兴趣的:(深度学习,python,深度学习)