最近在做深度学习相关实验,经常要用到别人的预训练模型,有时候常常不知道怎么使用,因此这篇博客将专门做一个总结。
checkpoint
model.ckpt-200.data-00000-of-00001
model.ckpt-200.index
model.ckpt-200.meta
model.ckpt-200.meta文件保存的是图结构,通俗地讲就是神经网络的网络结构。一般而言网络结构是不会发生改变,所以可以只保存一个就行了。我们可以使用下面的代码只在第一次保存meta文件。
saver.save(sess, 'my-model', global_step=step,write_meta_graph=False)
并且还可以使用tf.train.import_meta_graph(‘model.ckpt-200.meta’)能够导入图结构。
model.ckpt-200.data-00000-of-00001
数据文件,保存的是网络的权值,偏置,操作等等。
model.ckpt-200.index是一个不可变得字符串表,每一个键都是张量的名称,它的值是一个序列化的BundleEntryProto。 每个BundleEntryProto描述张量的元数据:“数据”文件中的哪个文件包含张量的内容,该文件的偏移量,校验和,一些辅助数据等等。
Note: 以前的版本中tensorflow的model只保存一个文件中。
tf.train.Saver 类别提供了保存和恢复模型的方法。tf.train.Saver 构造函数针对图中所有变量或指定列表的变量将 save 和 restore op 添加到图中。Saver 对象提供了运行这些 op 的方法,指定了写入或读取检查点文件的路径。
一般而言,如果不指定任何参数,tf.train.Saver会保存所有的参数。下面是一个简单的例子,来自TensorFlow官网
# Create some variables.
v1 = tf.get_variable("v1", shape=[3], initializer = tf.zeros_initializer)
v2 = tf.get_variable("v2", shape=[5], initializer = tf.zeros_initializer)
inc_v1 = v1.assign(v1+1)
dec_v2 = v2.assign(v2-1)
# Add an op to initialize the variables.
init_op = tf.global_variables_initializer()
# Add ops to save and restore all the variables.
saver = tf.train.Saver()
# Later, launch the model, initialize the variables, do some work, and save the
# variables to disk.
with tf.Session() as sess:
sess.run(init_op)
# Do some work with the model.
inc_v1.op.run()
dec_v2.op.run()
# Save the variables to disk.
save_path = saver.save(sess, "/tmp/model.ckpt")
print("Model saved in path: %s" % save_path)
最后会将v1和v2以及op都保存下来。但是如果你只想保存v1和v2,你可以这样写。
tf.train.Saver(V1.values()+V2.values())
模型加载需要利用Saver.restore方法。可以加载固定参数,也可以加在所有参数。
saver.restore(sess,model_path)
具体的不一一介绍了,有兴趣的可以看一下参考的连接。
pre-trained 模型常用来做迁移学习,但是却存在一个限制,那就是网络的前一层必须是一致的,以vgg16为例,如果你利用前面几层提取特征,前面几层的网络必须得和vgg保持一致。而后面的网络参数是随机初始化的。
1.TensorFlow学习笔记(8)–网络模型的保存和读取
2.Tensorflow加载预训练模型和保存模型
3.TensorFlow, why there are 3 files after saving the model?