已经有了一个预训练的模型,我需要从其中取出某一层,把该层的weights和biases赋值到新的网络结构中,可以使用tensorflow中的pywrap_tensorflow(用来读取预训练模型的参数值)结合Session.assign()进行操作。
这种需求即预训练模型可能为单分支网络,当前网络为多分支,我需要把单分支A复用到到多个分支去(B,C,D)。
先导入对应的工具包
from tensorflow.python import pywrap_tensorflow
接下来的操作在一个tf.Session中进行
reader = pywrap_tensorflow.NewCheckpointReader(pre_train_model_path)
# 获取当前图可训练变量
trainable_variables = tf.trainable_variables()
# 需要赋值的当前网络层变量,这里只是随便起的名字。
restore_v_target_name = "fc_target"
# 需要的预训练模型中的某层的名字
restore_v_source_name = "fc_source"
for v in trainable_variables:
if restore_v_name == v.name:
# 回复weights和biases
sess.run(
tf.assign(v, reader.get_tensor(restore_v_source_name + "/weights"))) if "weights" in v.name else sess.run(
tf.assign(v, reader.get_tensor(restore_v_source_name + "/biases")))