学习笔记之——基于tensorflow的VESPCN

之前已经写了挺多的博文关于image 超分了,接下来研究一下video 超分。之前博文已经对VESPCN进行了理论的介绍(《学习笔记之——基于深度学习的图像超分辨率重构》)

之前做的超分都是基于pytorch的,这次这个项目是tensorflow的。。。。然后一开始学习超分的代码是cafe的。。。。。。本博文先对基于tensorflow的VESPCN做深入的剖析,然后再移植到之前的代码库中,用pytorch实现。

学习笔记之——基于tensorflow的VESPCN_第1张图片

 

 

本博文主要参考代码:https://github.com/zhxl0903/CSCD94_VESPCN

数据集放于文件train中,测试集放于test文档中。

注释并作一定修改的代码如下(部分注释与修改来自课题组的师弟哈~):

main.py

import tensorflow as tf
from model import ESPCN
import os
os.environ["CUDA_VISIBLE_DEVICES"] = '5'

"""
    执行main函数之前首先进行flags的解析,
    也就是说TensorFlow通过设置flags来传递the required parameters to the tf.app.run()in the main.py
    也就是超参数的人为设置,然后存放在 FLAGS 中
    参数如下:
"""
flags = tf.app.flags
FLAGS = flags.FLAGS

"""
       参数名称           默认值             描述
    1.  epoch             1200             1个epoch表示过了1遍训练集中的所有样本,这里表示一共训练1200次
    2.  image_size        32               读入图片的尺寸(不是原图尺寸,而是网络入口要求的图片尺寸(数据子图),见详解
    3.  c_dim             3                图片通道数,一般RGB因此为3
    4.  train_mode        0                作者在此项目中实现了不同的网络训练模型,此参数是各模型代号(0~6)
    5.  scale             3                用于预处理输入图像的尺度因子的大小,即缩小比例
    6.  stride            100              步长,用于裁剪原图生成数据子图,见详解
    7.  checkpoint_dir    checkpoint       文件名,用于(暂时)存放训练所得模型参数
    8.  learning_rate     0.0001           学习速度
    9.  batch_size        128              1次迭代所使用的样本量,即一次抓取多少图片(不是原图,是裁剪过后的数据子图)
    10. result_dir        result           文件名,用于存放结果【不很重要】
    11. test_img          ‘ ’              【不清楚】
    12. load_existing_data False           判断hf数据是否被加载【暂不明白】
"""
#         第一个是参数名称,   第二个参数是默认值,   第三个是参数描述
flags.DEFINE_integer("epoch",          1200,           "Number of epoch")
flags.DEFINE_integer("image_size",     32,             "The size of image input")
flags.DEFINE_integer("c_dim",          3,              "The size of channel")
flags.DEFINE_boolean("is_train",       True,          "if training")
flags.DEFINE_integer("train_mode",     2,
                     "0: Spatial Transformer       1: 9-L Single-Frame ESPCN    2: 9L-E3-MC VESPCN \
                      3: Bicubic(No Training Required)          4: SRCNN \
                      5: Multi-Dir mode for testing mode 2       6: Multi-Dir mode for testing mode 1 \
                      7: FSRCNN ")
flags.DEFINE_integer("scale",          3,              "the size of scale factor for preprocessing input image")
flags.DEFINE_integer("stride",         100,            "the size of stride")
flags.DEFINE_string("checkpoint_dir",  "checkpoint",   "Name of checkpoint directory")
flags.DEFINE_float("learning_rate",    1e-5 ,          "The learning rate")
flags.DEFINE_integer("batch_size",     128,            "the size of batch")
flags.DEFINE_string("result_dir",      "result",       "Name of result directory")
flags.DEFINE_string("test_img",        "",             "test_img")
flags.DEFINE_boolean("load_existing_data",    False,
                     "True iff existing hf data is loaded for training/testing")


def main(_):

    """
    设置配置并启用GPU内存分配增长,tf.ConfigProto()用以配置Session运行参数
    当其参数allow_growth设置为True时,分配器将不会指定所有的GPU内存,而是动态申请显存
    """
    config = tf.ConfigProto()
    config.gpu_options.allow_growth = True
    
    # 检查训练模式是否为3、5或6,is_train是否开启
    # 因为mode3\mode5\mode6是不用训练的,若在这些模式下要求训练,则直接退出
    if FLAGS.train_mode == 3 and FLAGS.is_train:
        print('Error: Bicubic Mode does not require training')
        return
    elif FLAGS.train_mode == 5 and FLAGS.is_train:
        print('Error: Multi-Dir testing mode for Mode 2 does not require training')
        return
    elif FLAGS.train_mode == 6 and FLAGS.is_train:
        print('Error: Multi-Dir testing mode for Mode 1 does not require training')
        return

    """ 
        接下来执行会话,初始化ESPCN对象,开始训练或测试" \
        ESPCN对象:
            1. 基于OOP思想,本项目绝大多数与神经网络有关的超参数、操作都被封装于一个ESPCN类的对象中
            2. ESPCN对象被创建后,会自动依据传入的超参数,进行对应mode的网络的构建
            3. 随后执行train()函数,进行训练/测试 + 保存结果等一系列操作(函数名虽然是train,也可以用于测试)
    """
   # 给Session配置运行参数
    with tf.Session(config=config) as sess:
        # 使用传递进来的人工设定的参数初始化ESPCN对象
        espcn = ESPCN(sess,  #会话信息
                      image_size=FLAGS.image_size,  # 图片尺寸
                      is_train=FLAGS.is_train,      # 是否训练模式
                      train_mode=FLAGS.train_mode,  # 何种训练模式
                      scale=FLAGS.scale,            # 尺度
                      c_dim=FLAGS.c_dim,            # 图片通道数
                      batch_size=FLAGS.batch_size,  # 单次抓取数据量
                      load_existing_data=FLAGS.load_existing_data, # 数据是否读入
                      config=config                 # 会话参数
                      )
        # 开始训练,将所需各参数传递进去

        espcn.train(FLAGS)


if __name__ == '__main__':
    
    # 解析命令行参数;然后调用主函数
    tf.app.run() 

model.py

 

 

 

 

 

 

 

训练时要保证

flags.DEFINE_boolean("is_train",       True,          "if training")

训练的模式

("train_mode", 0, "0: Spatial Transformer 1: 9-L Single-Frame ESPCN\
                     2: 9L-E3-MC VESPCN 3: Bicubic (No Training Required) 4: SRCNN \
                     5: Multi-Dir mode for testing mode 2 6: Multi-Dir mode \
                     for testing mode 1")

 

 

 

补充

关于tf.app.run() 

if __name__ == '__main__':
    tf.app.run() 

处理flag解析,然后执行main函数,而flag解析就是输入的参数

https://blog.csdn.net/helei001/article/details/51859423

关于VESPCN参考https://blog.csdn.net/Cyiano/article/details/78368263?locationNum=4&fps=1

你可能感兴趣的:(超分辨率重建,TensorFlow)