2021-11-26

1.卷积通道
多通道卷积


1.png

这是一个三通道图片的卷积计算,每一个通道对应一个卷积核的一个通道(三通道的卷积核为一个卷积核),三个通道分别卷积计算完成后再相加得到单通道的卷积结果。故有多少个卷积核进行计算,结果的图片就有多少个通道。

2.全连接层


2.png

全连接层是由前一层通过相同大小的卷积核进行卷积后相加得到的,多个通道组成一个一维向量。


3.png

4.png

3.softmax
全连接层或其它层,通过一维向量进行归一化概率,生成每个分类的概率

4.学习率 learning rate


5.PNG

学习率相当于梯度下降距离的权重,学习率越小,达到最值的迭代步数越多,学习率越大,可能会在最值点附近震荡,所以应先用大学习率进行训练,达到一定效果时再减小学习率,直到接近最值点。

  1. PSNR和SSIM
    PSNR:峰值信噪比(值越高,生成的图片效果越接近真实图片)


    8.PNG

    MAX:图像的灰度等级,一般是255

SSIM:结构相似性指标(可以更好的反映人眼的直观感受,值越大效果越好,最大为1)
结构相似度指标从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性。
将失真建模为亮度、对比度和结构三个不同因素的组合。
用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量。


9.PNG

6.感知损失Perceptual Loss
原论文包括特征重建损失和风格重建损失两部分,后续引用多只涉及特征重建损失。
即重建图像和真实图像在VGG16的池化层中输出的矩阵的对应元素差的平方和。


6.PNG

7.PNG

7.VGG16
https://dgschwend.github.io/netscope/#/preset/vgg-16

你可能感兴趣的:(2021-11-26)