卷王之王GTO

SinGAN学习笔记-未完

SinGan代码阅读记录

GAN
SinGAN
- SR.py
- 论文解读

GAN

传统GAN网络原理：使用一个已知分布（如高斯分布）去学习一个新的分布，当生成器和判别器通过训练达到损失收敛时，即生成器生成的分布与目标分布基本相同，则完成生成器和判别器的训练。在测试与实际应用过程中使用训练好的生成器去生成新的图片。

在刚开始训练的时候与噪声分布相似的一个分布，随着训练轮数的迭代，生成的图像的分布是一点点的朝着真实图片的分布靠近的，最终有可能和真实图片完全拟合，但是比较困难。传统的判别式网络找到合适的loss就能最大程度的让生成的分布与真是分部接近。在生成器与判别器配合的过程中拟合分布时是采一个个点去拟合分布，而不是直接用分布去拟合分布。

简单介绍一下传统GAN网络的loss：

判别器生成的值越大，则代表生成的值越真实。

训练判别器的目的是：

将一堆real图片丢入判别器（神经网络）希望通过学习得到一个接近1的值

将一堆生成的图片丢入判别器（神经网络）希望通过学习得到一个接近0的值

传统GAN的第一步训练是固定生成器去训练（更新）判别器，第二步是固定判别器去训练（更新）生成器

生成器的目标是使判别器能给他一个比较高的分数

噪声z起始的分布是什么分布没有那么重要

生成器训练的目标是：让判别器吃下生成器的图片得到的结果越大越好（判别器以为你这是真实的图片）

以上训练判别器+生成器的这两步交替进行，直至训练完成。

SinGAN

SinGAN：SinGAN的特点是可以通过一张图片就完成网络的训练。那么它为什么能只通过一张图片（真实数据中的一个样本点）就能学会整个真实数据的分布呢？

举个原理论文中的例子，使用一个11 * 11大小的“感受野”将图片切成非常多个“小块儿”，再将着样许多个小块作为训练样本送入网络进行训练。这其中存在一个问题：如果送入网络的图片分辨率太高那么我们这个11 * 11的感受野“看”到的东西就太少了，比如一张高清的人脸照片用11 * 11大小的感受野去采样可能就能看到几个毛孔。

每一个生成器G负责一个生成一个patch分布，每一个D去判别对应的patch

SinGAN中的判别器是马尔可夫判别器
马尔可夫判别器是由全卷机层构成，最后的输出层是一个n*n的矩阵，最终的输出是对这个矩阵求均值之后得到1或0的输出。
马尔可夫判别器对于风格迁移中的超高分辨率、图片清晰化的操作中有一定的高分辨率、高细节的保持。

为了解决这一矛盾SinGAN采取的办法是将图片在不同阶段进行不同程度的缩小，例如将刚刚说的高清人脸图片进行下采样后得到50 * 50左右的大小，这样11 * 11尺寸的感受野就能看到更多的内容了（之前只能看到几个毛孔，现在可能就能看到四分之一张脸了）。

*此处我有个疑惑想跟多家请教一下：让11 * 11大小的感受野移动的代码在哪？我debug了好几圈怎么也找不到，是我理解错了吗？但是这个想法和网上大部分人的想法都能对上。麻烦知道的朋友在评论区指点一下，感谢！

在得到了一组经过11*11大小的图片之后先对判别器，先更新判别器在更新生成器，其中生成器和判别器都是和图中一样是金字塔结构，卷生成器中的卷积操作是为了生成生成图片上采样之后丢失的细节。

其中SinGAN引入了两个损失函数，分别是对抗损失和重构损失。

其中对抗损失是用来衡量生成器和判别器之间的性能差距，其原理采用了 WGAN中的WGAN-GP梯度惩罚损失函数。

			Loss（adv） = D（real） -  D (G(x))  +  lambda  x  grad_pen

            Norm = tf.gradients(D(X_inter),[X_inter])
            grad_pen = MSE(Norm - k)					#这里我们把k定为1

		real为真实图片，X 为生成图片，z为噪声，eps为服从（0,1）均分分布的一个随机数
		X <-- G（z）
		X_inter <--  eps  x  real   +   ( 1 - eps )  x  X

注意：加入了梯度惩罚之后判别器就不能使用batch normalization了，因为加入批标准化之后会增加不同样本数据之间的依赖关系，而我们使用的插值图片取得是生成分布中的一个样本点与真实分布一个样本点之间的一个点。所以使用批标准化之后会将分布中的各个点拧在一起，就无法单拎出来一个点做插值图片了。

重构损失是衡量上一个scale中生成器生成的图片经过上采样之后得到的图片和目前scale中真实图片real之间的差距，通过衡量这一差距可以对这一个scale中，调整每个scale加入的服从高斯分布噪声z的方差。通过这样的方式使每次生成的随机噪声与真实图片real更“接近”。

其中对抗损失WGAN-GP的原理在下面有作出解释。

以上操作即完成了一scale，当完成若干个scale的时候就完成了SinGAN的训练，即从多个scale中学到图片整体的分布。

每个生成器的结构如下图所示：

每个生成器中都有5个卷积block，起始每个block中有32个卷积核，每过4个scales卷积核卷积核增加2倍。

第一次更新首先从超分部分开始

学习中的问题：
1、梯度惩罚是什么（functions.calc_gradient_penalty）

答：在计算判别器损失的时候 errD = errD_real + errD_fake + gradient_penalty（梯度惩罚值）

2、为什么要加入梯度惩罚？

答：防止GAN在训练的过程中出现模式崩塌。其原理是为了让损失函数满足1-L条件（使损失函数的值夹在y=x与y=-x之间），这样就能使模型的梯度不会太大（爆炸），也不会太小（消失）。加入梯度惩罚是促成损失函数满足1-L条件的一个手段。从而不容易出现模式崩塌。

模式崩塌的几种情况：

情况1：当判别器D出现第一次无法判断生成器G生成的图片，生成器G就无脑一直生成这一张图片，导致模型无法继续训练。生成器和判别器的配合出现了问题。

情况2：判别器过拟合，生成的图片已经能达到人类眼中的乱真效果了，但是判别式太严格，生成图片与原图有一点不一样，判别器就认为是假图片了。

情况3：过生成。生成器生成的每个相对细小的组织(比如人类照片中的眼睛、鼻子等单个器官)都能骗过判别器，但是判别器对于这张人脸没有一个全局的概念。可能出现的问题是：生成的一张人脸5只眼睛，但是判别器单纯的认为每个眼睛都很真实，且它没有学到一张脸应该有两只眼睛。还可能出现目标与背景合在一起的问题。可能是因为判别器D没有训练好。

3、如何防止模式崩塌？

答：给予生成器G惩罚。

4、GAN存在的问题：梯度消失

比如使用MSE就可以防止梯度消失，但是无法解决模式崩塌的问题。

5、WGAN-GP:
WGAN与传统GAN相比，最大的先进性在于损失函数的优化。传统GAN使用的香农熵，它是非黑即白的，只能判断出来差和不差，不能判断出来差多少。而WGAN-GP的损失函数（损失函数中的log被去掉了，再加梯度惩罚项）中提出了一个梯度惩戒理论，可以具体量化图片直接差多少。从而大大的提升了训练效果。

Gradient Penalty：

其主要功能是给权重的更新梯度加上一个惩罚系数，使得全中的梯度变化不会太大。同时可以让判别器的梯度接近1（1-L条件）(让判别器每一维的导数为1)，也就是说不会让权重猛增，也不会让权重不变可以避免梯度消失和梯度爆炸。

在整个高维空间实现梯度惩罚十分困难，因此采用生成分布和真实数据分布直接进行梯度惩罚。

插值图像：系数k x 生成图片 + （1 - 系数k) x 真实图片

用插值图像的方法在生成图片和真实图片之间选一个中间值，系数决定了中间值选在哪里。系数k服从（0,1）的均匀分布。

最后我们用插值图像的梯度来做梯度惩罚

插值图像可以理解为：既考虑了真实图片，也考虑了生成图片，而且考虑这两的权重加起来是1。考虑的权重服从（0,1）的均匀分布。所以插值图片可能像生成图片多一点，也有可能像生成图片多一点，也能看各像一半，就看系数随机的被选择了多少，从而间接的就控制了梯度的变化范围，让梯度别太大也别太小。# interpolates就是随机插值采样得到的图像，gradients就是loss中的梯度惩罚项

Gradient Penalty的实现方式：

在整个改为空间实现梯度惩罚是非常困难的，论文中的方法是直接在生成分布和真实数据之间实行梯度惩罚。

惩罚部分如图所示，WGAN-GP是损失函数加上这一部分

SR.py

parser = get_arguments()
    parser.add_argument('--input_dir', help='input image dir', default='Input/Images')
    parser.add_argument('--input_name', help='training image name', default="3.jpg")  # required=True)
    parser.add_argument('--sr_factor', help='super resolution factor', type=float, default=4)
    parser.add_argument('--mode', help='task to be done', default='SR')
    opt = parser.parse_args()
    opt = functions.post_config(opt)
    Gs = []
    Zs = []
    reals = []
    NoiseAmp = []

首先读入config.py文件中的参数，并加入SR中特有的参数。
其中：
Gs：生成器走了第多少轮
Zs：噪声z走了第多少轮
reals：真实图片每次被缩放的对列。reals不是一个值，而是一个队列
NoiseAmp：

dir2save = functions.generate_dir2save(opt)
    if dir2save is None:
        print('task does not exist')
    # elif (os.path.exists(dir2save)):
    #    print("output already exist")
    else:
        try:
            os.makedirs(dir2save)
        except OSError:
            pass

        mode = opt.mode
        in_scale, iter_num = functions.calc_init_scale(opt)
        opt.scale_factor = 1 / in_scale
        opt.scale_factor_init = 1 / in_scale
        opt.mode = 'train'
        dir2trained_model = functions.generate_dir2save(opt)

函数functions.generate_dir2save：生成文件夹，保存生成图片路径
函数functions.calc_init_scale：计算出缩放系数(in_scale)，以及放大次数（从底层到顶层的距离）iter_num
dir2trained_model：文件夹存储模型参数

     if (os.path.exists(dir2trained_model)):
         Gs, Zs, reals, NoiseAmp = functions.load_trained_pyramid(opt)
         opt.mode = mode
     else:
         print('*** Train SinGAN for SR ***')
         real = functions.read_image(opt)
         opt.min_size = 18
         real = functions.adjust_scales2image_SR(real, opt)
         train(opt, Gs, Zs, reals, NoiseAmp)
         opt.mode = mode
     print('%f' % pow(in_scale, iter_num))
     Zs_sr = []
     reals_sr = []
     NoiseAmp_sr = []
     Gs_sr = []
     real = reals[-1]  # read_image(opt)
     real_ = real
     opt.scale_factor = 1 / in_scale
     opt.scale_factor_init = 1 / in_scale

先判断是否有训练好的参数。
没有预训练参数：
函数functions.read_image：加载图片，并调整图片内部长宽通道的顺序
opt.min_size = 18规定在缩放过程中长款中最短的尺寸不能小于18
opt.scale_factor：用数学方法更新的缩放因子，第一次的值是0.85。
scale2stop：训练时候一共要缩放多少次才停止。

函数functions.adjust_scales2image_SR：对刚刚加载进来的图片进行缩放。返回经过缩放、预处理的图片矩阵。

train进入训练部分

def train(opt, Gs, Zs, reals, NoiseAmp):
    real_ = functions.read_image(opt)
    in_s = 0
    scale_num = 0
    real = imresize(real_, opt.scale1, opt)
    reals = functions.creat_reals_pyramid(real, reals, opt)
    nfc_prev = 0

    while scale_num < opt.stop_scale + 1:
        opt.nfc = min(opt.nfc_init * pow(2, math.floor(scale_num / 4)), 128)
        opt.min_nfc = min(opt.min_nfc_init * pow(2, math.floor(scale_num / 4)), 128)

        opt.out_ = functions.generate_dir2save(opt)
        opt.outf = '%s/%d' % (opt.out_, scale_num)
        try:
            os.makedirs(opt.outf)
        except OSError:
            pass

        # plt.imsave('%s/in.png' %  (opt.out_), functions.convert_image_np(real), vmin=0, vmax=1)
        # plt.imsave('%s/original.png' %  (opt.out_), functions.convert_image_np(real_), vmin=0, vmax=1)
        plt.imsave('%s/real_scale.png' % (opt.outf), functions.convert_image_np(reals[scale_num]), vmin=0, vmax=1)

        D_curr, G_curr = init_models(opt)
        if (nfc_prev == opt.nfc):
            G_curr.load_state_dict(torch.load('%s/%d/netG.pth' % (opt.out_, scale_num - 1)))
            D_curr.load_state_dict(torch.load('%s/%d/netD.pth' % (opt.out_, scale_num - 1)))

        z_curr, in_s, G_curr = train_single_scale(D_curr, G_curr, reals, Gs, Zs, in_s, NoiseAmp, opt) # 每次一个小的scale 的更新

        G_curr = functions.reset_grads(G_curr, False)
        G_curr.eval()
        D_curr = functions.reset_grads(D_curr, False)
        D_curr.eval()

        Gs.append(G_curr)
        Zs.append(z_curr)
        NoiseAmp.append(opt.noise_amp)

        torch.save(Zs, '%s/Zs.pth' % (opt.out_))
        torch.save(Gs, '%s/Gs.pth' % (opt.out_))
        torch.save(reals, '%s/reals.pth' % (opt.out_))
        torch.save(NoiseAmp, '%s/NoiseAmp.pth' % (opt.out_))

        scale_num += 1
        nfc_prev = opt.nfc
        del D_curr, G_curr
    return

首先使用functions.read_image读入图片并进行预处理
real_：刚刚读进来的图片
in_s:
scale_num:
real：将读进来的图片调整大小之后的图片
函数creat_reals_pyramid:创建真实图片金字塔

def creat_reals_pyramid(real, reals, opt):
    real = real[:, 0:3, :, :]
    for i in range(0, opt.stop_scale + 1, 1):
        scale = math.pow(opt.scale_factor, opt.stop_scale - i)
        curr_real = imresize(real, scale, opt)
        reals.append(curr_real)
    return reals

*real = real[:, 0:3, :, :]*这句我没看懂是在干什么

开始停止次数+1次的循环（在我2.jpg 120*66尺寸的图像中需要迭代8+1次）：

计算出第一个缩放因子是0.27
使用对应次数的缩放因子对图片进行缩放（本次是缩小）
将缩放好的尺寸加入到一开始创建的reals队列

第二次缩放因子=0.32

具体缩放过程：
次缩放过程于第一次的区别在于imresize_in中的缩放因子不是1了。

for dim in sorted_dims:
    # No point doing calculations for scale-factor 1. nothing will happen anyway
    if scale_factor[dim] == 1.0:
        continue

    # for each coordinate (along 1 dim), calculate which coordinates in the input image affect its result and the
    # weights that multiply the values there to get its result.
    weights, field_of_view = contributions(im.shape[dim], output_shape[dim], scale_factor[dim],
                                           method, kernel_width, antialiasing)


    # Use the affecting position values and the set of weights to calculate the result of resizing along this 1 dim
    out_im = resize_along_dim(out_im, dim, weights, field_of_view)

return out_im

函数contributions:输入的参数分别是：对应每次输入图片一个维度的尺寸、对应每次输出图片的一个尺寸、与输入图片对应的缩放因子、上采样方法的核宽度（kernel_width）、以及是否使用抗锯齿。
其返回值是一个权重和field_of_view。
contribution官方注释：这个函数计算了一套’filters’与’field_of_view’，以便来自“field_of_view”的每个位置将与基于插值方法的“权重”的匹配过滤器相乘，以及子像素位置与其周围像素中心的距离。这只对图像的一个维度执行。
当抗锯齿被激活的时候（仅下采样才激活抗锯齿），感受野被拉长为被拉长为原来的1、scale_factor。
（我理解这个感受野指的是kernel_width，即刚才输入的上采样方法的核宽度。）
out_coordinates：将1 到（out_length+1）按步长为1的形式展成一个队列list
继续官方注释：
首先将输出坐标在输入图片坐标上进行位置匹配。
举个例子：在清晰的HR图片中有4个水平像素，缩小的比例为SF=2，这样就会得到2颗像素，[1,2,3,4]->[1,2]。Remember each pixel number is the middle of the pixel（这句不理解），缩放是按照距离缩放的，而不是按照像素缩放（像素4的右边界被转换为像素2的右边界）。被缩小的图像中的像素1与大图像中像素1、2直接到边界匹配，而不是和像素2匹配。这意味着被缩小的新图片中的位置不仅仅是是简单的旧的大图乘以缩放因子得到的。所以如果我们测量从左边界开始的距离，所以如果我们测量从左边界开始的距离，像素1的中间距离是d=0.5，1和2之间的边界距离是d=1，依此类推distance = pixel - 0.5.我们计算出 (d_new = d_old / sf) which means: (p_new-0.5 = (p_old-0.5) / sf) -> p_new = p_old/sf + 0.5 * (1-1/sf)。
所以最终推得的公式是：p_new = p_old/sf + 0.5 * (1-1/sf)
所以下面这行代码可以解释为：match_coordinates(新像素)=out_coordinates（旧像素）/ 缩放因子（scale）+0.5*（1-1/缩放因子（scale））
例如在我实际Debug过程中就将out_coordinates=[1,2,3,4,5,6,7…22]变成了match_coordinates=[2,5,8,11…67]可以看出list中对应值都进行了不同比例的放大。所以完成了一次上采样过程。
letf_boundary：这是开始乘以过滤器的左边界，它取决于过滤器的大小。
expanded_kernel_width：内核宽度需要放大，因为当覆盖有亚像素边界时，它必须“看到”仅覆盖部分的像素的像素中心。因此，我们在每侧添加一个像素来考虑（权重可以将它们归零）。
所以本身等于12.4的kernel_width变成了15。
field_of_view：为每个输出位置确定一组视场，这些是输出图像中的像素“看到”的输入图像中的像素。我们得到一个矩阵，它的水平尺寸是输出像素（大），垂直尺寸是它看到的像素（内核大小+2）

weight：将权重分配给field of view中每一个像素。其类型是一个矩阵，其水平尺寸是输出像素，垂直尺寸是与视野中像素匹配的权重列表（在“视野”中指定）
sum_weights：给权重的每一项加1，并且将权重为零的值置成1，这样的目的是防止除以权重的时候出现除0的情况。
然后对权重进行标准化得到weights。

官方注释：我们使用这种镜像结构作为边界处的反射填充技巧
具体实现：将输入图片的长（宽66）先将其正序排序，再将其倒序排序，最后将两个排好序的数组接在一起，得到mirror（镜像）。
field_of_view：目前来看这个感受野的大小就是将原图缩放到最小尺寸的大小，即第一次训练所用图片的大小。

官方注释：去掉权重为零的权重和像素位置

现在返回的field_of_view和weight的具体含义是什么?

def contributions(in_length, out_length, scale, kernel, kernel_width, antialiasing):
# This function calculates a set of 'filters' and a set of field_of_view that will later on be applied
# such that each position from the field_of_view will be multiplied with a matching filter from the
# 'weights' based on the interpolation method and the distance of the sub-pixel location from the pixel centers
# around it. This is only done for one dimension of the image.

# When anti-aliasing is activated (default and only for downscaling) the receptive field is stretched to size of
# 1/sf. this means filtering is more 'low-pass filter'.
fixed_kernel = (lambda arg: scale * kernel(scale * arg)) if antialiasing else kernel
kernel_width *= 1.0 / scale if antialiasing else 1.0

# These are the coordinates of the output image
out_coordinates = np.arange(1, out_length + 1)

# These are the matching positions of the output-coordinates on the input image coordinates.
# Best explained by example: say we have 4 horizontal pixels for HR and we downscale by SF=2 and get 2 pixels:
# [1,2,3,4] -> [1,2]. Remember each pixel number is the middle of the pixel.
# The scaling is done between the distances and not pixel numbers (the right `boundary of pixel 4 is transformed to
# the right boundary of pixel 2. pixel 1 in the small image matches the boundary between pixels 1 and 2 in the big
# one and not to pixel 2. This means the position is not just multiplication of the old pos by scale-factor).
# So if we measure distance from the left border, middle of pixel 1 is at distance d=0.5, border between 1 and 2 is
# at d=1, and so on (d = p - 0.5).  we calculate (d_new = d_old / sf) which means:
# (p_new-0.5 = (p_old-0.5) / sf)     ->          p_new = p_old/sf + 0.5 * (1-1/sf)
match_coordinates = 1.0 * out_coordinates / scale + 0.5 * (1 - 1.0 / scale)

# This is the left boundary to start multiplying the filter from, it depends on the size of the filter
left_boundary = np.floor(match_coordinates - kernel_width / 2)

# Kernel width needs to be enlarged because when covering has sub-pixel borders, it must 'see' the pixel centers
# of the pixels it only covered a part from. So we add one pixel at each side to consider (weights can zeroize them)
expanded_kernel_width = np.ceil(kernel_width) + 2

# Determine a set of field_of_view for each each output position, these are the pixels in the input image
# that the pixel in the output image 'sees'. We get a matrix whos horizontal dim is the output pixels (big) and the
# vertical dim is the pixels it 'sees' (kernel_size + 2)
field_of_view = np.squeeze(np.uint(np.expand_dims(left_boundary, axis=1) + np.arange(expanded_kernel_width) - 1))

# Assign weight to each pixel in the field of view. A matrix whos horizontal dim is the output pixels and the
# vertical dim is a list of weights matching to the pixel in the field of view (that are specified in
# 'field_of_view')
weights = fixed_kernel(1.0 * np.expand_dims(match_coordinates, axis=1) - field_of_view - 1)

# Normalize weights to sum up to 1. be careful from dividing by 0
sum_weights = np.sum(weights, axis=1)
sum_weights[sum_weights == 0] = 1.0
weights = 1.0 * weights / np.expand_dims(sum_weights, axis=1)

# We use this mirror structure as a trick for reflection padding at the boundaries
mirror = np.uint(np.concatenate((np.arange(in_length), np.arange(in_length - 1, -1, step=-1))))
field_of_view = mirror[np.mod(field_of_view, mirror.shape[0])]

# Get rid of  weights and pixel positions that are of zero weight
non_zero_out_pixels = np.nonzero(np.any(weights, axis=0))
weights = np.squeeze(weights[:, non_zero_out_pixels])
field_of_view = np.squeeze(field_of_view[:, non_zero_out_pixels])

# Final products are the relative positions and the matching weights, both are output_size X fixed_kernel_size
return weights, field_of_view

函数imresize_in：首先使用fix_scale_and_size函数确定缩放因子和输出形状。
然后再选择插值方法与插值方法的内核尺寸，本代码SR实验组中选择的是三次样条插值（cubic）方法。在下采样时使用抗锯齿（antialiasing）。根据每一个维度缩放尺寸（scale）对维度进行排序，我们要一个维度接着一个维度的进行，提前拍好序可以提高效率。
把图片以矩阵的形式复制一下赋值给out_im。
沿着排好序的缩放因子队列（sorted_dim）
如果缩放因子是1就跳出循环，因为缩放1倍没有意义。

返回 out_im 第一返回的尺寸就是原图大小

imresize_in是imresize中的一个方法，imresize的作用主要是根据缩放因子调整图片大小，以及对图片完成预处理、完成归一化。

def imresize_in(im, scale_factor=None, output_shape=None, kernel=None, antialiasing=True, kernel_shift_flag=False):
    # First standardize values and fill missing arguments (if needed) by deriving scale from output shape or vice versa
    scale_factor, output_shape = fix_scale_and_size(im.shape, output_shape, scale_factor)

    # For a given numeric kernel case, just do convolution and sub-sampling (downscaling only)
    if type(kernel) == np.ndarray and scale_factor[0] <= 1:
        return numeric_kernel(im, kernel, scale_factor, output_shape, kernel_shift_flag)

    # Choose interpolation method, each method has the matching kernel size
    method, kernel_width = {
        "cubic": (cubic, 4.0),
        "lanczos2": (lanczos2, 4.0),
        "lanczos3": (lanczos3, 6.0),
        "box": (box, 1.0),
        "linear": (linear, 2.0),
        None: (cubic, 4.0)  # set default interpolation method as cubic
    }.get(kernel)

    # Antialiasing is only used when downscaling
    antialiasing *= (scale_factor[0] < 1)

    # Sort indices of dimensions according to scale of each dimension. since we are going dim by dim this is efficient
    sorted_dims = np.argsort(np.array(scale_factor)).tolist()

    # Iterate over dimensions to calculate local weights for resizing and resize each time in one direction
    out_im = np.copy(im)
    for dim in sorted_dims:
        # No point doing calculations for scale-factor 1. nothing will happen anyway
        if scale_factor[dim] == 1.0:
            continue

        # for each coordinate (along 1 dim), calculate which coordinates in the input image affect its result and the
        # weights that multiply the values there to get its result.
        weights, field_of_view = contributions(im.shape[dim], output_shape[dim], scale_factor[dim],
                                               method, kernel_width, antialiasing)


        # Use the affecting position values and the set of weights to calculate the result of resizing along this 1 dim
        out_im = resize_along_dim(out_im, dim, weights, field_of_view)

    return out_im

fix_scale_and_size：首先将缩放因子（scale_factor）调整到模型需要的值（将缩放因子变成一个队列，与输入图片的尺寸相对应）,如果缩放因子不是向量现将其变成向量，将其装换为list并将其置为[1,1]，再将其转化为[1,1,1]（我理解是转换为3维，为了对应输入图片是3通道）。如果输出形状（output_shape）是空，就将输入形状乘以对应缩放因子变成输出形状。

def fix_scale_and_size(input_shape, output_shape, scale_factor):
 # First fixing the scale-factor (if given) to be standardized the function expects (a list of scale factors in the
 # same size as the number of input dimensions)
 if scale_factor is not None:
     # By default, if scale-factor is a scalar we assume 2d resizing and duplicate it.
     if np.isscalar(scale_factor):
         scale_factor = [scale_factor, scale_factor]

     # We extend the size of scale-factor list to the size of the input by assigning 1 to all the unspecified scales
     scale_factor = list(scale_factor)
     scale_factor.extend([1] * (len(input_shape) - len(scale_factor)))

 # Fixing output-shape (if given): extending it to the size of the input-shape, by assigning the original input-size
 # to all the unspecified dimensions
 if output_shape is not None:
     output_shape = list(np.uint(np.array(output_shape))) + list(input_shape[len(output_shape):])

 # Dealing with the case of non-give scale-factor, calculating according to output-shape. note that this is
 # sub-optimal, because there can be different scales to the same output-shape.
 if scale_factor is None:
     scale_factor = 1.0 * np.array(output_shape) / np.array(input_shape)

 # Dealing with missing output-shape. calculating according to scale-factor
 if output_shape is None:
     output_shape = np.uint(np.ceil(np.array(input_shape) * np.array(scale_factor)))

 return scale_factor, output_shape

下面从imresize_in函数进入resize_along_dim函数，具体代码如下：

def resize_along_dim(im, dim, weights, field_of_view):
# To be able to act on each dim, we swap so that dim 0 is the wanted dim to resize
tmp_im = np.swapaxes(im, dim, 0)

# We add singleton dimensions to the weight matrix so we can multiply it with the big tensor we get for
# tmp_im[field_of_view.T], (bsxfun style)
weights = np.reshape(weights.T, list(weights.T.shape) + (np.ndim(im) - 1) * [1])

# This is a bit of a complicated multiplication: tmp_im[field_of_view.T] is a tensor of order image_dims+1.
# for each pixel in the output-image it matches the positions the influence it from the input image (along 1 dim
# only, this is why it only adds 1 dim to the shape). We then multiply, for each pixel, its set of positions with
# the matching set of weights. we do this by this big tensor element-wise multiplication (MATLAB bsxfun style:
# matching dims are multiplied element-wise while singletons mean that the matching dim is all multiplied by the
# same number
tmp_out_im = np.sum(tmp_im[field_of_view.T] * weights, axis=0)

# Finally we swap back the axes to the original order
return np.swapaxes(tmp_out_im, dim, 0)

接下来我们继续顺着代码一行行的厘清思路：
首先
官方注释：为了能够对每个dim进行操作，我们交换dim0，使其成为需要调整大小的dim
tmp_im：存放着调整完维度顺序的图片

接下来将weights的维度从2维增加到4维，这样是为了使权重能和图片张量相乘从而得到感受野（field_of_view）

然后开始上一步所说的相乘，官方注释：

这是一个有点复杂的乘法：tmp_im im[field_ of _ view.T]是一个有序的张量image_dims+1。对于输出图像中的每个像素，它与输入图像的影响位置相匹配（仅沿1 dim，这就是为什么它只向形状添加1 dim）。然后，我们将每个像素的位置集与匹配的权重集相乘。我们通过这个大张量元素相乘（matlabbsxfun风格：匹配的dim是元素相乘的，而singleton意味着匹配的dim都是由相同的数字相乘的)
我理解以上内容就是感受野中的图片与权重矩阵对应相乘，然后得到这一次缩放的尺寸大小tmp_out_im参数。

最后返回的时候再将一开始打乱的维度调整回打乱之前的顺序

以上过程完成了imresize_im中的一个for循环中的一次。因为图片有3个维度，所以要循环3次。

以上工作完成了真实图片real的每一次预设缩放。

接下来开始真正的训练。

以下代码是train的while循环以下的训练过程：

 while scale_num < opt.stop_scale + 1:
    opt.nfc = min(opt.nfc_init * pow(2, math.floor(scale_num / 4)), 128)
    opt.min_nfc = min(opt.min_nfc_init * pow(2, math.floor(scale_num / 4)), 128)

    opt.out_ = functions.generate_dir2save(opt)
    opt.outf = '%s/%d' % (opt.out_, scale_num)
    try:
        os.makedirs(opt.outf)
    except OSError:
        pass

    # plt.imsave('%s/in.png' %  (opt.out_), functions.convert_image_np(real), vmin=0, vmax=1)
    # plt.imsave('%s/original.png' %  (opt.out_), functions.convert_image_np(real_), vmin=0, vmax=1)
    plt.imsave('%s/real_scale.png' % (opt.outf), functions.convert_image_np(reals[scale_num]), vmin=0, vmax=1)

    D_curr, G_curr = init_models(opt)
    if (nfc_prev == opt.nfc):
        G_curr.load_state_dict(torch.load('%s/%d/netG.pth' % (opt.out_, scale_num - 1)))
        D_curr.load_state_dict(torch.load('%s/%d/netD.pth' % (opt.out_, scale_num - 1)))

    z_curr, in_s, G_curr = train_single_scale(D_curr, G_curr, reals, Gs, Zs, in_s, NoiseAmp, opt) # 每次一个小的scale 的更新

    G_curr = functions.reset_grads(G_curr, False)
    G_curr.eval()
    D_curr = functions.reset_grads(D_curr, False)
    D_curr.eval()

    Gs.append(G_curr)
    Zs.append(z_curr)
    NoiseAmp.append(opt.noise_amp)

    torch.save(Zs, '%s/Zs.pth' % (opt.out_))
    torch.save(Gs, '%s/Gs.pth' % (opt.out_))
    torch.save(reals, '%s/reals.pth' % (opt.out_))
    torch.save(NoiseAmp, '%s/NoiseAmp.pth' % (opt.out_))

    scale_num += 1
    nfc_prev = opt.nfc
    del D_curr, G_curr
return
接下来仔细看while循环，不难发现发现while循环的判断条件是现在的缩放次数是否达到了预设的停止缩放次数+1
首先给opt.nfc做一个赋值，opt.nfc的含义是输入噪声的维度。

然后再使用functions.generate_dir2save方法来生成对应的模型训练文件夹
其中具体的值分别是缩放因子和缩放次数
使用plt.imsave方法来保存经过缩放过后的真实图片real，
函数functions.convert_image_np：
送入的参数是第一次训练用到的尺寸最小的图片
作用是将图片转换成数组

函数init_models：

def init_models(opt):
# generator initialization:
netG = models.GeneratorConcatSkip2CleanAdd(opt).to(opt.device)
netG.apply(models.weights_init)
if opt.netG != '':
    netG.load_state_dict(torch.load(opt.netG))
print(netG)

# discriminator initialization:
netD = models.WDiscriminator(opt).to(opt.device)
netD.apply(models.weights_init)
if opt.netD != '':
    netD.load_state_dict(torch.load(opt.netD))
print(netD)

return netD, netG

首先初始化生成器
使用models.GeneratorConcatSkip2CleanAdd方法

class GeneratorConcatSkip2CleanAdd(nn.Module):
def __init__(self, opt):
    super(GeneratorConcatSkip2CleanAdd, self).__init__()
    self.is_cuda = torch.cuda.is_available()
    N = opt.nfc
    self.head = ConvBlock(opt.nc_im, N, opt.ker_size, opt.padd_size,
                          1)  # GenConvTransBlock(opt.nc_z,N,opt.ker_size,opt.padd_size,opt.stride)
    self.body = nn.Sequential()
    for i in range(opt.num_layer - 2):
        N = int(opt.nfc / pow(2, (i + 1)))
        block = ConvBlock(max(2 * N, opt.min_nfc), max(N, opt.min_nfc), opt.ker_size, opt.padd_size, 1)
        self.body.add_module('block%d' % (i + 1), block)
    self.tail = nn.Sequential(
        nn.Conv2d(max(N, opt.min_nfc), opt.nc_im, kernel_size=opt.ker_size, stride=1, padding=opt.padd_size),
        nn.Tanh()
    )

def forward(self, x, y):
    x = self.head(x)
    x = self.body(x)
    x = self.tail(x)
    ind = int((y.shape[2] - x.shape[2]) / 2)
    y = y[:, :, ind:(y.shape[2] - ind), ind:(y.shape[3] - ind)]
    return x + y

首先实例化出来32维度的噪声
送入第一个convblock

class ConvBlock(nn.Sequential):
def __init__(self, in_channel, out_channel, ker_size, padd, stride):
    super(ConvBlock, self).__init__()
    self.add_module('conv', nn.Conv2d(in_channel, out_channel, kernel_size=ker_size, stride=stride, padding=padd)),
    self.add_module('norm', nn.BatchNorm2d(out_channel)),
    self.add_module('LeakyRelu', nn.LeakyReLU(0.2, inplace=True))

定义每个conblock中的结构，分别是卷积、标准化、以及激活函数。
生成器残差连接块分为3个部分，分别是头（head）、中（body）、尾（tail）。
头部head的convblock（3，32, 3 ,0，1）
中部body的convblock1（32,32,3,0,1）
中部body的convblock2（32,32,3,0,1）
中部body的convblock3（32,32,3,0,1）
尾部tail的convblock（32,3,3,0,1）
最后一层激活函数是tanh

在建立完模型结构之后函数跳回init_model函数，完成了以上操作就实现了生成器的构造。
接下来初始化模型参数用到weights_init函数，初试化之后的参数用在生成器上。
下面是weights_initl函数：

def weights_init(m):
classname = m.__class__.__name__
if classname.find('Conv2d') != -1:
    m.weight.data.normal_(0.0, 0.02)
elif classname.find('Norm') != -1:
    m.weight.data.normal_(1.0, 0.02)
    m.bias.data.fill_(0)

这个函数的作用是将刚刚定义的5个convblock中的卷积与标准化中的参数都进行赋值，以达到初始化的目的。
完成了权重初始化工作接下来回到init_model函数中，然后打印出生成器网络netG

接下来进入到判别器的创建工作
以下部分是WDiscriminator函数：

class WDiscriminator(nn.Module):
def __init__(self, opt):
    super(WDiscriminator, self).__init__()
    self.is_cuda = torch.cuda.is_available()
    N = int(opt.nfc)
    self.head = ConvBlock(opt.nc_im, N, opt.ker_size, opt.padd_size, 1)
    self.body = nn.Sequential()
    for i in range(opt.num_layer - 2):
        N = int(opt.nfc / pow(2, (i + 1)))
        block = ConvBlock(max(2 * N, opt.min_nfc), max(N, opt.min_nfc), opt.ker_size, opt.padd_size, 1)
        self.body.add_module('block%d' % (i + 1), block)
    self.tail = nn.Conv2d(max(N, opt.min_nfc), 1, kernel_size=opt.ker_size, stride=1, padding=opt.padd_size)

def forward(self, x):
    x = self.head(x)
    x = self.body(x)
    x = self.tail(x)
    return x        # 判别器没有残差结构

不难看出判别器的结构与生成器结构类似，都是具有5个convblock，其内部的结构也一样都是卷积标准化、LeakyReLU激活，一共5层，也同样分别对其进行参数初始化
但也不是完全相同，判别器没有想生成器一样的残差结构。
最后打印出判别器netD

到这里init_models函数就结束了，返回判别器和生成器

现在函数又跳回了train
接下来进入train中的train_single_scale函数

def train_single_scale(netD, netG, reals, Gs, Zs, in_s, NoiseAmp, opt, centers=None):
real = reals[len(Gs)]
opt.nzx = real.shape[2]  # +(opt.ker_size-1)*(opt.num_layer)
opt.nzy = real.shape[3]  # +(opt.ker_size-1)*(opt.num_layer)
opt.receptive_field = opt.ker_size + ((opt.ker_size - 1) * (opt.num_layer - 1)) * opt.stride
pad_noise = int(((opt.ker_size - 1) * opt.num_layer) / 2)
pad_image = int(((opt.ker_size - 1) * opt.num_layer) / 2)
if opt.mode == 'animation_train':
    opt.nzx = real.shape[2] + (opt.ker_size - 1) * (opt.num_layer)
    opt.nzy = real.shape[3] + (opt.ker_size - 1) * (opt.num_layer)
    pad_noise = 0
m_noise = nn.ZeroPad2d(int(pad_noise))
m_image = nn.ZeroPad2d(int(pad_image))

alpha = opt.alpha

fixed_noise = functions.generate_noise([opt.nc_z, opt.nzx, opt.nzy], device=opt.device)
z_opt = torch.full(fixed_noise.shape, 0, device=opt.device)
z_opt = m_noise(z_opt)

# setup optimizer
optimizerD = optim.Adam(netD.parameters(), lr=opt.lr_d, betas=(opt.beta1, 0.999))
optimizerG = optim.Adam(netG.parameters(), lr=opt.lr_g, betas=(opt.beta1, 0.999))
schedulerD = torch.optim.lr_scheduler.MultiStepLR(optimizer=optimizerD, milestones=[1600], gamma=opt.gamma)
schedulerG = torch.optim.lr_scheduler.MultiStepLR(optimizer=optimizerG, milestones=[1600], gamma=opt.gamma)

errD2plot = []
errG2plot = []
D_real2plot = []
D_fake2plot = []
z_opt2plot = []

for epoch in range(opt.niter):
    if (Gs == []) & (opt.mode != 'SR_train'):
        z_opt = functions.generate_noise([1, opt.nzx, opt.nzy], device=opt.device)
        z_opt = m_noise(z_opt.expand(1, 3, opt.nzx, opt.nzy))
        noise_ = functions.generate_noise([1, opt.nzx, opt.nzy], device=opt.device)
        noise_ = m_noise(noise_.expand(1, 3, opt.nzx, opt.nzy))
    else:
        noise_ = functions.generate_noise([opt.nc_z, opt.nzx, opt.nzy], device=opt.device)
        noise_ = m_noise(noise_)

    ############################
    # (1) Update D network: maximize D(x) + D(G(z))
    ###########################
    for j in range(opt.Dsteps):
        # train with real
        netD.zero_grad()

        output = netD(real).to(opt.device)
        # D_real_map = output.detach()
        errD_real = -output.mean()  # -a
        errD_real.backward(retain_graph=True)
        D_x = -errD_real.item()

        # train with fake
        if (j == 0) & (epoch == 0):
            if (Gs == []) & (opt.mode != 'SR_train'):
                prev = torch.full([1, opt.nc_z, opt.nzx, opt.nzy], 0, device=opt.device)
                in_s = prev
                prev = m_image(prev)
                z_prev = torch.full([1, opt.nc_z, opt.nzx, opt.nzy], 0, device=opt.device)
                z_prev = m_noise(z_prev)
                opt.noise_amp = 1
            elif opt.mode == 'SR_train':
                z_prev = in_s
                criterion = nn.MSELoss()
                RMSE = torch.sqrt(criterion(real, z_prev))
                opt.noise_amp = opt.noise_amp_init * RMSE
                z_prev = m_image(z_prev)
                prev = z_prev
            else:
                prev = draw_concat(Gs, Zs, reals, NoiseAmp, in_s, 'rand', m_noise, m_image, opt)
                prev = m_image(prev)
                z_prev = draw_concat(Gs, Zs, reals, NoiseAmp, in_s, 'rec', m_noise, m_image, opt)
                criterion = nn.MSELoss()
                RMSE = torch.sqrt(criterion(real, z_prev))
                opt.noise_amp = opt.noise_amp_init * RMSE
                z_prev = m_image(z_prev)
        else:
            prev = draw_concat(Gs, Zs, reals, NoiseAmp, in_s, 'rand', m_noise, m_image, opt)
            prev = m_image(prev)

        if opt.mode == 'paint_train':
            prev = functions.quant2centers(prev, centers)
            plt.imsave('%s/prev.png' % (opt.outf), functions.convert_image_np(prev), vmin=0, vmax=1)

        if (Gs == []) & (opt.mode != 'SR_train'):
            noise = noise_
        else:
            noise = opt.noise_amp * noise_ + prev

        fake = netG(noise.detach(), prev)
        output = netD(fake.detach())
        errD_fake = output.mean()
        errD_fake.backward(retain_graph=True)
        D_G_z = output.mean().item()

        gradient_penalty = functions.calc_gradient_penalty(netD, real, fake, opt.lambda_grad, opt.device)
        gradient_penalty.backward()

        errD = errD_real + errD_fake + gradient_penalty
        optimizerD.step()

    errD2plot.append(errD.detach())

    ############################
    # (2) Update G network: maximize D(G(z))
    ###########################

    for j in range(opt.Gsteps):
        netG.zero_grad()                # output 接把模型的参数梯度设成0
        output = netD(fake)
        # D_fake_map = output.detach()
        errG = -output.mean()
        errG.backward(retain_graph=True)
        if alpha != 0:
            loss = nn.MSELoss()
            if opt.mode == 'paint_train':
                z_prev = functions.quant2centers(z_prev, centers)
                plt.imsave('%s/z_prev.png' % (opt.outf), functions.convert_image_np(z_prev), vmin=0, vmax=1)
            Z_opt = opt.noise_amp * z_opt + z_prev
            rec_loss = alpha * loss(netG(Z_opt.detach(), z_prev), real)
            rec_loss.backward(retain_graph=True)
            rec_loss = rec_loss.detach()
            # detach当我们再训练网络的时候可能希望保持一部分的网络参数不变，
            # 只对其中一部分的参数进行调整；或者值训练部分分支网络，并不让其梯度对主网络的梯度造成影响，
            # 这时候我们就需要使用detach()函数来切断一些分支的反向传播
        else:
            Z_opt = z_opt
            rec_loss = 0

        optimizerG.step()

    errG2plot.append(errG.detach() + rec_loss)
    D_real2plot.append(D_x)
    D_fake2plot.append(D_G_z)
    z_opt2plot.append(rec_loss)

    if epoch % 25 == 0 or epoch == (opt.niter - 1):
        print('scale %d:[%d/%d]' % (len(Gs), epoch, opt.niter))

    if epoch % 500 == 0 or epoch == (opt.niter - 1):
        plt.imsave('%s/fake_sample.png' % (opt.outf), functions.convert_image_np(fake.detach()), vmin=0, vmax=1)
        plt.imsave('%s/G(z_opt).png' % (opt.outf),
                   functions.convert_image_np(netG(Z_opt.detach(), z_prev).detach()), vmin=0, vmax=1)
        # plt.imsave('%s/D_fake.png'   % (opt.outf), functions.convert_image_np(D_fake_map))
        # plt.imsave('%s/D_real.png'   % (opt.outf), functions.convert_image_np(D_real_map))
        # plt.imsave('%s/z_opt.png'    % (opt.outf), functions.convert_image_np(z_opt.detach()), vmin=0, vmax=1)
        # plt.imsave('%s/prev.png'     %  (opt.outf), functions.convert_image_np(prev), vmin=0, vmax=1)
        # plt.imsave('%s/noise.png'    %  (opt.outf), functions.convert_image_np(noise), vmin=0, vmax=1)
        # plt.imsave('%s/z_prev.png'   % (opt.outf), functions.convert_image_np(z_prev), vmin=0, vmax=1)

        torch.save(z_opt, '%s/z_opt.pth' % (opt.outf))

    schedulerD.step()
    schedulerG.step()

functions.save_networks(netG, netD, z_opt, opt)
return z_opt, in_s, netG

下面跟着程序的思路走一遍train_single_scale函数
real = reals[len(Gs)]：首先读取Gs中第一个scale张图片（最小的图片）
将刚刚图片的长宽分别赋值给opt.nzx、opt.nzy
opt.receptive_field是感受野，这个感受野是指原论文中

最右侧黄色框。
opt.ker_size、opt.num_layer是什么含义我还搞懂（我感觉这个有点卷积核是三维的感觉但是感觉这么想不对）
pad_noise、pad_image分别是对噪声和真实图片的边缘填充（padding）填充值一般为卷积核大小的一半。所以这两个参数的值都是5。

将opt.alpha的值实例化给alpha

下面进入functions_generate_noise函数生成噪声，并赋值给fixed_noise：

def generate_noise(size, num_samp=1, device='cuda', type='gaussian', scale=1):

if type == 'gaussian':
    noise = torch.randn(num_samp, size[0], round(size[1] / scale), round(size[2] / scale), device=device)
    noise = upsampling(noise, size[1], size[2])
if type == 'gaussian_mixture':
    noise1 = torch.randn(num_samp, size[0], size[1], size[2], device=device) + 5
    noise2 = torch.randn(num_samp, size[0], size[1], size[2], device=device)
    noise = noise1 + noise2
if type == 'uniform':
    noise = torch.randn(num_samp, size[0], size[1], size[2], device=device)
return noise

选择生成噪声的分布
再把噪声进行上采样得到fixed_noise：

def upsampling(im, sx, sy):
m = nn.Upsample(size=[round(sx), round(sy)], mode='bilinear', align_corners=True)
return m(im)

接着生成一个尺寸为fixed_noies大小的全是0的矩阵z_opt，并且对其进行全0填充
**
设置优化器
生成器与判别器都使用adam优化器、设置调整学习率方法（lr_scheduler）
**
定义损失

errD2plot = []
errG2plot = []
D_real2plot = []
D_fake2plot = []
z_opt2plot = []

**
开始迭代训练（第一个epoch循环）
首次训练（第一次从一个噪声开始训练）
首先生成噪声z_opt（这个位置只有第一次训练放噪声）
再对z_opt进行padding
同理生成噪声noise_
对其进行padding

开始第二个循环（嵌套在起一个循环内的一个判别器更新的循环）
首先用真图片real进行训练

清空梯度

将real送入判别网络得到output（此处代码会跳到定义判别器时候的前）

得到将真实图片real送入判别器的损失（给判别器看真的图片，衡量他看完真实图片认为真实图片有多真的衡量）

对其优化，进行反向传播

将键值组成元组，放在列表D_x中返回。

接下来将假图片fake送入判别器训练

先生成一个目前图片尺寸大小的全0矩阵prev

in_s的值目前与z_prev相等（未经过全0填充）

再将prev进行全0填充（上下左右各充5个0）

再生成一个目前尺寸大小的全0矩阵z_prev

对z_prev进行填充->z_prev

opt.noise_amp是噪声附加权重

使用生成器，加入prev生成假图片fake

再将假图片送入判别器（注意此处的fake不会更新，被detach了）得到output

将output取个均值->errD_fake

更新errD_fake

使用functions.calc_gradient_penalty方法计算梯度罚分gradient_penalty

下面进入functions.calc_gradient_penalty函数

def calc_gradient_penalty(netD, real_data, fake_data, LAMBDA, device):
# print real_data.size()
alpha = torch.rand(1, 1)
alpha = alpha.expand(real_data.size())
alpha = alpha.to(device)  # cuda() #gpu) #if use_cuda else alpha

interpolates = alpha * real_data + ((1 - alpha) * fake_data)

interpolates = interpolates.to(device)  # .cuda()
interpolates = torch.autograd.Variable(interpolates, requires_grad=True)    # autograd包是PyTorch中神经网络的核心,
# 它可以为基于tensor的的所有操作提供自动微分的功能, 这是一个逐个运行的框架, 意味着反向传播是根据你的代码来运行的, 并且每一次的迭代运行都可能不同.
# interpolates就是随机插值采样得到的图像，gradients就是loss中的梯度惩罚项

disc_interpolates = netD(interpolates)
# 对loss_rec进行方向传播
gradients = torch.autograd.grad(outputs=disc_interpolates, inputs=interpolates,
                                grad_outputs=torch.ones(disc_interpolates.size()).to(device),
                                # .cuda(), #if use_cuda else torch.ones(
                                # disc_interpolates.size()),
                                create_graph=True, retain_graph=True, only_inputs=True)[0]
# LAMBDA = 1
gradient_penalty = ((gradients.norm(2, dim=1) - 1) ** 2).mean() * LAMBDA
return gradient_penalty

alpha<-生成（1,1）的均匀分布中的一个数字

将alpha中的值打成和真实图片real一样尺寸的矩阵

interpolates<-将这个alpha乘以真图片 + （1-alpha）乘以假图片

disc_interpolates<-将interpolates送入判别器

对loss_rec进行反向传播

gradient_penalty<-更新梯度

计算完梯度得到更新过后的gradient_penalty

判别器损失errD<-errD_real+errD_fake+梯度奖惩gradient_penalty

我理解这个奖惩梯度是这个SinGAN中特有的一个参数

完成以上操作就完成了一个step的更新，根据config文件中超参数的设定一个有3个step

当j！=1的时候进入到draw_concat函数：

def draw_concat(Gs, Zs, reals, NoiseAmp, in_s, mode, m_noise, m_image, opt):
G_z = in_s
if len(Gs) > 0:
    if mode == 'rand':
        count = 0
        pad_noise = int(((opt.ker_size - 1) * opt.num_layer) / 2)
        if opt.mode == 'animation_train':
            pad_noise = 0
        for G, Z_opt, real_curr, real_next, noise_amp in zip(Gs, Zs, reals, reals[1:], NoiseAmp):
            if count == 0:
                z = functions.generate_noise([1, Z_opt.shape[2] - 2 * pad_noise, Z_opt.shape[3] - 2 * pad_noise],
                                             device=opt.device)
                z = z.expand(1, 3, z.shape[2], z.shape[3])
            else:
                z = functions.generate_noise(
                    [opt.nc_z, Z_opt.shape[2] - 2 * pad_noise, Z_opt.shape[3] - 2 * pad_noise], device=opt.device)
            z = m_noise(z)
            G_z = G_z[:, :, 0:real_curr.shape[2], 0:real_curr.shape[3]]
            G_z = m_image(G_z)
            z_in = noise_amp * z + G_z
            G_z = G(z_in.detach(), G_z)
            G_z = imresize(G_z, 1 / opt.scale_factor, opt)
            G_z = G_z[:, :, 0:real_next.shape[2], 0:real_next.shape[3]]
            count += 1
    if mode == 'rec':
        count = 0
        for G, Z_opt, real_curr, real_next, noise_amp in zip(Gs, Zs, reals, reals[1:], NoiseAmp):
            G_z = G_z[:, :, 0:real_curr.shape[2], 0:real_curr.shape[3]]
            G_z = m_image(G_z)
            z_in = noise_amp * Z_opt + G_z
            G_z = G(z_in.detach(), G_z)
            G_z = imresize(G_z, 1 / opt.scale_factor, opt)
            G_z = G_z[:, :, 0:real_next.shape[2], 0:real_next.shape[3]]
            # if count != (len(Gs)-1):
            #    G_z = m_image(G_z)
            count += 1
return G_z

此时Gs[]是空的，draw_concat函数直接返回G_z,这个函数的具体功能在下文介绍

fake<-将噪声和输出形状送入生成器不进行更新

opt.out<-再将fake送入判别器fake不进行更新
此段和上一轮循环一样不再赘述

errD2plot[]中加入以上得到得errD

接下来更新生成器

进入for循环：

将梯度置0

out<-将fake送入判别器

errG<-把判别器的输出值取个均值+倒数

使用mse损失

rec_loss<-接下来写出生成的图片与真实之间的差距即重构损失

以上操作完成了一个生成器的step一个3个step

以上操作结束了训练

下面进入for循环这个循环的作用是生成SR对应的参数

Zs_sr = []
    reals_sr = []
    NoiseAmp_sr = []
    Gs_sr = []
    real = reals[-1]  # read_image(opt)
    real_ = real
    opt.scale_factor = 1 / in_scale
    opt.scale_factor_init = 1 / in_scale
    for j in range(1, iter_num + 1, 1):
        real_ = imresize(real_, pow(1 / 	opt.scale_factor, 1), opt)
        reals_sr.append(real_)
        Gs_sr.append(Gs[-1])
        NoiseAmp_sr.append(NoiseAmp[-1])
        z_opt = torch.full(real_.shape, 0, 	device=opt.device)
        m = nn.ZeroPad2d(5)
        z_opt = m(z_opt)
        Zs_sr.append(z_opt)

得到对应参数后将参数送入SinGAN_generate函数生成超分图片
超分完成

论文解读

论文中各章内容思维导图如下：

1、图像超分辨率（Super-Resolution）

2、画风迁移（Paint-to-Image）

3、图像融合（Harmonization）中，需要输入两个图片，一张背景一张被融入图片。其中热入图片可以选择在那个scale中进行融合。

4、图像编辑（Editing）

5、动画（Single Image Animation）

将来还会继续补充细节

你可能感兴趣的:(pytorch,神经网络,深度学习)

python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为？（附代码）... weixin_39576066 python 学习曲线函数
LSTM是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在自然语言处理、语言识别等一系列的应用上都取得了很好的效果。《LongShortTermMemoryNetworkswithPython》是澳大利亚机器学习专家JasonBrownlee的著作，里面详细介绍了LSTM模型的原理和使用。该书总共分为十四个章节，具体如下：第一章：什么是LSTMs？第二章：怎么样训练
翻译Deep Learning and the Game of Go（14）第十二章采用actor-critic方法的强化学习 idol_watch 围棋与深度学习
本章包括:利用优势使强化学习更有效率用actor-critic方法来实现自我提升AI设计和训练Keras的多输出神经网络如果你正在学习下围棋，最好的改进方法之一是让一个水平更高的棋手给你复盘。有时候，最有用的反馈只是指出你在哪里赢棋或输棋。复盘的人可能会给出这样的评论，“你下了30步后已经远远落后了”或“在下了110步后，你有一个获胜的局面，但你的对手在130时扭转了局面。”为什么这种反馈是有帮助
transformer概述沉墨的夜 transformer 深度学习人工智能
Transformer架构的提出，不仅在自然语言处理（NLP）领域掀起了革命，也在多个深度学习任务中获得了广泛应用。自2017年由Vaswani等人提出以来，Transformer经历了多次优化和扩展，成为深度学习领域的基石。以下是Transformer架构的演进历程、作用和意义、架构详情以及未来发展趋势的详细阐述。Transformer架构的演进历程(1)Transformer的起源（2017年
【漫话机器学习系列】041.信息丢失（dropout） IT古董漫话机器学习系列专辑机器学习人工智能深度学习
信息丢失（Dropout）Dropout是一种广泛应用于神经网络训练中的正则化技术，旨在减少过拟合（overfitting），提高模型的泛化能力。虽然"信息丢失"（dropout）这个术语在某些情况下可能引起误解，指的并非是数据的丢失，而是训练过程中故意“丢弃”神经网络中的部分神经元。这种做法可以避免模型过于依赖于某些特定的神经元，从而提高模型在新数据上的表现。Dropout的工作原理在神经网络的
Pytorch官方文档英语翻译 yanzhiwen2 深度学习Pyrotch pytorch 机器学习 python 人工智能深度学习
深度学习Pytorch-Pytorch官方文档英语翻译1.a-e1.1span跨度1.2blended混合的1.3criterion标准1.4deprecated弃用的1.5clamp钳制1.6arbitraryshapes任意形状1.7explodinggradients梯度爆炸1.8converge收敛1.9approximate近似1.10arg参数1.11argument参数1.12con
PyTorch中文/英文官方文档&教程资源三千の世界 Python DataAnalysis Computer Science pytorch
PyTorch中文文档https://pytorch-cn.readthedocs.io/zh/latest/PyTorch英文文档https://pytorch.org/docs/stable/index.htmlPyTorch官方教程-PyTorch教程1.1.0文档https://pytorch.org/tutorials/
【PYTORCH】官方的turoria实现中英文翻译 liwulin0506 pytorch python pytorch 人工智能 python
参考https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html背景pytorch官方的是seq2seq是法语到英文，做了一个中文到英文的。数据集下载后解压，使用的data\testsets\devset\UNv1.0.devset.zh和UNv1.0.devset.en，因为电脑配置不行，所以只选取了10
AIMv2：多模态自回归预训练的视觉新突破人工智能
AIMv2：多模态自回归预训练的视觉新突破阅读时长：19分钟发布时间：2025-02-17近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】导言视觉模型在人工智能领域的地位愈发重要，从图像识别、目标检测到多模态理解，其应用场景不断拓展。在大规模数据集上进行预训练，能助力模型学习丰富的视觉特
PyTorch实战深度学习——用CNN进行手写数字识别一位小说男主人工智能入门深度学习
用CNN进行手写数字识别---计算机专业研究生的代码第一课，相当于”HelloWorld“，不管以后选择什么研究方向，都值得一看,欢迎大家留言交流学习！下面手把手教大家一步一步实现该任务：1.环境准备首先呢，您需要确保安装了PyTorch库。如果还没有安装，可以使用以下命令进行安装，这里默认您已经有Anaconda并创建好虚拟环境啦，如果还没有安装，可以参考其他更完整的安装pytorch的教程：p
一文理解大模型，并对当前流行模型做对比 Jing_saveSlave AI ai 人工智能 chatgpt
什么是大模型？大模型就像是一个“超级智能大脑”，它通过海量数据和复杂的计算结构（比如神经网络）学习人类语言、图像、声音等信息的规律。它的核心特点是参数数量极其庞大（比如千亿甚至万亿级），这些参数可以理解为大脑中的“神经元连接”，参数越多，模型越“聪明”，能处理的任务也更复杂。举个例子：小模型：像一个小学生，能解决简单的数学题，但遇到复杂问题容易卡壳。大模型：像一位大学教授，不仅能解数学题，还能写诗
推荐学习图像处理的入门书：《Python图像处理实战》天飓学习感悟学习图像处理 python
《Python图像处理实战》是一本全面介绍Python图像处理技术的实用指南，是由人民邮电出版社于2020年12月出版。这本书的作者桑迪潘·戴伊是一位兴趣广泛的数据科学家，主要研究机器学习、深度学习、图像处理和计算机视觉。在《Python图像处理实战》一书中，作者主要介绍了如何用Python图像处理库（如PIL、python-opencv、Scipy等），机器学习库（scikit-learn）和深
计算机视觉中图像的基础认知全栈你个大西瓜人工智能计算机视觉人工智能图像基本属性 RGB 三通道彩色单通道灰度图像 OpenCV Matplotlib
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络一、图像/视频的基本属性在计算机视觉中，图像和视频的本质是多维数值矩阵。图像或视频数据的一些基本属性。宽度（W）和高度（H）定义了图像的像素分辨率，单位通常是像素。例如，一张1920x1080的图像有1920列（
【深度学习】计算机视觉（CV）-图像分类-ResNet（Residual Network，残差网络） IT古董深度学习人工智能深度学习计算机视觉分类
ResNet（ResidualNetwork，残差网络）是一种深度卷积神经网络（CNN）架构，由何恺明（KaimingHe）等人在2015年提出，最初用于ImageNet竞赛，并在分类任务上取得了冠军。ResNet的核心思想是残差学习（ResidualLearning），它通过跳跃连接（SkipConnections）解决了深度神经网络训练中的梯度消失和梯度爆炸问题，使得非常深的网络（如50层、1
【深度学习基础】什么是注意力机制我的青春不太冷深度学习人工智能注意力机制
文章目录一、注意力机制的核心地位：从补充到主导二、技术突破：从Transformer到多模态融合三、跨领域应用：从NLP到通用人工智能四、未来挑战与趋势结语参考链接注意力机制：深度学习的核心革命与未来基石在深度学习的发展历程中，注意力机制（AttentionMechanism）的引入堪称一场革命。它不仅解决了传统模型的根本性缺陷，更通过动态聚焦关键信息的能力，重塑了人工智能处理复杂任务的范式。本文
【第15章：量子深度学习与未来趋势—15.3 量子深度学习在图像处理、自然语言处理等领域的应用潜力分析】再见孙悟空_ #【深度学习・探索智能核心奥秘】深度学习机器学习人工智能音视频自然语言处理量子深度学习量子学习未来
一、开篇：为什么我们需要关注这场"量子+AI"的世纪联姻？各位技术爱好者们，今天我们要聊的这个话题，可能是未来十年最值得押注的技术革命——量子深度学习。这不是简单的"1+1=2"的物理叠加，而是一场可能彻底改写AI发展轨迹的范式转移。想象这样一个场景：你现在训练一个GPT-5级别的模型，不需要耗费价值上亿美元的算力资源，不需要等待数周的训练时间，甚至不需要纠结于模型参数是否过拟合。这就是量子深度学
【第15章：量子深度学习与未来趋势—15.1 量子计算基础与量子机器学习的发展背景】再见孙悟空_ #【深度学习・探索智能核心奥秘】机器翻译自然语言处理计算机视觉量子计算人工智能深度学习机器学习
想象一下，你正在用ChatGPT生成一篇小说，突然它卡在"主角穿越虫洞"的情节上——这不是因为想象力枯竭，而是传统计算机的晶体管已经烧到冒烟。当前AI大模型的参数规模每4个月翻一番，但摩尔定律的终结让经典计算机的算力增长首次跟不上AI的进化速度。这时候，量子计算带着它的"超能力"登场了：1台50量子位的量子计算机，处理某些问题的速度可达超级计算机的1亿倍。这场算力革命，正在改写深度学习的游戏规则。
Python 循环神经网络（RNN）算法详解与应用案例闲人编程 python python rnn 算法循环神经网络深度学习文本生成
目录Python循环神经网络（RNN）算法详解与应用案例引言一、RNN的基本原理1.1RNN的结构1.2RNN的优势与挑战二、Python中RNN的面向对象实现2.1`RNNCell`类的实现2.2`RNNModel`类的实现2.3`Trainer`类的实现三、案例分析3.1序列预测3.1.1数据准备3.1.2模型训练3.1.3结果分析3.2文本生成3.2.1数据准备3.2.2模型训练3.2.3文
基于深度学习YOLOv10的PCB板缺陷检测系统（附完整资源+PySide6界面+训练代码）人工智能_SYBH 深度学习 YOLO 人工智能目标检测 python
引言：在现代制造业中，电子元件和PCB（印刷电路板）是非常重要的基础设施。PCB缺陷检测是生产过程中至关重要的一步。传统的缺陷检测方法主要依靠人工检查，这不仅效率低，而且容易受到人眼疲劳的影响。随着深度学习技术的不断发展，基于深度学习的自动化缺陷检测已成为研究的热点，尤其是在计算机视觉领域。YOLO（YouOnlyLookOnce）系列算法凭借其高速和高精度的优势，成为了目标检测领域的佼佼者。本文
DeepSeek 混合专家（MoE）架构技术原理剖析计算机学长通用大语言模型人工智能架构
DeepSeek混合专家（MoE）架构技术原理剖析在人工智能快速发展的当下，大规模语言模型不断突破创新，DeepSeek混合专家（MoE）架构脱颖而出，成为业内关注焦点。本文将深入剖析其技术原理，为大家揭开它的神秘面纱。一、MoE架构概述（一）基本概念混合专家（MixtureofExperts，MoE）架构，简单来说，就像是一个专家团队。在这个团队里，每个专家都是一个小型神经网络，各自擅长处理特定
【深度解析】ICLR：人工智能领域的顶级学术会议 | 顶会与SCI期刊的区别全攻略 X_taiyang18 人工智能
【深度解析】ICLR：人工智能领域的顶级学术会议|顶会与SCI期刊的区别全攻略简介在人工智能和机器学习领域，ICLR（InternationalConferenceonLearningRepresentations）被誉为“深度学习的顶级会议”。自2013年由深度学习三巨头中的YoshuaBengio和YannLeCun创办以来，ICLR迅速崛起，成为全球科研人员争相投稿的学术盛会。那么，ICLR
使用多模态大语言模型进行深度学习的图像、文本和语音数据增强数行天下人工智能语言模型深度学习人工智能自然语言处理
在过去的五年里，研究方向已从传统的机器学习（ML）和深度学习（DL）方法转向利用大语言模型（LLMs），包括多模态方法，用于数据增强，以提高泛化能力，并在训练深度卷积神经网络时防止过拟合。然而，现有的综述文章主要集中于机器学习和深度学习技术或有限的模态（如文本或图像），在涵盖LLM方法的最新进展和多模态应用方面仍存在空白。本文通过探索利用多模态LLMs进行图像、文本和语音数据增强的最新文献，填补了
《深入浅出LLM基础篇》（三）：大模型结构分类 GoAI 深入浅出LLM 深入浅出AI 自然语言处理NLP 大模型 LLM 人工智能 transformer chatgpt
AI学习星球推荐：GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|NLP|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料，配有全面而有深度的专栏内容，包括不限于前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关（简历撰写技巧、面经资料与心得）多方面综合学习平台，强烈推荐AI小白及AI爱好者学习，性价比非常高！加入星球➡️点击链接✨专栏介
深入理解TensorFlow中的形状处理函数 SEVEN-YEARS tensorflow 人工智能 python
摘要在深度学习模型的构建过程中，张量（Tensor）的形状管理是一项至关重要的任务。特别是在使用TensorFlow等框架时，确保张量的形状符合预期是保证模型正确运行的基础。本文将详细介绍几个常用的形状处理函数，包括get_shape_list、reshape_to_matrix、reshape_from_matrix和assert_rank，并通过具体的代码示例来展示它们的使用方法。1.引言在深
数字内容体验未来趋势：五大平台横向对比与深度解析清风徐徐de来其他
内容概要当前，企业数字化转型的核心战场正逐步向数字内容体验的精细化运营转移。随着用户行为碎片化与需求多元化趋势加剧，AI驱动的智能推荐系统、基于数据决策的动态优化能力，以及跨渠道的品牌一致性维护，已成为衡量内容平台竞争力的三大核心维度。本文将围绕这三大支柱，通过横向对比主流平台的技术架构与落地实践，揭示未来数字内容体验的演进方向。首先，AI驱动不仅改变了内容分发的效率，更通过深度学习算法实现用户行
DeepSeek底层揭秘——多头潜在注意力MLA 9命怪猫 AI ai 人工智能大模型
目录1.多头潜在注意力（MLA）2.核心功能3.技术要素4.难点挑战暨含解决方案5.技术路径6.应用场景7.实际案例：DeepSeek8.最新研究与技术进展9.未来趋势猫哥说1.多头潜在注意力（MLA）(1)定义“多头潜在注意力（Multi-HeadLatentAttention,MLA）”是一种基于注意力机制的深度学习方法，旨在通过多个注意力头（Multi-HeadAttention）对潜在空间
全面解析：AI大模型入门教程，让你的学习之路不再迷茫，这个大模型学习路线非常详细收藏这篇就够了！ AGI大模型老王人工智能学习大模型 AI大模型大模型学习大模型教程大模型入门
前言AI大模型，作为当前人工智能领域的热点，凭借其强大的处理复杂数据和任务的能力，受到广泛的关注和应用。无论你是技术小白还是有一定基础的开发者，本教程都将带你从入门到实践，逐步掌握AI大模型的核心技术。基础知识大模型概述定义：AI大模型是一种拥有海量参数和强大计算能力的神经网络模型，能够处理复杂的数据和任务。应用：广泛应用于自然语言处理、图像识别、生成等领域。学习大模型的意义提升技术能力：掌握大模
基于DeepSeek-R1的高效推理优化实战：从API封装到动态批处理竹木有心人工智能
引言在LLM（大语言模型）应用中，推理延迟和计算资源消耗是核心痛点。本文以DeepSeek-R1-7B模型为例，通过动态批处理、模型量化和异步推理三大技术，将单次推理耗时从2.3s降至0.4s，吞吐量提升6倍。所有代码均通过PyTorch2.1+验证。一、环境准备与模型加载优化1.1硬件感知的模型加载通过device_map自动分配计算资源，避免显存溢出fromtransformersimport
第2节课：深度学习基础python代码 Lips611 李哥深度学习 python 深度学习神经网络
目录编译环境：代码：文件：ds_0.py小结：python声明不需要定义，整型和浮点型都是直接给予值，字符串的[-2]代表是列表倒数的某值;同一列表里面可以有各种类型的变量;哈希表的键值对在打印时是调用字典[key]，然后输出对应的value文件：judge_0.py小结：python相对于c语言，是将（）换成空格和“：”，与此同时判断语句if和else的缩进不同对应着不同层次的判定条件，约等于“
深度学习在蛋白质-蛋白质相互作用（PPI）领域的研究进展（2022-2025） AndrewHZ 深度学习人工智能 transformer 算法科技
一、蛋白质-蛋白质相互作用（PPI）的定义与生物学意义蛋白质-蛋白质相互作用（Protein-ProteinInteraction,PPI）是指两个或多个蛋白质通过物理结合形成复合物，进而调控细胞信号传导、代谢、免疫应答等生命活动的过程。PPI是生物体内复杂功能网络的核心，例如酶与底物的结合、抗体与抗原的识别、受体与配体的信号传递等均依赖于此。据估计，人类蛋白质组中约80%的功能通过PPI实现，其
DeepSeek 引领的 AI 范式转变与存储架构的演进星辰@Sea 人工智能其他人工智能
引言在过去的几十年中，人工智能（AI）技术经历了翻天覆地的变化，从最初的符号主义到连接主义，再到现在的深度学习，每一次技术革新都推动了AI能力的显著提升。而在这场变革中，DeepSeek作为一股不可忽视的力量，正在引领AI范式的转变，并深刻影响着存储架构的发展。在这篇博客中，我们将深入探讨DeepSeek如何推动AI范式的转变，以及这种转变对存储架构带来的深远影响。通过分析当前AI技术的发展趋势，
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发