浅度学习的ryan

CV笔记03：自监督GAN(ss-gan)

无需标注数据，利用辅助性旋转损失的自监督GANs，-- 对抗+自监督的无监督方式

《通过辅助旋转损失进行的自监督GAN》CVPR 2019

论文速看

0.摘要

目前自然图像合成主要是条件GAN，但是其缺点是需要标注数据。
我们利用两种流行的无监督学习技术，对抗训练和自我监督，并朝着缩小有条件GAN和无条件GAN之间的差距迈出了一步。
我们允许网络在代表学习的任务上进行协作，同时相对于经典GAN博弈具有对抗性。
自监督的作用是鼓励鉴别器学习在训练过程中不会忘记的有意义的特征表示。
做了实验，我们的东西很牛逼。

1.介绍

GAN是无监督生成模型。
训练GAN具有挑战性，通常使用交替的随机梯度下降训练，该下降通常不稳定并且缺乏理论上的保证。
训练不稳定的一个主要因素是生成器和判别器在非平稳环境中学习，随着样本分布的变化，鉴别器会发生遗忘。
调节以便生成器和鉴别器都可以访问标记的数据。在监督信息的基础上增加鉴别器，会鼓励鉴别器学习更稳定的表示法，以防止灾难性遗忘。
我们的目标是表明人们可以在不需要标签数据的情况下恢复调节的好处。为了确保判别器学习到的表示更加稳定和有用，我们向判别器添加了辅助的，自我监督的损失。
我们介绍了一种新颖的模型-自我监督GAN-在这种模型中，生成器和鉴别器在表示学习的任务上进行协作，并在生成任务上进行竞争。

贡献：

我们提出了一种将对抗训练与自我监督学习相结合的无监督生成模型。我们的模型恢复了条件GAN的优势，但不需要标记数据。特别是，在相同的训练条件下，自我监督的GAN弥补了无条件模型与有条件模型之间自然图像合成的空白。在这种情况下，鉴别器表示的质量将大大提高，这在迁移学习的背景下可能会引起另外的关注。该模型的大规模实施在无条件IMAGENET生成上产生了可喜的结果，这一任务被认为是艰巨的。我们认为，这项工作是朝着高质量，完全无监督的自然图像合成方向迈出的重要一步。

6.结论和展望

从解决判别器遗忘出发，我们提出了一种将对抗性学习和自我监督学习相结合的深度生成模型。可以在图像合成任务上匹配等效的条件GAN，而无需访问标记的数据。

有监督、无监督、自监督

这三个监督都比较常见，但容易搞混

机器学习的常用方法，主要分为有监督学习(supervised learning)和无监督学习(unsupervised learning)。

有监督（有人教），无监督（没人教）

监督学习，就是人们常说的分类，通过已有的训练样本（即已知数据以及其对应的输出）去训练得到一个最优模型（这个模型属于某个函数的集合，最优则表示在某个评价准则下是最佳的），再利用这个模型将所有的输入映射为相应的输出，对输出进行简单的判断从而实现分类的目的，也就具有了对未知数据进行分类的能力。在人对事物的认识中，我们从孩子开始就被大人们教授这是鸟啊、那是猪啊、那是房子啊，等等。我们所见到的景物就是输入数据，而大人们对这些景物的判断结果（是房子还是鸟啊）就是相应的输出。当我们见识多了以后，脑子里就慢慢地得到了一些泛化的模型，这就是训练得到的函数，从而不需要大人在旁边指点的时候，我们也能分辨的出来哪些是房子，哪些是鸟。监督学习里典型的例子就是KNN、SVM。

无监督学习（也有人叫非监督学习）则是另一种研究的比较多的学习方法，它与监督学习的不同之处，在于我们事先没有任何训练样本，而需要直接对数据进行建模。这听起来似乎有点不可思议，但是在我们自身认识世界的过程中很多处都用到了无监督学习。比如我们去参观一个画展，我们完全对艺术一无所知，但是欣赏完多幅作品之后，我们也能把它们分成不同的派别（比如哪些更朦胧一点，哪些更写实一些，即使我们不知道什么叫做朦胧派，什么叫做写实派，但是至少我们能把他们分为两个类）。无监督学习里典型的例子就是聚类了。聚类的目的在于把相似的东西聚在一起，而我们并不关心这一类是什么。因此，一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。

自监督学习（self-supervised learning）可以被看作是机器学习的一种“理想状态”，模型直接从无标签数据中自行学习，无需标注数据。

(1) 自监督学习的核心，在于如何自动为数据产生标签。例如输入一张图片，把图片随机旋转一个角度，然后把旋转后的图片作为输入，随机旋转的角度作为标签。再例如，把输入的图片均匀分割成3*3的格子，每个格子里面的内容作为一个patch，随机打乱patch的排列顺序，然后用打乱顺序的patch作为输入，正确的排列顺序作为label。类似这种自动产生的标注，完全无需人工参与。

(2) 自监督学习如何评价性能？自监督学习性能的高低，主要通过模型学出来的feature的质量来评价。feature质量的高低，主要是通过迁移学习的方式，把feature用到其它视觉任务中（分类、分割、物体检测…），然后通过视觉任务的结果的好坏来评价。目前没有统一的、标准的评价方式。

(3) 自监督学习的一个研究套路。前面说到，自监督学习的核心是如何给输入数据自动生成标签。之前的很多工作都是围绕这个核心展开的。一般的套路是：首先提出一个新的自动打标签的辅助任务（pretext task，例如：旋转图片、打乱patch顺序），用辅助任务自动生成标签，然后做实验、测性能、发文章。每年都有新的辅助任务被提出来，自监督学习的性能也在不断提高，有的甚至已经接近监督学习的性能。总体上说，或者是提出一种完全新的辅助任务，或者是把多个旧的辅助任务组合到一起作为一个“新”的辅助任务。

论文解读

主要idea

利用辅助损失解决GAN不稳定的问题；用旋转分类将辅助分类器对label的需求去掉，使图片可以直接对自己标注类别。

判别器的遗忘

判别器可以看作是一个简单的分类器，区分出真、假两种类型。为了实现这个目的，直觉上，判别器必须很好的理解输入图片。具体来说，判别器需要学会如何从输入图片中提取出好的feature，帮助其完成分类任务。

实际上，GAN这种独特的训练模式，对判别器来说，不是很友好。由于生成器在训练过程中在不断地更新，导致判别器的输入，也在不断的更新。对于不同分布的输入图片，判别器可能会学出来不同的策略来提取feature。例如，假设生成器刚开始只学会了如何生成总体轮廓结构为真的sample（细节纹理还没学会），此时判别器可能只会从轮廓结构方面对真假进行判断。随着训练的不断进行，生成器不断的更新，不同时刻的可能偏重的重点不一样，导致生成的图片的分布不一样，最后导致判别器提取feature的策略可能也不一样。

从判别器的角度来看，它要不断地“忘掉”已经学到的提取feature的方法，不断地学习新的提取feature的方法。似乎也不能完全怪判别器，因为在旧分布图片集上学到的feature提取方法，在新分布图片集上，可能已经不再适用了，所以只能“忘掉”。这可能是GAN不稳定的一个重要原因。

作者做的两个实验也很有意思，清晰明了。

第一个实验分别用不同迭代时刻的判别器作为feature提取器，在ImageNet上训练一个分类器，比较判别分类器的性能，实验结果如上图。

蓝色表示GAN的测试结果，绿色表示添加了自监督学习任务的方法。从实验结果可以看出，从500k开始，蓝色表示的判别器似乎开始“健忘”，性能也开始下降。说明判别器学到的feature提取方法很不稳定。

第二个实验在CIFAR10上训练一个分类器，训练的时候，依次用CIFAR10中的10个类来训练，每个类训练1k个iterations。左图表示GAN的测试结果，右图表示添加了自监督学习任务的方法。

从左边的实验结果可以看出，每次训练图片的类型发生变化时，分类器的性能明显下降。10k个iterations后，看上去像是从头开始学习，之前学到的方法好像已经全部“忘掉”了。

所以我们要解决判别器遗忘这件事，就有了将辅助手段添加到GAN中引导判别器的训练。解决的思路是让判别器有记忆，或者说去影响判别器的训练过程。

网络结构

自监督背后的主要思想是预测旋转图像的角度或者相关图像块的位置，然后从结果网络提取表征。

作者采用了基于图像旋转的自监督学习方法。此方法主要将图像旋转，然后将图像旋转的角度作为人工标注。如上图，红色判别器的任务和普通的GAN模型中的一样，判断图片来自真实数据还是生成器生成的假数据，得到一个分类损失 $P_D(S\mid x)$ 。蓝色判别器的任务是将不同旋转角度的图片进行分类，真和假的图片都会被旋转90°, 180°, 270°，得到一个旋转分类损失 $Q_D(R\mid x^r)$ 。

具体操作是取Discriminator倒数第二层的输出，作为feature，加上一个Linear层，预测出旋转的类型。

合作对抗训练

该模型最大的特点是在表征学习（旋转角度分类任务）上让判别器和生成器协同，在判断True/Fake任务上又让二者回归原始的GAN中进行对抗。

首先生成器生成的图像是直立的，也就是0°的图像，这些图像之后会被旋转送入判别器。这样做是为了使生成器生成的图像更加偏向真实图像，以便于在旋转之后更容易判断出旋转角度。然后，判别器判别旋转角度时，只使用真实图片。换句话说，判别器的参数更新只基于真实数据的旋转分类损失。这样做也是为了使生成器生成的图像在旋转之后更易于检测。结果就是，生成器生成的图片非常有利于旋转检测，因为生成的图片和真实的图片共享特征，它们都有适用于旋转检测的特征。

在实际的操作中，作者利用了单一判别器网络，它包括两个部分来计算分类损失 $P_D(S\mid x)$ 和旋转分类损失 $Q_D(R\mid x^r)$ 。所有的图片一共有四个角度，**没有经过旋转的图片用于让判别器判断真假；而经过旋转的图片用于让判别器判断旋转角度。**生成器的目标是生成能与观测图像匹配的图像，这些观测图像的在特征空间的判别器的表征是能够用来检测旋转角度。

当 $\alpha >0$ 时，对于真实数据分布下的 $P_G=P_{data}$ 的收敛是不能保证的，但是呢，在训练期间，将 $\alpha$ 退火接近 0 是能得到保证。

损失函数

对于真假训练的value function不变：

$V (G, D)$ 也就是原始GAN函数。

而在此基础上，作者增加了分类判别器（也就是旋转判别器）：

$r$ 代表旋转角度，包括0,90,180,270， $x^r$ 代表图像 $x$ 的旋转角度。

代码

GitHub地址:https://github.com/zhangqianhui/Self-Supervised-GANs

这篇论文是采用tf 1.版本写的，淘汰的地方跳过。

项目核心就是Model.py这个程序，在Model.py程序中，一共就只定义了一个SSGAN的类，但足足有500多行。

class SSGAN(object):
    # 定义一堆参数
    def __init__(self, flags, data):
        pass
    # 定义一些loss
    def build_model_GAN(self):
        pass
    # 计算精确度
    def Accuracy(self, pred, y):
        pass
    # 判别器loss
    def loss_dis(self, d_real_logits, d_fake_logits):
        pass
    # 由角度旋转图像
    def Rotation_by_R_label(self, image, r):
        pass
    # 打印出所有旋转角度的图像
    def Rotation_ALL(self, images):
        pass
    # 生成器loss
    def loss_gen(self, d_fake_logits):
        pass
    # hinge loss 铰链损失（判别器）
    def loss_hinge_dis(self, d_real_logits, d_fake_logits):
        pass
    # 铰链损失（生成器）
    def loss_hinge_gen(self, d_fake_logits):
        pass
    # KL散度
    def kl_loss_compute(self, logits1, logits2):
        pass
    # 已有训练好的模型，进行测试
    def test2(self):
        pass
    # 整个训练过程
    def train(self):
        pass
    # 定义判别器，输出一个sigmoid结果
    def discriminate(self, x_var, resnet=False, reuse=False):
        pass
    # 定义生成器，一层层卷积激活函数，最后tanh出来
    def generate(self, z_var, batch_size=64, resnet=False, is_train=True,
                 reuse=False):
        pass
    
    def _init_inception(self):
        pass

定义判别器的函数部分，可以看出生成器和判别器都是在tf.variable_scope空间作用域里面创建的

def discriminate(self, x_var, resnet=False, reuse=False):
    """
    x_var代表输入，discriminate()函数被应用在build_model_GAN()中，其输入值为输入图片
    resnet是作者定义的一个布尔值，表示是否使用残差架构
    reuse是tensorflow中为了节约变量存储空间，通过共享变量作用域(variable_scope)来实现共享变量的方式
    """
    print x_var.shape
    with tf.variable_scope("discriminator") as scope:

        if reuse:
            scope.reuse_variables()  # 如果重复使用变量，创建独立的空间

        if resnet == False:  # 如果不使用残差结构
            # 现在基本用leakyRelu挺广泛的
            conv1 = lrelu(conv2d(x_var, spectural_normed=self.sn, 
                                 iter=self.iter_power, output_dim=64, 
                                 kernel=3, stride=1,  name='dis_conv1_1'))  
            conv2 = lrelu(conv2d(conv1, spectural_normed=self.sn,
                                 iter=self.iter_power,    
                                 output_dim=128, name='dis_conv2_2'))             
            conv3 = lrelu(conv2d(conv2, spectural_normed=self.sn,
                                 iter=self.iter_power,   
                                 output_dim=256, name='dis_conv3_2'))
            conv4 = lrelu(conv2d(conv3, spectural_normed=self.sn,
                                 iter=self.iter_power,   
                                 output_dim=512, kernel=1, name='dis_conv4'))
            # num_rotation是旋转角度(0,90,180,270)
            # 把conv4 reshape成[batch数*旋转角度，-1] -1占位符
            conv4 = tf.reshape(conv4, [self.batch_size*self.num_rotation, -1])
            #for D
            # 计算出全连接的一个输出gan_logits
            gan_logits = fully_connect(conv4, spectural_normed=self.sn,
                                       iter=self.iter_power,      
                                       output_size=1, scope='dis_fully1')
            if self.ssup:  # 如果使用自监督学学习
                rot_logits = fully_connect(conv4, spectural_normed=self.sn, 
                                           iter=self.iter_power,output_size=4, 
                                           scope='dis_fully2')
                rot_prob = tf.nn.softmax(rot_logits)

        else:  # 使用残差结构
            # 用自己定义的残差块函数配置
            re1 = Residual_D(x_var, spectural_normed=self.sn, output_dims=128,    
                             residual_name='re1', down_sampling=True, is_start=True)
            re2 = Residual_D(re1, spectural_normed=self.sn, output_dims=128,    
                             residual_name='re2', down_sampling=True)
            re3 = Residual_D(re2, spectural_normed=self.sn, output_dims=128,    
                             residual_name='re3')
            re4 = Residual_D(re3, spectural_normed=self.sn, output_dims=128,    
                             residual_name='re4')
            re4 = tf.nn.relu(re4)
            # gsp
            # 以axis=[1, 2]来减少re4的张量
            gsp = tf.reduce_sum(re4, axis=[1, 2])
            gan_logits = fully_connect(gsp, spectural_normed=self.sn,
                                       iter=self.iter_power, 
                                       output_size=1, scope='dis_fully1')

            if self.ssup:  # 使用残差+使用自监督学习
                rot_logits = fully_connect(gsp, spectural_normed=self.sn,
                                           iter=self.iter_power, 
                                           output_size=4, scope='dis_fully2')
                rot_prob = tf.nn.softmax(rot_logits)

        #tf.summary.histogram("logits", gan_logits)     
        if self.ssup:   # 自监督返回sigmoid(gan_logits), gan_logits, rot_logits, rot_prob
            return tf.nn.sigmoid(gan_logits), gan_logits, rot_logits, rot_prob
        else:   # 非自监督返回sigmoid(gan_logits), gan_logits
            return tf.nn.sigmoid(gan_logits), gan_logits

生成器和判别器都用到自己的残差块

def Residual_G(x, output_dims=256, kernel=3, strides=1, spectural_normed=False, 
               up_sampling=False, residual_name='resi'):

    with tf.variable_scope('residual_{}'.format(residual_name)):

        def short_cut(x):
            x = upscale(x, 2) if up_sampling else x
            return x

        x = tf.nn.relu(batch_normal(x, scope='bn1'))
        conv1 = upscale(x, 2) if up_sampling else x
        conv1 = conv2d(conv1, output_dim=output_dims, 
                       spectural_normed=spectural_normed,        
                       kernel=kernel, stride=strides, name="conv1")
        conv2 = conv2d(tf.nn.relu(batch_normal(conv1, scope='bn2')),
                       output_dim=output_dims, 
                       spectural_normed=spectural_normed,kernel=kernel,
                       stride=strides, 
                       name="conv2")
        resi = short_cut(x) + conv2   # 关键的加法
        return resi

def Residual_D(x, output_dims=256, kernel=3, strides=1, spectural_normed=True, 
               down_sampling=False, residual_name='resi', is_start=False):

    with tf.variable_scope('residual_{}'.format(residual_name)):

        def short_cut(x):
            x = avgpool2d(x, 2) if down_sampling else x
            x = conv2d(x, output_dim=output_dims, spectural_normed=spectural_normed,
                       kernel=1,
                       stride=1, name='conv')
            return x

        if is_start:
            conv1 = tf.nn.relu(conv2d(x, output_dim=output_dims,  
                                      spectural_normed=spectural_normed,
                                      kernel=kernel,        
                                      stride=strides, name="conv1"))
            conv2 = tf.nn.relu(conv2d(conv1, output_dim=output_dims, 
                                      spectural_normed=spectural_normed,
                                      kernel=kernel,
                                      stride=strides, name="conv2"))
            conv2 = avgpool2d(conv2, 2) if down_sampling else conv2
        else:
            conv1 = conv2d(tf.nn.relu(x), output_dim=output_dims, 
                           spectural_normed=spectural_normed, kernel=kernel,
                           stride=strides, 
                           name="conv1")
            conv2 = conv2d(tf.nn.relu(conv1), output_dim=output_dims, 
                           spectural_normed=spectural_normed, kernel=kernel,
                           stride=strides, 
                           name="conv2")
            conv2 = avgpool2d(conv2, 2) if down_sampling else conv2

        resi = short_cut(x) + conv2
        return resi

总结

这篇文章不难，主要是思路独特清晰，利用图片自身旋转代替分类，再用这个分类损失辅助GAN解决GAN训练的问题，非常巧妙。

一些启发

自监督学习是一类方法的总称，其主要目的是通过解决替代的任务来学习高维的语义表征。广泛的应用在视频领域、机器人领域和图像领域。例如有论文提出通过旋转图像来预测其旋转角度，这种方法看上去简单但是却能产生有用的表征，比如由上往下的图像分类任务上。

除了能试着预测旋转角度，还可以编辑给定的图像和要求网络去预测被编辑的部分。还有其他的替代的任务，包括图像修复、通过一张灰度图像预测颜色通道和预测监督的聚类。最近还有通过现代神经结构进行自监督学习。

同时作者指出对一些工作能起到促进的作用，首先使用最好的自监督结构应用在判别器上，并且优化取得可能更好的表征，其次自监督GAN可以应用在半监督条件下，可以用小部分的标注数据用于微调模型。最终可能应用一下的方法，在非条件图像生成中，比如使用自注意力，正交正则化和规范化和采样截断来取得更好的表现。

小补充：为什么简简单单的旋转就这么有用呢？

站在我们人类的角度，我们看到这张图片，我们能一眼分辨出这是旋转0度的直立的图片。

因为我们理解图片，我们知道下面是地，上面蓝色的是天，树是直立得长在地上的，所以我们能判断出他的旋转角度。

这样，我们让机器去学习去判断，当模型能够判断出它的旋转角度，说明它的feature map包含了丰富的图片语义信息，也就是说，模型能看懂图片了。

旋转角度，只是一种标签数据的形式。预测旋转角度，只是一种手段。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本