冰海228

一文掌握MobileNetV1和MobileNetV2（基于pytorch实现的人像背景虚化）

一、概述

二、MobileNetV1原理和实现

2.1 原理

2.1.1 深度卷积

2.1.2 逐像素卷积

2.2 Pytorch实现

三、MobileNetV2原理和实现

3.1 原理

3.1.1 ReLU6激活函数

3.1.2 Inverted Residual

3.2 Pytorch实现

四、应用（基于人像快速分割的背景虚化处理）

4.1 概述

4.2 算法原理

4.3 训练

4.4 背景虚化

五、小结

参考文献

一、概述

现阶段深度神经网络在GPU上运行其速度已经可以达到实时性要求，但是如果将训练好的模型直接移植到手机端或者在CPU上运行，这时候速度和内存消耗就是非常致命的问题，只有对模型进行优化才能满足这种资源受限场景中的深度神经网络的使用。模型优化加速主要包含3种类型：1.设计轻量级的网络；2.网络模型压缩剪枝；3.其他的一些量化加速。本文主要探讨轻量级网络的运用。

在轻量级网络中，考虑到通用性和实用性，典型算法就是MobileNet系列，从其名字也可以看出来，该系列算法旨在为移动（Mobile）设备进行智慧赋能，具体包括MobileNetV1、MobileNetV2和MobileNetV3，三大算法按照时间先后顺序依次被研究学者提出。通过使用该系列算法，可以在原有模型的基础上大幅减少模型参数，从而提高模型处理速度和并且内存消耗，在实际工业级产品方案中该优势显得异常重要，因为工业场景中往往是资源受限的（可能在没有GPU的工控机或者在嵌入式上进行开发）。

如果从产品部署角度考虑，那么目前深度学习的热潮已经逐步从Web服务器端转向终端硬件，即转向所谓的“边缘计算”需求。众多大厂纷纷在此发力，力求能够推出自家的带GPU的终端硬件产品，其中以英伟达推出的Jetson系列最为成功。Jetson系列不仅体积小巧，而且自带GPU，因此已经推出收到广泛关注。但是，在这种嵌入式开发板上跑重量级的深度学习模型依然是一个难题，即使攻克显存的瓶颈，在速度上面依然很慢。为此，对原模型进行优化，使得模型参数大幅减少从而能够利用低廉的终端设备实现智能算法应用成为了一个AI工程师必经之路。

本文将详细阐述MobileNetV1和MobileNetV2，从原理切入，然后给出对应的Pytorch实现方法，最后结合MobileNetV2算法，给出一个具体应用的实例。

二、MobileNetV1原理和实现

2.1 原理

MobileNetV1的提出是为了解决移动端设备深度学习推理速度受限问题产生的。传统的卷积神经网络在移动设备上运行速度极慢并且会消耗移动设备大量内存资源。因此，MobileNetV1最大的贡献就是改进传统CNN结构，使得整个模型仅仅降低少量的精度但是却可以极大的提高速度，模型参数量可以减少8倍以上。具体的，MobileNetV1提出了深度可分离卷积（depthwise separable convolution）来代替传统的CNN。

2.1.1 深度卷积

首先来看一下传统卷积的实现方式，假设输入图像是3通道图，长宽均为256,采用5x5卷积核进行卷积操作，输出通道数为16，padding为0，stride为1，那么卷积后输出为252X252X16，如下图所示：

图1 传统卷积操作

传统的卷积网络是跨通道的，对于上图3通道的输入特征，我们要得到通道数为16的输出特征。普通卷积使用16个不同的 5x5x3 以滑窗的形式遍历输入特征，因此对于一个尺寸为5x5的卷积的参数个数为 5x5x3x16 。实际的计算量为5x5x3x16x256x256。可以看到，单层卷积计算量还是非常大的。MobileNetV1的提出就是为了解决这个问题。

在MobileNetV1中采用深度可分离卷积（depthwise separable convolution）来代替传统的CNN。depthwise separable convolution可以分为两部分：

图2 深度可分离卷积

其中Depthwise卷积是指不跨通道的卷积，也就是说特征图的每个通道有一个独立的卷积核，并且这个卷积核作用且仅作用在这个通道之上。对于图1所示的3通道输入特征，如果采用deepwise卷积进行操作，那么就变成了使用3个滤波器，每个滤波器单独的作用于一个通道上，每个卷积得到一个通道特征，最后合并产生3通道特征。也就是说使用deepwise卷积后不会改变原始输入通道数。

图3 深度卷积

通过上述深度卷积示意图可以知道，该操作的参数量为5x5x3,计算量为5x5x3x256x256。

2.1.2 逐像素卷积

采用深度卷积对每层的通道数均进行了卷积特征提取操作，但是这些特征是在单一的特征通道上完成的，各个通道特征之间的信息是独立的，那么如何对各通道特征进行融合，使得最终的输入通道数为16呢？这里就可以是使用逐点卷积来完成。本质上来说，逐点卷积的作用就是来对特征通道进行升维和降维。

实际操作时使用1x1卷积来完成逐点卷积这个功能。该操作参数量为1x1x3x16, 计算量为1x1x3x252x252x16。

因此综合一下，采用深度可分离卷积总的参数量为5x5x3+1x1x3x16,相比于普通卷积的5x5x3x16，占（1/16+1/25)。而计算量上来看，采用深度可分离卷积总的计算量为5x5x3x256x256+1x1x3x252x252x16，相比于普通卷积的5x5x3x16x256x256，同样占(1/16+1/25)左右。如果我们采用的不是5x5卷积，而是常用的3x3卷积，那么一般来说使用深度可分离卷积仅仅只需要普通卷积的1/9左右计算量。

MobileNetV1正是基于这个原理，实现了模型参数和计算量的大幅减少。最为重要的是，尽管对模型进行了高度压缩，但是采用该算法精度上并没有下降很多，具体指标可以参考相关论文。

2.2 Pytorch实现

使用Pytorch实现深度可分离卷积比较简单，只需要设置好torch.nn.Conv2d()命令中的groups参数即可。根据官方定义该参数控制输入和输出之间的连接：group=1时输出是所有的输入的卷积；group=2，此时相当于有并排的两个卷积层，每个卷积层计算输入通道的一半，并且产生的输出是输出通道的一半，随后将这两个输出连接起来。当group=输入通道数时，此时就是我们需要的深度卷积。在深度卷积之后再跟一个1x1的卷积即可实现完整的深度可分离卷积。

具体代码如下：

def conv_dw(inp, oup, stride):
    '''
    深度可分离卷积
    inp:输入通道数
    oup：输出通道数
    stride：步长
    '''
    return nn.Sequential(
        nn.Conv2d(inp, inp, 3, stride, 1, groups=inp, bias=False),
        nn.BatchNorm2d(inp),
        nn.ReLU(inplace=True),
        nn.Conv2d(inp, oup, 1, 1, 0, bias=False),
        nn.BatchNorm2d(oup),
        nn.ReLU(inplace=True),
    )

三、MobileNetV2原理和实现

3.1 原理

MobileNetV2主要创新点就是在MobileNetV1中加入了残差网络，同时提出了一个新的I激活函数ReLU6。

3.1.1 ReLU6激活函数

在MobileNetV2论文中指出，当输出通道数较少的时候使用ReLU会导致信息损耗严重，因此需要将ReLU替换成线性激活函数。为此，MobileNetV2提出了ReLU6激活函数，它是对ReLU在整数6上的截断，数学形式为：

示意图如下图所示：

也就是说输出值如果在0到6之间，那么输出值不变，当超过6时输出统一截断为6。该论文作者通过实验验证了上述激活函数的有效性。实际使用Pytorch时可以直接使用现成的nn.ReLU6()函数实现。

3.1.2 Inverted Residual

MobileNetV2使用了残差网路结构，并且在设计该结构时与以往的不同。深度卷积本身没有改变通道的能力，输入多少通道输出就是多少通道。如果输入通道很少的话，深度卷积（DW）只能在低维度上工作，这样效果并不会很好，所以MobileNetV2首先会“扩张”通道。通过前面可以知道逐点卷积（PW）也就是1×1卷积可以用来升维和降维，那就可以在深度卷积DW之前使用逐点卷积PW行升维（升维倍数为t，t=6），再在一个更高维的空间中进行卷积操作来提取特征，最后再采用PW将通道数下降还原回来，如下图所示：

最后像Resnet一样复用输入特征，引入shortcut连接，这样V2的单个block就是如下图形式：

可以发现,MobileNetV2采用了1×1 -> 3 ×3 -> 1 × 1 的卷积模式，并且采用了Shortcut结构。但是整体与Resnet结构有不同：

ResNet 先降维 (0.25倍)、卷积、再升维。
MobileNetV2 则是先升维 (6倍)、卷积、再降维。

MobileV2的block刚好与Resnet的block相反，因此将其命名为Inverted residuals（反向残差）。

3.2 Pytorch实现

MobileNetV2中最关键的就是反向残差模型，代码如下：

class InvertedResidual(nn.Module):
    def __init__(self, inp, oup, stride, expand_ratio):
        super(InvertedResidual, self).__init__()
        self.stride = stride
        assert stride in [1, 2]

        self.use_res_connect = self.stride == 1 and inp == oup

        self.conv = nn.Sequential(
            # pw
            nn.Conv2d(inp, inp * expand_ratio, 1, 1, 0, bias=False),
            nn.BatchNorm2d(inp * expand_ratio),
            nn.ReLU6(inplace=True),
            # dw
            nn.Conv2d(inp * expand_ratio, inp * expand_ratio, 3, stride, 1, groups=inp * expand_ratio, bias=False),
            nn.BatchNorm2d(inp * expand_ratio),
            nn.ReLU6(inplace=True),
            # pw-linear
            nn.Conv2d(inp * expand_ratio, oup, 1, 1, 0, bias=False),
            nn.BatchNorm2d(oup),
        )

    def forward(self, x):
        if self.use_res_connect:
            return x + self.conv(x)
        else:
            return self.conv(x)

其中expand_ratio参数为了与论文一致一般取6。另外，上述代码中当stride == 1 且输入通道数 inp == 输出通道数oup时，采用resnet残差网络，在前向推理时会链接输入端。

至此，本文已讲述完MobileV1和MobileV2系列，下面将重点使用MobileV2算法，结合Unet网络模型进行人像和背景分割，最终实现类似单反的背景虚化效果。

四、应用（基于人像快速分割的背景虚化处理）

4.1 概述

单反相机经常会被用来进行背景虚化拍摄以获取一些很漂亮的照片，通过镜头操作凸显照片中的主体内容，而其余背景部分呈现模糊效果。如下图所示：

但是，单反相机本身成本较高，因此，出现了很多软件算法来实现类似的背景虚化效果。算法实现时一般分为下面三个步骤：

对前景物体进行抠图，得到前景抠图掩码；
前景之外的背景进行模糊操作；
模糊背景图和原始高清图按照抠图掩码进行融合

可以看到，整个背景虚化算法的核心在于准确的提取出前景的抠图掩码，为了能够高效率且准确的完成上述任务，我们采用基于深度学习的语义分割算法来实现，同时结合MobileNetV2算法，进一步加快算法的执行速度并且降低模型参数量，方便未来将应用集成到手机端运行。

4.2 算法原理

考虑到前景物体的多样性，一种有效的解决方案就是先用显著性检测算法将显著物体定位出来，再进行背景虚化，但是这种处理方式在物体边缘处分割精度不高，为此，我们进一步聚焦，将目标对准人像处理，即实现人像的自动分割，在这个基础上，可以训练出一个较准确的人像自动分割模型。

整个训练算法采用爱分割提供的3万多张高精度人像分割数据集进行实验，部分样例如下所示：

所有图像均已处理成600X800像素大小，每张图像均提供标注好的高精度掩码。

算法部分采用UNet网络结构，分成编码encode和解码decode两部分，其中编码部分使用MobileNetV2提供逐级下采样的特征图。模型示意图如下所示：

输入图像为3通道数据（R、G、B），输出也是三通道，对应前景掩码、背景掩码、不确定区域掩码。之所以不是二值分割，而是采用三值分割主要是仿照human semantic matting那篇论文。

对照前面的反向残差模型InvertedResidual，我们构造mobilenet_v2模型用于实现UNet中的编码网络：

class mobilenet_v2(nn.Module):
    def __init__(self, nInputChannels=3):
        super(mobilenet_v2, self).__init__()
        # 1
        self.head_conv = nn.Sequential(nn.Conv2d(nInputChannels, 32, 3, 1, 1, bias=False),
                                       nn.BatchNorm2d(32),
                                       nn.ReLU())
        # 1
        self.block_1 = InvertedResidual(32, 16, 1, 1)
        # 1/2 
        self.block_2 = nn.Sequential( 
            InvertedResidual(16, 24, 2, 6),
            InvertedResidual(24, 24, 1, 6)
            )
        # 1/4 
        self.block_3 = nn.Sequential( 
            InvertedResidual(24, 32, 2, 6),
            InvertedResidual(32, 32, 1, 6),
            InvertedResidual(32, 32, 1, 6)
            )
        # 1/8 
        self.block_4 = nn.Sequential( 
            InvertedResidual(32, 64, 2, 6),
            InvertedResidual(64, 64, 1, 6),
            InvertedResidual(64, 64, 1, 6),
            InvertedResidual(64, 64, 1, 6)            
            )
        # 1/16
        self.block_5 = nn.Sequential( 
            InvertedResidual(64, 96, 1, 6),
            InvertedResidual(96, 96, 1, 6),
            InvertedResidual(96, 96, 1, 6)          
            )
        # 1/32 
        self.block_6 = nn.Sequential( 
            InvertedResidual(96, 160, 2, 6),
            InvertedResidual(160, 160, 1, 6),
            InvertedResidual(160, 160, 1, 6)          
            )
        # 1/32
        self.block_7 = InvertedResidual(160, 320, 1, 6)

    def forward(self, x):
        x = self.head_conv(x)
        # 1
        s1 = self.block_1(x)
        # 1/2 
        s2 = self.block_2(s1)
        # 1/4
        s3 = self.block_3(s2)
        # 1/8
        s4 = self.block_4(s3)
        s4 = self.block_5(s4)
        # 1/16
        s5 = self.block_6(s4)
        s5 = self.block_7(s5)

        return s1, s2, s3, s4, s5

完整的模型定义为TNet，代码如下：

class tnet(nn.Module):
    '''
        mmobilenet v2 + unet 

    '''

    def __init__(self, classes=3):

        super(tnet, self).__init__()
        # -----------------------------------------------------------------
        # encoder  
        # ---------------------
        self.feature = mobilenet_v2()

        # -----------------------------------------------------------------
        # decoder 
        # ---------------------

        self.s5_up_conv = nn.Sequential(nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True),
                                        nn.Conv2d(320, 96, 3, 1, 1),
                                        nn.BatchNorm2d(96),
                                        nn.ReLU())
        self.s4_fusion = nn.Sequential(nn.Conv2d(96, 96, 3, 1, 1),
                                       nn.BatchNorm2d(96))

        self.s4_up_conv = nn.Sequential(nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True),
                                        nn.Conv2d(96, 32, 3, 1, 1),
                                        nn.BatchNorm2d(32),
                                        nn.ReLU())
        self.s3_fusion = nn.Sequential(nn.Conv2d(32, 32, 3, 1, 1),
                                       nn.BatchNorm2d(32))

        self.s3_up_conv = nn.Sequential(nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True),
                                        nn.Conv2d(32, 24, 3, 1, 1),
                                        nn.BatchNorm2d(24),
                                        nn.ReLU())
        self.s2_fusion = nn.Sequential(nn.Conv2d(24, 24, 3, 1, 1),
                                       nn.BatchNorm2d(24))

        self.s2_up_conv = nn.Sequential(nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True),
                                        nn.Conv2d(24, 16, 3, 1, 1),
                                        nn.BatchNorm2d(16),
                                        nn.ReLU())
        self.s1_fusion = nn.Sequential(nn.Conv2d(16, 16, 3, 1, 1),
                                       nn.BatchNorm2d(16))

        self.last_conv = nn.Conv2d(16, classes, 3, 1, 1)
        self.last_up = nn.Upsample(scale_factor=2, mode='bilinear')

    def forward(self, input):

        # -----------------------------------------------
        # encoder 
        # ---------------------
        s1, s2, s3, s4, s5 = self.feature(input)
        # -----------------------------------------------
        # decoder
        # ---------------------
        s4_ = self.s5_up_conv(s5)
        s4_ = s4_ + s4
        s4 = self.s4_fusion(s4_)

        s3_ = self.s4_up_conv(s4)
        s3_ = s3_ + s3
        s3 = self.s3_fusion(s3_)

        s2_ = self.s3_up_conv(s3)
        s2_ = s2_ + s2
        s2 = self.s2_fusion(s2_)

        s1_ = self.s2_up_conv(s2)
        s1_ = s1_ + s1
        s1 = self.s1_fusion(s1_)

        out = self.last_conv(s1)

        return out

4.3 训练

在训练阶段，需要为每张图像提供Trimap图，因此，需要对数据进行预处理，代码如下：

def genAiFenGe():
    """
    生成标准化的AiFenGe数据集，同时生成JSON文件列表
    """
    # 设置拷贝路径
    src_img_folder='E:\deeplearn\Matting_Human_Half\clip_img' 
    src_alpha_folder='E:\deeplearn\Matting_Human_Half\matting'
    des_img_folder='./data/AiFenGe/img' 
    des_alpha_folder='./data/AiFenGe/alpha' 
    des_trimap_folder='./data/AiFenGe/trimap' 

    # 检索文件
    imglist = getFileList(src_img_folder, [], 'jpg')
    alphalist = getFileList(src_alpha_folder, [], 'png')

    print('检索到 '+str(len(imglist))+' 个原始图像')
    print('检索到 '+str(len(alphalist))+ '个alpha通道图')

    # 逐张检查
    index=0
    save_img_list=list()
    save_alpha_list=list()
    save_trimap_list=list()

    for imgpath in imglist:
        imgname= os.path.splitext(os.path.basename(imgpath))[0]
        alphaname=imgname+'.png'

        for j in range(len(alphalist)):
            if alphaname in alphalist[j]:
                alphapath = alphalist[j]
                try:
                    img = cv2.imread(imgpath, cv2.IMREAD_COLOR)

                    alpha = cv2.imread(alphapath, cv2.IMREAD_UNCHANGED)
                    alpha = alpha[:,:,3] # 分离alpha通道
                    ret,alpha = cv2.threshold(alpha,50,255,cv2.THRESH_BINARY)

                    # 生成trimap
                    trimap = erode_dilate(alpha)

                    # 保存   
                    cv2.imwrite(des_img_folder+('/%d.png' % (index)),img)
                    cv2.imwrite(des_alpha_folder+('/%d.png' % (index)),alpha)
                    cv2.imwrite(des_trimap_folder+('/%d.png' % (index)),trimap)

                    # 记录
                    save_img_list.append(des_img_folder+('/%d.png' % (index)))
                    save_alpha_list.append(des_alpha_folder+('/%d.png' % (index)))
                    save_trimap_list.append(des_trimap_folder+('/%d.png' % (index)))

                    index += 1
                    print('当前写入第 %d 张图片' % (index))

                except Exception as err:
                    print(err)

    # 写入json文件
    with open('./data/aifenge_img.json', 'w') as jsonfile1:
        json.dump(save_img_list, jsonfile1)

    with open('./data/aifenge_alpha.json', 'w') as jsonfile2:
        json.dump(save_alpha_list, jsonfile2)

    with open('./data/aifenge_trimap.json', 'w') as jsonfile3:
        json.dump(save_trimap_list, jsonfile3)

    print('共写入 %d 张图片' % (index))

其中用于生成trimap图的erode_dilate函数如下：

def erode_dilate(mask, size=(10, 10), smooth=True):
    """
    腐蚀膨胀生成trimap
    输入 mask：单通道二值掩码图
    """
    # 构造核
    if smooth:
        size = (size[0]-4, size[1]-4)
    kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, size)

    # 膨胀
    dilated = cv2.dilate(mask, kernel, iterations=1)
    if smooth:  
        dilated[(dilated>5)] = 255
        dilated[(dilated <= 5)] = 0
    else:
        dilated[(dilated>0)] = 255

    # 腐蚀
    eroded = cv2.erode(mask, kernel, iterations=1)
    if smooth:
        eroded[(eroded<250)] = 0
        eroded[(eroded >= 250)] = 255
    else:
        eroded[(eroded < 255)] = 0

    res = dilated.copy()
    res[((dilated == 255) & (eroded == 0))] = 128    
    return res

通过上述放方式，我们就形成了img、alpha和trimap三个文件夹，分别用于存放原始图像、分割真值、trimap图，同时形成了3个用于训练的json列表文件。接下来就是构造数据加载器来加载数据，代码如下：

class HumanDataset(Dataset):
    """
    人像数据集
    """
    def __init__(self, dataname, transforms=None):

        items = []
        img_path = './data/'+ dataname + '_img.json'
        trimap_path = './data/'+ dataname + '_trimap.json'
        alpha_path = './data/'+ dataname + '_alpha.json'

        with open(img_path, 'r') as j:
            imglist = json.load(j)
        with open(trimap_path, 'r') as j:
            trimaplist = json.load(j)
        with open(alpha_path, 'r') as j:
            alphalist = json.load(j)

        for i in range(len(imglist)):
            items.append((imglist[i], trimaplist[i], alphalist[i]))

        self.items = items
        self.transforms = transforms

    def __len__(self):
        return len(self.items)

    def __getitem__(self, index):
        image_name, trimap_name, alpha_name = self.items[index]
        image = cv2.imread(image_name, cv2.IMREAD_COLOR)
        trimap = cv2.imread(trimap_name, cv2.IMREAD_GRAYSCALE)
        alpha = cv2.imread(alpha_name, cv2.IMREAD_GRAYSCALE)

        if self.transforms is not None:
            for transform in self.transforms:
                image, trimap, alpha = transform(image, trimap, alpha)

        return image, trimap, alpha

其中，给出几个变换函数：

class RandomPatch(object):
    """
    自定义压缩变换
    """
    def __init__(self, patch_size):
        self.patch_size = patch_size

    def __call__(self, image, trimap, alpha):
        image = cv2.resize(image, (self.patch_size, self.patch_size), interpolation=cv2.INTER_CUBIC)
        trimap = cv2.resize(trimap, (self.patch_size, self.patch_size), interpolation=cv2.INTER_NEAREST)
        alpha = cv2.resize(alpha, (self.patch_size, self.patch_size), interpolation=cv2.INTER_CUBIC)

        return image, trimap, alpha


class Normalize(object):
    """
    自定义归一化操作
    """
    def __call__(self, image, trimap, alpha):
        image = (image.astype(np.float32) - (114., 121., 134.,)) / 255.0
        trimap[trimap == 0] = 0
        trimap[trimap == 128] = 1
        trimap[trimap == 255] = 2
        alpha = alpha.astype(np.float32) / 255.0
        return image, trimap, alpha


class NumpyToTensor(object):
    """
    numpy数组转张量tensor
    """
    def __call__(self, image, trimap, alpha):
        h, w, c = image.shape
        image = torch.from_numpy(image.transpose((2, 0, 1))).view(c, h, w).float()
        trimap = torch.from_numpy(trimap).view(-1, h, w).long()  
        alpha = torch.from_numpy(alpha).view(1, h, w).float()
        return image, trimap, alpha
        
    
class TrimapToCategorical(object):
    """
    单通道trimap变成3通道图：b、u、f
    """
    def __call__(self, image, trimap, alpha):
        trimap = np.array(trimap, dtype=np.int)
        input_shape = trimap.shape
        trimap = trimap.ravel()
        n = trimap.shape[0]
        categorical = np.zeros((3, n), dtype=np.long)
        categorical[trimap, np.arange(n)] = 1
        output_shape = (3,) + input_shape
        categorical = np.reshape(categorical, output_shape)
        return image, categorical, alpha

最后给出完整的训练脚本，采用的是Pytroch1.4版本。

import torch.backends.cudnn as cudnn
import torch
from torch import nn
from torchvision.utils import make_grid
from torch.utils.tensorboard import SummaryWriter
from model.tnet import tnet
from datasets import HumanDataset,RandomPatch,Normalize,NumpyToTensor
import torch.nn.functional as F
import time
from utils import *
from loss import ClassificationLoss


# 数据集参数
data_folder = './data/'   # 数据存放路径
dataname = 'aifenge'      # 数据集名称

# 学习参数
checkpoint = './results/tnet.pth'         # 预训练模型路径，如果不存在则为None
batch_size = 128          # 批大小
start_epoch = 146           # 轮数起始位置
epochs = 300              # 迭代轮数
workers = 4               # 工作线程数
lr = 0.00001              # 学习率             
weight_decay = 0.00001    # 权重延迟

# 设备参数
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
ngpu = 4           # 用来运行的gpu数量
cudnn.benchmark = True # 对卷积进行加速

# 日志
writer = SummaryWriter() # 实时监控     使用命令 tensorboard --logdir runs  进行查看

def main():
    """
    训练.
    """
    global checkpoint,start_epoch,writer

    # 初始化
    model = tnet()
    # 初始化优化器
    optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad, model.parameters()),
                                    lr=lr, betas=(0.9, 0.999),
                                    weight_decay=weight_decay)

    # 迁移至默认设备进行训练
    model = model.to(device)
    criterion = ClassificationLoss()
    criterion.to(device)

    # 加载预训练模型
    if checkpoint is not None:
        checkpoint = torch.load(checkpoint)
        start_epoch = checkpoint['epoch'] + 1
        model.load_state_dict(checkpoint['tnet'])
        optimizer.load_state_dict(checkpoint['optimizer'])
    
    if torch.cuda.is_available() and ngpu > 1:
        model = nn.DataParallel(model, device_ids=list(range(ngpu)))

    # 定制化的数据加载器
    transforms = [
                RandomPatch(320),
                Normalize(),
                NumpyToTensor()
            ]
    train_dataset = HumanDataset(dataname,transforms)
    train_loader = torch.utils.data.DataLoader(train_dataset,
        batch_size=batch_size,
        shuffle=True,
        num_workers=workers,
        pin_memory=True) 

    # 开始逐轮训练
    preloss = 10000000
    
    for epoch in range(start_epoch, epochs+1):

        # if epoch == 23:  # 适当降低学习率
        #     adjust_learning_rate(optimizer, 0.1)

        model.train()  # 训练模式：允许使用批样本归一化

        loss_epoch = AverageMeter()  # 统计损失函数

        n_iter = len(train_loader)

        # 按批处理
        for i, (imgs, trimaps_gt, alphas) in enumerate(train_loader):

            # 数据移至默认设备进行训练
            imgs = imgs.to(device)  
            trimaps_gt = trimaps_gt.to(device)  
 
            # 前向传播
            trimaps_pre = model(imgs)

            # 计算损失
            loss = criterion(trimaps_pre, trimaps_gt)  

            # 后向传播
            optimizer.zero_grad()
            loss.backward()

            # 更新模型
            optimizer.step()

            # 记录损失值
            loss_epoch.update(loss.item(), imgs.size(0))

            # 监控图像变化
            if i == n_iter-2:
                trimaps_pre_temp = trimap_to_image(trimaps_pre[:4,:3,:,:])                
                writer.add_image('TNet/epoch_'+str(epoch)+'_1', make_grid(imgs[:4,:,:,:].cpu(), nrow=4,normalize=True),epoch)
                writer.add_image('TNet/epoch_'+str(epoch)+'_2', make_grid(trimaps_pre_temp, nrow=4, normalize=True),epoch)
                writer.add_image('TNet/epoch_'+str(epoch)+'_3', make_grid(trimaps_gt[:4,:,:,:].float().cpu(), nrow=4, normalize=True),epoch)

            # 打印结果
            print("第 "+str(i+1)+ " 个batch训练结束")

        # 手动释放内存
        del imgs, trimaps_pre, trimaps_gt, alphas, trimaps_pre_temp
        print('第'+str(epoch)+'个epoch训练结束')
        
        # 监控损失值变化
        writer.add_scalar('pretrain_tnet/Loss', loss_epoch.val, epoch)    

        # 保存预训练模型
        if loss_epoch.val < preloss:
            preloss = loss_epoch.val
            print("保存预训练模型\n")
            torch.save({
                'epoch': epoch,
                'tnet': model.module.state_dict(),
                'optimizer': optimizer.state_dict()
            }, 'results/tnet.pth')

    # 训练结束关闭监控
    writer.close()


if __name__ == '__main__':
    main()

采用4块泰坦显卡，训练结果如下：

下图是训练结束时的人像分割效果图，第一行为输入原图，中间一行为模型预测结果，最后一行为groundtruth真值。可以看到，整体的分割精度还是不错的，使用MobileNetV2能够在保证分割精度的前提下大幅降低整个模型的参数，最终训练好的模型只有26M左右。

4.4 背景虚化

本节，我们首先对原始图像Input进行高斯模糊得到模糊图像Blur，然后我们利用前面训练好的模型对输入图像进行语义分割，确定出人像掩码Mask，最后进行合成，合成公式如下图所示:

完整代码如下：

import torch.backends.cudnn as cudnn
import torch
from torch import nn
from model.tnet import tnet
from utils import * 
import time
import cv2


# 模型参数
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
#device = torch.device("cpu")


if __name__ == '__main__':

    # 测试图像
    img_id='1'
    imgPath = './results/'+img_id+'.jpg'

    # 加载图像
    input = cv2.imread(imgPath, cv2.IMREAD_COLOR)
    width = input.shape[1]
    height = input.shape[0]
    
    # 多次高斯模糊
    blur = cv2.GaussianBlur(input,(3,3),3)
    blur = cv2.GaussianBlur(blur,(3,3),3)
    blur = cv2.GaussianBlur(blur,(3,3),3)
    blur = cv2.GaussianBlur(blur,(3,3),3)
    blur = cv2.GaussianBlur(blur,(3,3),3)
    blur = cv2.GaussianBlur(blur,(3,3),3)
    blur = cv2.GaussianBlur(blur,(3,3),3)
 
    cv2.imwrite('./results/blur.jpg',blur)

    # 预训练模型
    checkpoint = "./results/tnet.pth"

    # 加载模型
    checkpoint = torch.load(checkpoint)
    model = tnet()

    model = model.to(device)
    model.load_state_dict(checkpoint['tnet'])

    model.eval()    
    
    # 图像预处理 
    img = cv2.resize(input, (320,320), interpolation = cv2.INTER_CUBIC)
    img = (img.astype(np.float32) - (114., 121., 134.,)) / 255.0
    h, w, c = img.shape
    img = torch.from_numpy(img.transpose((2, 0, 1))).view(c, h, w).float()
    img= img.view(1, 3, h, w)

    # 记录时间
    start = time.time()

    # 转移数据至设备
    img = img.to(device)

    # 模型推理
    with torch.no_grad():
        trimap = model(img)
        trimap=trimap_to_image(trimap)

        # 保存trimap
        trimap = trimap.squeeze(0).float().mul(255).add_(0.5).clamp_(0, 255).permute(1, 2, 0).to('cpu', torch.uint8).numpy()  
        cv2.imwrite('./results/trimap'+img_id+'.png',trimap)

        # 缩放并保存alpha通道图
        trimap = cv2.resize(trimap, (width,height), interpolation = cv2.INTER_CUBIC)
        trimap = cv2.cvtColor(trimap,cv2.COLOR_GRAY2BGR)
        # 与原图合成，生成背景虚化图
        trimap_f = trimap / 255.
        comp = input * trimap_f + blur * (1. - trimap_f)
        cv2.imwrite('./results/comp'+img_id+'.png',comp.astype(np.uint8))

    print('用时  {:.3f} 秒'.format(time.time()-start))

最终效果图如下所示：

上图中成功的将前景人像进行了保持，而背景部分进行了虚化，从而实现了类似单反才能拍出的人像摄影特效。

五、小结

本文详细阐述了MobileNet系列算法原理，在此基础上进行了案例运用，通过语义分割算法实现了背景虚化应用，各部分给出了基于Pytorch的代码。后续将会进一步尝试语义分割相关内容，感兴趣的读者可以继续关注！

参考文献

【1】Howard A, Zhu M, Chen B, et al. MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications[J]. arXiv: Computer Vision and Pattern Recognition, 2017.

【2】Sandler M, Howard A, Zhu M, et al. MobileNetV2: Inverted Residuals and Linear Bottlenecks[C]. computer vision and pattern recognition, 2018: 4510-4520.

你可能感兴趣的:(一文掌握MobileNetV1和MobileNetV2（基于pytorch实现的人像背景虚化）)

Kotlin代码示例及详细解析（Kotlin 1.3.11）淮山2 kotlin
//Kotlin1.3.11编译器版本//无包声明//1.基础变量声明//声明实例变量AAA1，类型为Int，初始值为0，类似C语言先声明后初始化的习惯varAAA1:Int=0//声明实例变量AAA2，类型为Double，初始值为0.0varAAA2:Double=0.0//声明实例变量AAA3，类型为String，初始值为空字符串varAAA3:String=""//2.静态变量声明//声明静
Angular 动态加载组件与服务注入 t0_54program 编程问题解决手册 angular.js javascript ecmascript 个人开发
在Angular项目中，动态加载组件是一种常见的优化策略，特别是对于那些不常使用但体积庞大的组件。今天我们将探讨如何在Angular16+版本中使用MatDialog来动态加载组件，并解决与服务注入相关的问题。背景介绍假设我们有一个名为TestAComponent的组件，它需要在特定条件下打开一个对话框，显示一个名为TestBComponent的组件。由于TestBComponent非常大，并且使
Python实战：开发经典猜拳游戏（石头剪刀布）藍海琴泉游戏
目录引言：为什么选择猜拳游戏作为入门项目？第一部分：基础知识点与代码实现1.游戏逻辑与流程2.代码分步实现2.1导入必要模块2.2定义游戏规则函数2.3生成计算机选择2.4判断胜负逻辑2.5主循环与交互3.代码运行效果示例第二部分：功能扩展与优化1.添加计分系统2.支持多轮游戏与退出选择3.增加图形化界面（可选）第三部分：进一步学习方向1.深化游戏功能2.学习相关知识3.书籍与资源推荐适合人群：编
蓝桥杯动态规划实战：从数字三角形到砝码称重藍海琴泉蓝桥杯动态规划职场和发展
适合人群：蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形：经典DP首战告捷2.砝码称重：背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项训练题四、备考建议一、我的动态规划入门之路1.数字三角形：经典DP首战告捷题目描述：从三角形的顶部到底部有很多条不同的路径。对于每条路径，把路径上面的数加起来可以得到一个和，你的任务就是找到最大的和（路径上的每一步只可
Python函数完全解读：从零基础到高阶实战藍海琴泉 python 开发语言
目标读者：编程新手|转行者|需系统掌握函数用法的开发者目录一、函数是什么？为什么需要函数？二、函数基础语法详解1.定义与调用2.返回值：函数的输出结果3.参数传递机制4.案例：计算BMI指数三、变量作用域：理解局部与全局1.局部变量2.全局变量四、函数进阶：lambda与高阶函数1.lambda匿名函数2.高阶函数五、函数高级特性1.装饰器：增强函数功能2.递归函数六、实战案例：文件处理工具一、函
【JavaScript】11-JS高阶技巧 beibeibeiooo JavaScript【已完结】javascript 前端 ecmascript es6
本文介绍JS中的一些高阶技巧。目录1.深浅拷贝1.1浅拷贝1.2深拷贝1.2.1通过递归实现1.2.2lodash/cloneDeep1.2.3JSON.stringify()2.异常处理2.1throw抛异常2.2try/catch捕获异常2.3debugger3.处理this3.1this指向3.1.1普通函数this3.1.2箭头函数的this3.2改变this3.2.1call方法改变3.
【ES6】03-Set + Map beibeibeiooo ES6【已完结】es6 前端 javascript ecmascript
本文介绍两种集合setmap的操作和方法。目录1.Set1.1set基本使用1.2add1.3delete1.4has1.5size1.6set转换为数组1.7拓展运算符1.8for...of1.9forEach1.10set给数组去重2.Map2.1创建map集合2.2set添加元素2.3delete删除元素2.4has2.5size2.6map转换为数组2.7拓展运算符...2.8for...
微软Data Formulator：用AI重塑数据可视化的未来几道之旅人工智能智能体及数字员工人工智能信息可视化
在数据驱动的时代，如何快速将复杂数据转化为直观的图表是每个分析师面临的挑战。微软研究院推出的开源工具DataFormulator，通过结合AI与交互式界面，重新定义了数据可视化的工作流。本文将深入解析这一工具的核心功能、安装方法及使用技巧，助你轻松驾驭数据之美。一、DataFormulator是什么？DataFormulator是一款基于大语言模型（LLM）的AI工具，旨在帮助用户通过自然语言和界
Matplotlib| scatter函数漂亮_大男孩 matplotlib
1.简介Matplotlib库中的scatter函数用于在坐标轴上创建散点图。这种图表显示了两个变量之间的关系，每个点代表了数据集中的一个观测值。scatter函数通常用于探索数据，特别是要查看两个变量是否存在某种相关性或模式。基本用法是scatter(x,y)，其中x和y是长度相同的数组或列表，分别代表散点图中点的横坐标和纵坐标。此外，scatter函数还提供了多种可选参数来定制散点图的外观，例
本地部署deepseek-r1:14b 批量调用 Python调用本地deepseek-r1:14b实现对本地数据库的AI管理朴拙Python交易猿 python 数据库开发语言
这篇文章主要为大家详细介绍了Python如何基于DeepSeek模型，调用本地deepseek-r1:14b实现对本地数据库的AI管理场景描述基于DeepSeek模型，实现对本地数据库的AI管理。实现思路1、本地python+flask搭建个WEB，配置数据源。2、通过DeepSeek模型根据用户输入的文字需求，自动生成SQL语句。3、通过SQL执行按钮，实现对数据库的增删改查。模型服务方法1启动
vue使用el-select下拉框匹配不到值的优化方案，el-select显示，当选择框的选项无法与选择框的value值匹配时，不显示value值的处理办法 Kingsaj 项目实操 vue.js elementui javascript
问题描述：新建表单数据，下拉框选项一般从接口获取的数据列表，比如后期某个数据关停了，这条数据就会被删除，导致我们取不到这条数据。就会出现el-select下拉框匹配不到值的情况。所以我们要处理这种情况的。复现步骤：数据字典新增一条【数据项】新添加一条工单数据绑定这个新增的【数据项】，提交保存操作。保存成功后，删除数据字典新增的【数据项】。然后点击当前新添加的工单数据编辑，操作，查看工单数据字典这一
【职业规划】分享003 -- 什么是职业规划师？杏子 | 职位规划师职业与个人发展经验分享
【职业规划】分享003–重新认识职业规划师最近常被问起职业，我说自己在做独立职业规划师。可能很多职场朋友对这个角色还不太熟悉，今天想和大家聊聊这份工作的价值。就像心理咨询服务心理健康，职业规划师专注解决职业困惑。如果你：▷每天重复机械工作却看不到成长▷想转型却不知从何下手▷面对职业选择总是犹豫不决那么就需要专业的职业规划师来帮你诊断问题，为你提供定制化的解决方案。拿我自己的职业历程来举例：2014
element 源码学习三 —— select 源码学习 violet-jack JavaScript 源码学习 element 组件库
select选择器是个比较复杂的组件了，通过不同的配置可以有多种用法。有必要单独学习学习。整体结构以下是select的template结构，已去掉了一部分代码便于查看整体结构：{{selected[0].currentLabel}}1"type="info"disable-transitions>+{{selected.length-1}}{{item.currentLabel}}0&&!load
RFM案例(简要版) 郜太素数据处理和统计分析 Numpy pandas RFM案例 mysql 学习方法 sql
一、会员价值度模型1、RFM模型介绍会员价值度用来评估用户的价值情况，是区分会员价值的重要模型和参考依据，也是衡量不同营销效果的关键指标之一。价值度模型一般基于交易行为产生，衡量的是有实体转化价值的行为。常用的价值度模型是RFMRFM模型是根据会员最近一次购买时间R（Recency）购买频率F（Frequency）购买金额M（Monetary）计算得出RFM得分通过这3个维度来评估客户的订单活跃价
鸿蒙特效教程09-深入学习animateTo动画苏杰豪 HarmonyOS Next 鸿蒙特效教程 harmonyos 学习华为
鸿蒙特效教程09-深入学习animateTo动画本教程将带领大家从零开始，一步步讲解如何讲解animateTo动画，并实现按钮交互效果，使新手也能轻松掌握。效果演示通过两个常见的按钮动画效果，深入学习HarmonyOSNext的animateTo动画，以及探索最佳实践。缩放按钮效果抖动按钮效果一、基础准备1.1理解ArkUI中的动画机制HarmonyOS的ArkUI框架提供了强大的动画支持，常见有
使用Wolfram Alpha API在LangChain中的应用 shuoac langchain python
在AI技术应用中，WolframAlpha以其强大的计算能力和信息检索功能，被广泛应用于各类智能系统中。本文将为您介绍如何结合LangChain使用WolframAlphaAPI，以实现功能强大的计算和信息查询服务。技术背景介绍WolframAlpha是由WolframResearch开发的问答引擎，它通过计算从外部数据源中获取答案，实现对事实性问题的解答。在开发智能应用时，我们可以利用Wolfr
策略模式详解：实现灵活多样的支付方式 Dong雨策略模式 java
多支付方式的实现：策略模式详解策略模式（StrategyPattern）是一种行为设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以互换使用。策略模式使得算法可以独立于使用它的客户端变化。本文将通过一个具体的业务场景来介绍策略模式，并给出相应的代码实现。业务场景我们以一个电商平台为例，该平台支持多种支付方式，包括信用卡支付、PayPal支付和比特币支付。我们希望在不修改客户端代码的情况
原创LabVIEW与台达EtherCAT运动控制卡完整测试程序代码 LabVIEW热爱者 labview
利用LabVIEW调用台达提供的库函数，控制台达EtherCAT运动控制卡，实现初始化、IO、运动控制、模拟量读取等功能。LabVIEW2013以上版本可以打开。可实现单轴、多轴运动控制。
QT多线程：苜柠 QT qt 开发语言
线程类：QThread类线程池：QThreadPool类QMutex:互斥锁；QReadWriteLock:读-写锁；QSemaphore:信号量；QWaitCondition:条件变量。利用它们来保护线程间共享数据的完整性.原子操作：QAtomicInteger、QAtomicPointer类，能够确保基础数据类型的读写操作的原子性。对于简单的计数、状态位的读写，使用原子操作类可以避免加锁开销。
C++多线程苜柠 C++c++
线程：async和thread锁：C++11中的std::atomic和std::mutex推荐文章：C++11多线程（std::thread）详解_c++11线程使用-CSDN博客c++标准库多线程-云山漫卷-博客园std::lock_guard是一个RAII风格的简单的锁管理器，它在构造时自动加锁，在析构时自动解锁。#include#include#include#includestd::mu
el-select多选选择器（在懒加载的基础上）重磅：实现模糊搜索+多选+未加载数据的正确回显！！ SerendipityM javascript 前端开发语言 vue.js html5
项目需求：由于表单中的一个el-select中的数据过多，下拉框用户体验不好，因此需要做成有懒加载且分页的下拉框。后又因为该功能需要多选，并且打开表单要能够正确回显。这些需求加起来，导致问题变得复杂起来。我在网上也看了许多文章，没有找到好的解决方案。因此我将自己的记录下来，还望各位指点！！！（本项目请求后端需要传id，page，size，name）(name的格式为JSON形式的[id:1,nam
QT-LINUX-Bluetooth蓝牙开发大象荒野嵌入式QT开发笔记 qt
BlueToothAPIQT-BlueToothApiQtBluetooth6.8.2官方提供的蓝牙API不支持linux。D-Bus的API实现蓝牙确保系统中安装了BlueZ（版本需≥5.56），并且Qt已正确安装并配置了D-Bus支持。默默看了下自己的版本.....D-BUS的API也不支持。在D-Bus中，org目录是D-Bus对象路径（ObjectPath）的一部分，用于唯一标识系统中的对
java面向对象基础 miehamiha java 开发语言
引入三大特征封装核心思想就是“隐藏细节”、“数据安全”，将对象不需要让外界访问的成员变量和方法私有化，只提供符合开发者意愿的公有方法来访问这些数据和逻辑，保证了数据的安全和程序的稳定。所有的内容对外部不可见。继承子类可以继承父类的属性和方法，并对其进行拓展。将其他的功能继承下来继续发展。多态同一种类型的对象执行同一个方法时可以表现出不同的行为特征。通过继承的上下转型、接口的回调以及方法的重写和重载
VUE中的组件加载方式 catino vue.js 前端 javascript
加载方式有哪些，及如何进行选择常规的静态引入是在组件初始化时就加载所有依赖的组件，而懒加载则是等到组件需要被渲染的时候才加载。对于大型应用，可能会有很多组件，如果一开始都加载，可能会影响首屏加载时间。如果某些组件在首屏不需要，比如弹窗或者标签页里的内容，那么懒加载会更好，减少初始加载时间，实现时使用动态导入和异步组件，同时注意处理加载状态和错误处理。。反之，如果组件在页面初始化时就必须显示，那么静
微信小程序 uni-app解决旧页面缓存问题 catino 微信小程序微信小程序 uni-app 前端
微信小程序在迭代版本后，若未清除原有缓存，显示的还是旧版，加入下述代码可解决这个问题在common.js文件中加入mpUpdate(){constupdateManager=wx.getUpdateManager()//小程序版本更新管理器updateManager.onCheckForUpdate(function(res){//请求完新版本信息的回调})updateManager.onUpda
element plus table树形数据，增、删、改子节点数据时，进行局部刷新，而不刷新整个页面 catino vue.js javascript elementui
...constlistLoading=ref(false)//保存节点映射的Mapconstmaps=reactive(newMap())constload=async(row,treeNode,resolve)=>{constpid=row.idmaps.set(pid,{row,treeNode,resolve})constpost_data={parent_id:row.id,}listL
uni-app 设置背景图在手机中无效 catino uni-app
如下写法在微信开发者工具中显示正常，但在真机调试下，手机端背景图并未显示内容文字exportdefault{data(){return{imageBgURL:'../../static/imageBg.png'};}}解决方案如下：1，将图片转为base64编码2，将图片文件上传至服务器，使用网络地址3，使用image标签替代，如文本内容.textBg{height:114rpx;width:62
uni-app 设置页面导航条颜色 catino uni-app
下述两种方法中颜色限制为十六进制颜色。1.pages.json页面路由中，用style设置每一个页面的导航栏背景颜色如：{"pages":[{"path":"pages/index/index","style":{"navigationBarTitleText":"首页",//设置页面标题文字"enablePullDownRefresh":true//开启下拉刷新"navigationBarBac
layui中tab的切换 catino html 前端 layui
layui中tab的切换，可使用element.tabChange(filter,layid);用于外部切换到指定的Tab项上，如：element.tabChange('demo','layid');//切换到lay-id="yyy"的这一项下例所示element.tabChange('demo','22');//切换到：用户管理网站设置用户管理权限分配商品管理订单管理点击该Tab的任一标题，观察
Matplotlib 柱形图 lly202406 开发语言
Matplotlib柱形图引言在数据可视化领域，柱形图是一种非常常见且强大的图表类型。它能够帮助我们直观地比较不同类别或组之间的数据大小。Matplotlib，作为Python中最受欢迎的数据可视化库之一，提供了丰富的绘图功能，其中包括创建柱形图。本文将详细介绍Matplotlib中的柱形图，包括其基本用法、高级特性以及如何进行优化。基本用法安装Matplotlib在开始使用Matplotlib之
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

一文掌握MobileNetV1和MobileNetV2（基于pytorch实现的人像背景虚化）

一、概述

二、MobileNetV1原理和实现

2.1 原理

2.1.1 深度卷积

2.1.2 逐像素卷积

2.2 Pytorch实现

三、MobileNetV2原理和实现

3.1 原理

3.1.1 ReLU6激活函数

3.1.2 Inverted Residual

3.2 Pytorch实现

四、应用（基于人像快速分割的背景虚化处理 ）

4.1 概述

4.2 算法原理

4.3 训练

4.4 背景虚化

五、小结

参考文献

你可能感兴趣的:(一文掌握MobileNetV1和MobileNetV2（基于pytorch实现的人像背景虚化）)

四、应用（基于人像快速分割的背景虚化处理）