DONG_LIN_2019

深度学习_目标检测（二）——SSD（二）复现-为了更好的理解

复现ssd网络

Step 1/x 网络构建部分——命名空间scope【block】输入x+计算*（卷积）

Step 2/x 网络构建部分——命名空间scope【loc和cls】输出

Step 3/x 先验框部分——先验框生成

第一步：anchor_size和Sk的计算过程：

第二步：ar计算-自己设定

Step 4/x 先验框部分——解码网络得 box[x0, y0, x1, y1]

Step 5/x 先验框部分——筛选

Step 6/x 检测部分——检测，使用预训练模型进行网络测试

Step 7/x 训练部分——数据转换voc转tfrecords

Step 8/x 训练部分——Trainer

Step 9/x 预测部分——整合1-7步的code

参考

复现ssd网络

几个关键点理解透

如何计算Anchor和Proposal：https://blog.csdn.net/as472780551/article/details/81227408。

Step 1/x 网络构建部分——命名空间scope【block】输入x+计算*（卷积）

需要材料，

基本功：卷积模块+池化模块+填补模块(block8和block9需要而用)

import tensorflow as tf

class ssd(object):
    # step 2/x 卷积模块创建，池化模块，随意丢弃模块。
    '''
    tf.layers.conv2d() 经典输入参数：
    f(w*x+b)：
    x = 输入input；
    w = 卷积核个数filter_num，尺寸k_size；
    b = 默认，use_bias=True；
    * = 卷积步长stride，填充方式padding，卷积模式dilation（标准，扩张等），等等一系列；
    f = 激活函数。
    '''
    def conv2d(self,x,filter,k_size,stride=[1,1],padding='same',dilation=[1,1],activation=tf.nn.relu,scope='conv2d'):
        return tf.layers.conv2d(inputs=x, filters=filter, kernel_size=k_size,
                            strides=stride, dilation_rate=dilation, padding=padding,
                            name=scope, activation=activation, use_bias=True)
    # 
    '''
    tf.layers.max_pooling2d()，经典输入参数：
    p*x:
    p = 尺寸pool_size
    x = 输入input
    '''
    def max_pool2d(self,x, pool_size, stride, scope='max_pool2d'):
        return tf.layers.max_pooling2d(inputs=x, pool_size=pool_size, strides=stride, name=scope, padding='same')

    # 
    '''
    tf.pad() 对原图进行填充，为了匹配输入输出尺寸
    '''
    def pad2d(self,x, pad):
        return tf.pad(x, paddings=[[0, 0], [pad, pad], [pad, pad], [0, 0]])

    def set_net(self,x=None):
        # 列表放FM
        check_points = {} 
        with tf.variable_scope('ssd_300_vgg'):
            x = tf.placeholder(dtype=tf.float32,shape=[None,300,300,3])
            #b1
            net = self.conv2d(x,filter=64,k_size=[3,3],scope='conv1_1')
            net = self.conv2d(net,64,[3,3],scope='conv1_2')
            net = self.max_pool2d(net,pool_size=[2,2],stride=[2,2],scope='pool1')
            #b2
            net = self.conv2d(net, filter=128, k_size=[3, 3], scope='conv2_1')
            net = self.conv2d(net, 128, [3, 3], scope='conv2_2')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool2')
            #b3
            net = self.conv2d(net, filter=256, k_size=[3, 3], scope='conv3_1')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_2')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_3')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool3')
            #b4
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv4_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_3')
            print("block4_output", net)
            # -------------------------------------------------------------------4
            check_points['block4'] = net
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool4')
            #print('pool4', net)
            #b5
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv5_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_3')
            #print('conv5_3',net)
            net = self.max_pool2d(net, pool_size=[3, 3], stride=[1, 1], scope='pool5')
            #print('pool5',net)
            #b6
            net = self.conv2d(net,1024,[3,3],dilation=[6,6],scope='conv6')
            #print('conv6',net)
            #b7
            net = self.conv2d(net,1024,[1,1],scope='conv7')
            print("block7_output", net)
            # -------------------------------------------------------------------7
            check_points['block7'] = net
            #b8],scope='conv8_1x1')
            net = self.conv2d(net, 256, [1, 1], scope='conv8_1x1')
            #print('conv8_3',net)
            # 该层要进行填补
            net = self.pad2d(net, 1)
            #print('pad2d',net)
            net = self.conv2d(net, 512, [3, 3], [2, 2], scope='conv8_3x3', padding='valid')
            # -------------------------------------------------------------------8
            print("block8_output", net)
            check_points['block8'] = net
            #b9
            net = self.conv2d(net, 128, [1, 1], scope='conv9_1x1')
            net = self.pad2d(net, 1)
            net = self.conv2d(net, 256, [3, 3], [2, 2], scope='conv9_3x3', padding='valid')
            # -------------------------------------------------------------------9
            print("block9_output", net)
            check_points['block9'] = net
            #b10
            net = self.conv2d(net, 128, [1, 1], scope='conv10_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv10_3x3', padding='valid')
            # -------------------------------------------------------------------10
            print("block10_output", net)
            check_points['block10'] = net
            #b11
            net = self.conv2d(net, 128, [1, 1], scope='conv11_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv11_3x3', padding='valid')
            # -------------------------------------------------------------------11
            print("block11_output", net)
            check_points['block11'] = net
        print(check_points)
if __name__ == '__main__':
    model = ssd()
    model.set_net()

模型FM（feature map）输出结果

pad模块处理结果

Step 2/x 网络构建部分——命名空间scope【loc和cls】输出

import tensorflow as tf

class ssd(object):
    def __init__(self):
        # FM、cls和loc设置
        self.feature_map_size = [[38, 38], [19, 19], [10, 10], [5, 5], [3, 3], [1, 1]]
        self.classes = ["aeroplane", "bicycle", "bird", "boat", "bottle",
            "bus", "car", "cat", "chair", "cow", "diningtable",
            "dog", "horse", "motorbike", "person", "pottedplant",
            "sheep", "sofa", "train", "tvmonitor"]
        self.feature_layers = ['block4', 'block7', 'block8', 'block9', 'block10', 'block11']
        self.img_size = (300,300)
        self.num_classes = 21
        self.boxes_len = [4,6,6,6,4,4]
        self.isL2norm = [True,False,False,False,False,False]
        
        # 先验框
        self.anchor_sizes = [[21., 45.], [45., 99.], [99., 153.],[153., 207.],[207., 261.], [261., 315.]]
        self.anchor_ratios = [[2, .5], [2, .5, 3, 1. / 3], [2, .5, 3, 1. / 3],
                            [2, .5, 3, 1. / 3], [2, .5], [2, .5]]
        # self.anchor_steps = [8, 16, 32, 64, 100, 300]
        self.anchor_steps = [8, 16, 30, 60, 100, 300]
        self.prior_scaling = [0.1, 0.1, 0.2, 0.2] #特征图先验框缩放比例
        self.n_boxes = [5776,2166,600,150,36,4]  #8732个
        self.threshold = 0.25

    # step 2/x 卷积模块创建，池化模块，随意丢弃模块。
    '''
    tf.layers.conv2d() 经典输入参数：
    f(w*x+b)：
    x = 输入input；
    w = 卷积核个数filter_num，尺寸k_size；
    b = 默认，use_bias=True；
    * = 卷积步长stride，填充方式padding，卷积模式dilation（标准，扩张等），等等一系列；
    f = 激活函数。
    '''
    def conv2d(self,x,filter,k_size,stride=[1,1],padding='same',dilation=[1,1],activation=tf.nn.relu,scope='conv2d'):
        return tf.layers.conv2d(inputs=x, filters=filter, kernel_size=k_size,
                            strides=stride, dilation_rate=dilation, padding=padding,
                            name=scope, activation=activation, use_bias=True)
    # 
    '''
    tf.layers.max_pooling2d()，经典输入参数：
    p*x:
    p = 尺寸pool_size
    x = 输入input
    '''
    def max_pool2d(self,x, pool_size, stride, scope='max_pool2d'):
        return tf.layers.max_pooling2d(inputs=x, pool_size=pool_size, strides=stride, name=scope, padding='same')

    # 
    '''
    tf.pad() 对原图进行填充，为了匹配输入输出尺寸
    '''
    def pad2d(self,x, pad):
        return tf.pad(x, paddings=[[0, 0], [pad, pad], [pad, pad], [0, 0]])

    # 对第四层模块的卷积进行L2归一化，只对通道数进行归一化，因为比较靠前。。。。？？？
    def l2norm(self, x, trainable=True, scope='L2Normalization'):
        n_channels = x.get_shape().as_list()[-1]  # 通道数
        l2_norm = tf.nn.l2_normalize(x, dim=[3], epsilon=1e-12)  # 只对每个像素点在channels上做归一化
        with tf.variable_scope(scope):
            gamma = tf.get_variable("gamma", shape=[n_channels, ], dtype=tf.float32,
                                    trainable=trainable)
        return l2_norm * gamma

    # loc 和 cls 通过卷积进行计算
    def ssd_prediction(self, x, num_classes, box_num, isL2norm, scope='multibox'):
        reshape = [-1] + x.get_shape().as_list()[1:-1]  # 去除第一个和最后一个得到shape
        with tf.variable_scope(scope):
            if isL2norm:
                x = self.l2norm(x) # 进行
                print(x)
            # 预测位置  --》 坐标和大小  回归
            location_pred = self.conv2d(x, filter=box_num * 4, k_size=[3,3], activation=None,scope='conv_loc')
            location_pred = tf.reshape(location_pred, reshape + [box_num, 4])
            # 预测类别   --> 分类 sofrmax
            class_pred = self.conv2d(x, filter=box_num * num_classes, k_size=[3,3], activation=None, scope='conv_cls')
            class_pred = tf.reshape(class_pred, reshape + [box_num, num_classes])
            print(location_pred, class_pred)
            return location_pred, class_pred

    def set_net(self,x=None):
        # 列表放FM
        check_points = {}   # 字典存储{'key':value}
        predictions = []    # 列表存储[value]
        locations = []      # 列表存储[value]
        with tf.variable_scope('ssd_300_vgg'):
            x = tf.placeholder(dtype=tf.float32,shape=[None,300,300,3])
            #b1
            net = self.conv2d(x,filter=64,k_size=[3,3],scope='conv1_1')
            net = self.conv2d(net,64,[3,3],scope='conv1_2')
            net = self.max_pool2d(net,pool_size=[2,2],stride=[2,2],scope='pool1')
            #b2
            net = self.conv2d(net, filter=128, k_size=[3, 3], scope='conv2_1')
            net = self.conv2d(net, 128, [3, 3], scope='conv2_2')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool2')
            #b3
            net = self.conv2d(net, filter=256, k_size=[3, 3], scope='conv3_1')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_2')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_3')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool3')
            #b4
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv4_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_3')
            print("block4_output", net)
            # -------------------------------------------------------------------4
            check_points['block4'] = net
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool4')
            #print('pool4', net)
            #b5
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv5_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_3')
            #print('conv5_3',net)
            net = self.max_pool2d(net, pool_size=[3, 3], stride=[1, 1], scope='pool5')
            #print('pool5',net)
            #b6
            net = self.conv2d(net,1024,[3,3],dilation=[6,6],scope='conv6')
            #print('conv6',net)
            #b7
            net = self.conv2d(net,1024,[1,1],scope='conv7')
            print("block7_output", net)
            # -------------------------------------------------------------------7
            check_points['block7'] = net
            #b8],scope='conv8_1x1')
            net = self.conv2d(net, 256, [1, 1], scope='conv8_1x1')
            #print('conv8_3',net)
            # 该层要进行填补
            print('pad2d-start',net)
            net = self.pad2d(net, 1)
            print('pad2d-end',net)
            net = self.conv2d(net, 512, [3, 3], [2, 2], scope='conv8_3x3', padding='valid')
            # -------------------------------------------------------------------8
            print("block8_output", net)
            check_points['block8'] = net
            #b9
            net = self.conv2d(net, 128, [1, 1], scope='conv9_1x1')
            net = self.pad2d(net, 1)
            net = self.conv2d(net, 256, [3, 3], [2, 2], scope='conv9_3x3', padding='valid')
            # -------------------------------------------------------------------9
            print("block9_output", net)
            check_points['block9'] = net
            #b10
            net = self.conv2d(net, 128, [1, 1], scope='conv10_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv10_3x3', padding='valid')
            # -------------------------------------------------------------------10
            print("block10_output", net)
            check_points['block10'] = net
            #b11
            net = self.conv2d(net, 128, [1, 1], scope='conv11_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv11_3x3', padding='valid')
            # -------------------------------------------------------------------11
            print("block11_output", net)
            check_points['block11'] = net
            print("————————————————————————————————————————————————")
            for i,j in enumerate(self.feature_layers):
                loc, cls = self.ssd_prediction(
                                    x = check_points[j],
                                    num_classes = self.num_classes,
                                    box_num = self.boxes_len[i],
                                    isL2norm = self.isL2norm[i],
                                    scope = j + '_box'
                                    )
                predictions.append(tf.nn.softmax(cls))
                locations.append(loc)
            print("————————————————————————————————————————————————")
            print(locations, predictions)
        print("————————————————————————————————————————————————")
        print(check_points)
if __name__ == '__main__':
    model = ssd()
    model.set_net()

Step 3/x 先验框部分——先验框生成

引用：SSD在6个特征图上使用2组3x3的卷积核分别做分类和boundingbox回归,所以SSD是一个全卷积神经网络。我们知道每个特征图上每个像素点对应一个理论感受野，所以SSD相当于对原图中所有的理论感受野作分类和回归，由于有效感受野在理论感受野中有重要的影响，其他区域的影响可以忽略，所以这里我们认为SSD是对有效感受野作分类和回归，那么问题来了，既然是对所有的有效感受野做分类和回归，那每个有效感受野的分类的label和回归的label是如何确定的呢?default box就是用来干这个的。
先验框干嘛用：https://blog.csdn.net/qianqing13579/article/details/82106664

先验框计算流程：

第一步：先计算，即(scale)，通过该系数计算每张FM映射原图的尺寸大小 $anchor\_sizes$ 。

第二步：计算 $\alpha _r$ ，即(anchor_ratios)，该值是自定义的，取值范围为： $[1',\1,\2,\1/2,\3, \ 1/3]$ 。

第三步：

第一步：anchor_size和Sk的计算过程：

得到每一层FM的和原图的映射比例值；

$anchor\_sizes$ 得到每一层FM对应原图映射的min_size和max_size；

和 $anchor\_sizes$ 如果按照理论公式计算：

理论计算结果：

$\\S_k = [0.2,\0.34,\ 0.48,\0.62,\0.76,\0.9]] \\anchor\_sizes = [60,\102,\144,\186,\228,\270]$

和 $anchor\_sizes$ 论文实际计算：【因为作者将第一层S1, 单独拿出来设置了.】

在SSD中一共有6个用于分类和回归的特征层(feature map),

分别是feat_layers=['block4', 'block7', 'block8', 'block9', 'block10', 'block11'],

m是就是特征层的个数,按理说分母应该是6-1=5,但是这里是5-1=4, 因为作者将第一层S1, 单独拿出来设置了.

k是第几个特征层的意思,注意k的范围是1~m, 也就是1~6.

$\\S_k = [0.2,\0.37,\ 0.54,\0.71,\0.88,\1.05]] \\anchor\_sizes = [60,\111,\162,\213,\264,\315]$

由于, 就是0.1, 再乘以300, 就是30.

anchor_sizes=[
        (30., 60.),
        (60., 111.),
        (111., 162.),
        (162., 213.),
        (213., 264.),
        (264., 315.)
        ]

https://blog.csdn.net/qq_42450404/article/details/92800381

https://blog.csdn.net/gbyy42299/article/details/81235891

https://blog.csdn.net/qq_36735489/article/category/9196814

https://www.jianshu.com/p/b4fa2f4ee6ee

第二步：ar计算-自己设定

$\alpha _r$ ，即 $anchor\_ratio$ ，得到每层每种默认框的比例值，和上面计算的 $anchor\_sizes$ 直接决定默认框宽w高h尺寸实际取值。

self.anchor_ratios = [
        [2, .5], 
        [2, .5, 3, 1./3], 
        [2, .5, 3, 1./3], 
        [2, .5, 3, 1./3], 
        [2, .5], 
        [2, .5]
    ]

第一步得到了，min_size、max_size；第二步得到了ratio；那么每层的默认框就可以按照如下图的计算方法计算默认框的宽和高。

def ssd_anchor_layer(self,img_size,feature_map_size,anchor_size,anchor_ratio,anchor_step,box_num,offset=0.5):
    # 提取FM的每个坐标
    y, x = np.mgrid[0:feature_map_size[0],0:feature_map_size[1]] 
    # 映射回原图，映射到原图  anchor_step = SRC[300*300]/FM1[38*38] = 7.89 = 8
    # 返回FM1每个像素点坐标对于的原图坐标，归一化值（0-1）之间的比例值。
    y = (y.astype(np.float32) + offset) * anchor_step /img_size[0] 
    x = (x.astype(np.float32) + offset) * anchor_step /img_size[1]

    y = np.expand_dims(y,axis=-1)
    x = np.expand_dims(x,axis=-1)        
    
    # 有两个默认的长宽比为1,但是大小不同的正方形先验框：计算两个长宽比为1的h、w。——根据先验框个数来确定的，多少个先验框就有多少个长宽。
    h = np.zeros((box_num,), np.float32)
    w = np.zeros((box_num,), np.float32)
    # 第一个：h[0]、w[0]: 30/300, ....
    h[0] = anchor_size[0] /img_size[0]
    w[0] = anchor_size[0] /img_size[0]
    # 第二个：h[1]、w[1]：sqrt(30*60)/300, ....
    h[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[0] # **0.5相当于sqrt开根号，
    w[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[1]

    # 剩下的长宽比按公式来计算。
    for i, j in enumerate(anchor_ratio):
        h[i + 2] = anchor_size[0] / img_size[0] / (j ** 0.5)
        w[i + 2] = anchor_size[0] / img_size[1] * (j ** 0.5)

    return y, x, h, w

Step 4/x 先验框部分——解码网络得 box[x0, y0, x1, y1]

为什么需要解码，解码是个啥？https://zhuanlan.zhihu.com/p/31426458

因为先验框是 $d\ =\ [d^{cx},\ d^{cy},\ d^{w},\ d^{h}]$ 表示，上节已经计算出；实际原图对应边界框用 $b\ =\ [b^{cx},\ b^{cy},\ b^{w},\ b^{h}]$ 表示；

（边界框编码encode）边界框的预测值是相对于的转换值：

（边界框解码decode）预测时，需要反向该过程，从预测值中得到边界框的真实值：

（为需要学习的量，使得 $\large b\approx GT$ ）

原caffe增加variance：{0.1，0.1，0.2，0.2}来调整检测值。prior_scaling人称先验框缩放比例。

https://zhuanlan.zhihu.com/p/33544892

# 解码网络返回box[x0, y0, x1, y1] -》先验框通过平移和缩放接近真实框。其中 prior_scaling 为平移、尺度因子
def ssd_decode(self, location, box, prior_scaling):
    y_a, x_a, h_a, w_a = box
    # 平移
    cx = location[:, :, :, :, 0] * w_a * prior_scaling[0] + x_a  #location最后一个维度有4，表示4个值：x,y,w,h
    cy = location[:, :, :, :, 1] * h_a * prior_scaling[1] + y_a
    # 缩放
    w = w_a * tf.exp(location[:, :, :, :, 2] * prior_scaling[2])
    h = h_a * tf.exp(location[:, :, :, :, 3] * prior_scaling[3])
    # 计算框的左上和右下坐标：box[x0, y0, x1, y1]
    bboxes = tf.stack(
        [
        cy - h / 2.0,         
        cx - w / 2.0, 
        cy + h / 2.0, 
        cx + w / 2.0
        ], 
        axis=-1
        )
    print(bboxes)
    return bboxes

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
class ssd(object):
    def __init__(self):
        # 初始化一：FM、cls和loc设置
        self.feature_map_size = [[38, 38], [19, 19], [10, 10], [5, 5], [3, 3], [1, 1]]
        self.classes = ["aeroplane", "bicycle", "bird", "boat", "bottle",
            "bus", "car", "cat", "chair", "cow", "diningtable",
            "dog", "horse", "motorbike", "person", "pottedplant",
            "sheep", "sofa", "train", "tvmonitor"]
        self.feature_layers = ['block4', 'block7', 'block8', 'block9', 'block10', 'block11']
        self.img_size = (300, 300)
        self.num_classes = 21
        self.boxes_len = [4, 6, 6, 6, 4, 4] # FM1每个像素点取4个尺度框，FM2每个像素点取6个尺度框，。。。
        self.isL2norm = [True, False, False, False, False, False]
        
        # 初始化二：先验框
        # 计算得到：sk：6组min_size和max_size [[h0, w0],[h1, w1],[h2, w2],[h3, w3]]每次取一组两个：[21., 45.]
        '''
        # 官方：60, 111, 162, 213, 264, 315.》》》6组min_size和max_size
        anchor_sizes=[
                (30., 60.),
                (60., 111.),
                (111., 162.),
                (162., 213.),
                (213., 264.),
                (264., 315.)]
        '''
        # 初始化二：先验框
        self.anchor_sizes = [
                [21., 45.],
                [45., 99.], 
                [99., 153.],
                [153., 207.],
                [207., 261.], 
                [261., 315.]
            ]
        # 取ar:{1, 2, 1/2, 3, 1/3},对应每层的ar=[[1,2,1/2]]
        self.anchor_ratios = [
                [2, .5], 
                [2, .5, 3, 1./3], 
                [2, .5, 3, 1./3], 
                [2, .5, 3, 1./3], 
                [2, .5], 
                [2, .5]
            ]
        # 初始化二：先验框实现FM像素点映射到原图300*300的中心点扩张步长。
        self.anchor_steps = [8, 16, 30, 60, 100, 300]
        
        # 初始化三：先验框先验框解码用的缩放比例。
        self.prior_scaling = [0.1, 0.1, 0.2, 0.2] #特征图先验框缩放比例
        
        # 每层FM的默认框个数值，可计算。
        self.n_boxes = [5776, 2166, 600, 150, 36, 4]  #8732个
        
        # IOU阈值设置
        self.threshold = 0.25

    # step 2/x 卷积模块创建，池化模块，随意丢弃模块。
    '''
    tf.layers.conv2d() 经典输入参数：
    f(w*x+b)：
    x = 输入input；
    w = 卷积核个数filter_num，尺寸k_size；
    b = 默认，use_bias=True；
    * = 卷积步长stride，填充方式padding，卷积模式dilation（标准，扩张等），等等一系列；
    f = 激活函数。
    '''
    def conv2d(self,x,filter,k_size,stride=[1,1],padding='same',dilation=[1,1],activation=tf.nn.relu,scope='conv2d'):
        return tf.layers.conv2d(inputs=x, filters=filter, kernel_size=k_size,
                            strides=stride, dilation_rate=dilation, padding=padding,
                            name=scope, activation=activation, use_bias=True)
    # 
    '''
    tf.layers.max_pooling2d()，经典输入参数：
    p*x:
    p = 尺寸pool_size
    x = 输入input
    '''
    def max_pool2d(self,x, pool_size, stride, scope='max_pool2d'):
        return tf.layers.max_pooling2d(inputs=x, pool_size=pool_size, strides=stride, name=scope, padding='same')

    # 
    '''
    tf.pad() 对原图进行填充，为了匹配输入输出尺寸
    '''
    def pad2d(self,x, pad):
        return tf.pad(x, paddings=[[0, 0], [pad, pad], [pad, pad], [0, 0]])

    # 对第四层模块的卷积进行L2归一化，只对通道数进行归一化，因为比较靠前。。。。？？？
    def l2norm(self, x, trainable=True, scope='L2Normalization'):
        n_channels = x.get_shape().as_list()[-1]  # 通道数
        l2_norm = tf.nn.l2_normalize(x, dim=[3], epsilon=1e-12)  # 只对每个像素点在channels上做归一化
        with tf.variable_scope(scope):
            gamma = tf.get_variable("gamma", shape=[n_channels, ], dtype=tf.float32,
                                    trainable=trainable)
        return l2_norm * gamma

    # loc 和 cls 通过卷积进行计算 【num_classes和box_num】
    def ssd_prediction(self, x, num_classes, box_num, isL2norm, scope='multibox'):
        reshape = [-1] + x.get_shape().as_list()[1:-1]  # 去除第一个和最后一个得到shape
        with tf.variable_scope(scope):
            if isL2norm:
                x = self.l2norm(x) # 进行
                print(x)
            # 预测位置loc  --》 坐标和大小  回归
            location_pred = self.conv2d(x, filter=box_num * 4, k_size=[3,3], activation=None,scope='conv_loc')
            location_pred = tf.reshape(location_pred, reshape + [box_num, 4])
            # 预测类别cls   --> 分类 sofrmax
            class_pred = self.conv2d(x, filter=box_num * num_classes, k_size=[3,3], activation=None, scope='conv_cls')
            class_pred = tf.reshape(class_pred, reshape + [box_num, num_classes])
            print(location_pred, class_pred)
            return location_pred, class_pred

    def set_net(self,x=None):
        # 列表放FM
        check_points = {}   # 字典存储{'key':value}
        predictions = []    # 列表存储[value]
        locations = []      # 列表存储[value]
        with tf.variable_scope('ssd_300_vgg'):
            x = tf.placeholder(dtype=tf.float32,shape=[None,300,300,3])
            #b1
            net = self.conv2d(x,filter=64,k_size=[3,3],scope='conv1_1')
            net = self.conv2d(net,64,[3,3],scope='conv1_2')
            net = self.max_pool2d(net,pool_size=[2,2],stride=[2,2],scope='pool1')
            #b2
            net = self.conv2d(net, filter=128, k_size=[3, 3], scope='conv2_1')
            net = self.conv2d(net, 128, [3, 3], scope='conv2_2')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool2')
            #b3
            net = self.conv2d(net, filter=256, k_size=[3, 3], scope='conv3_1')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_2')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_3')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool3')
            #b4
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv4_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_3')
            print("block4_output", net)
            # -------------------------------------------------------------------4
            check_points['block4'] = net
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool4')
            #print('pool4', net)
            #b5
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv5_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_3')
            #print('conv5_3',net)
            net = self.max_pool2d(net, pool_size=[3, 3], stride=[1, 1], scope='pool5')
            #print('pool5',net)
            #b6
            net = self.conv2d(net,1024,[3,3],dilation=[6,6],scope='conv6')
            #print('conv6',net)
            #b7
            net = self.conv2d(net,1024,[1,1],scope='conv7')
            print("block7_output", net)
            # -------------------------------------------------------------------7
            check_points['block7'] = net
            #b8],scope='conv8_1x1')
            net = self.conv2d(net, 256, [1, 1], scope='conv8_1x1')
            #print('conv8_3',net)
            # 该层要进行填补
            print('pad2d-start',net)
            net = self.pad2d(net, 1)
            print('pad2d-end',net)
            net = self.conv2d(net, 512, [3, 3], [2, 2], scope='conv8_3x3', padding='valid')
            # -------------------------------------------------------------------8
            print("block8_output", net)
            check_points['block8'] = net
            #b9
            net = self.conv2d(net, 128, [1, 1], scope='conv9_1x1')
            net = self.pad2d(net, 1)
            net = self.conv2d(net, 256, [3, 3], [2, 2], scope='conv9_3x3', padding='valid')
            # -------------------------------------------------------------------9
            print("block9_output", net)
            check_points['block9'] = net
            #b10
            net = self.conv2d(net, 128, [1, 1], scope='conv10_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv10_3x3', padding='valid')
            # -------------------------------------------------------------------10
            print("block10_output", net)
            check_points['block10'] = net
            #b11
            net = self.conv2d(net, 128, [1, 1], scope='conv11_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv11_3x3', padding='valid')
            # -------------------------------------------------------------------11
            print("block11_output", net)
            check_points['block11'] = net
            print("————————————————————————————————————————————————")
            for i,j in enumerate(self.feature_layers):
                loc, cls = self.ssd_prediction(
                                    x = check_points[j],
                                    num_classes = self.num_classes,
                                    box_num = self.boxes_len[i],
                                    isL2norm = self.isL2norm[i],
                                    scope = j + '_box'
                                    )
                predictions.append(tf.nn.softmax(cls))
                locations.append(loc)
            
            print("————————————————————————————————————————————————")
            print(locations, predictions)
            return locations, predictions, x
        #print("————————————————————————————————————————————————")
        #print(check_points)


##########    先验框部分开始
    # 先验框生成
    def ssd_anchor_layer(self,img_size,feature_map_size,anchor_size,anchor_ratio,anchor_step,box_num,offset=0.5):
        # 提取FM的每个坐标
        y, x = np.mgrid[0:feature_map_size[0],0:feature_map_size[1]] 
        # 映射回原图，映射到原图  anchor_step = SRC[300*300]/FM1[38*38] = 7.89 = 8
        # 返回FM1每个像素点坐标对于的原图坐标，归一化值（0-1）之间的比例值。
        y = (y.astype(np.float32) + offset) * anchor_step /img_size[0] 
        x = (x.astype(np.float32) + offset) * anchor_step /img_size[1]

        y = np.expand_dims(y,axis=-1)
        x = np.expand_dims(x,axis=-1)        
        
        # 有两个默认的长宽比为1,但是大小不同的正方形先验框：计算两个长宽比为1的h、w。——根据先验框个数来确定的，多少个先验框就有多少个长宽。
        h = np.zeros((box_num,), np.float32)
        w = np.zeros((box_num,), np.float32)
        # 第一个：h[0]、w[0]：先验框
        h[0] = anchor_size[0] /img_size[0]
        w[0] = anchor_size[0] /img_size[0]
        # 第二个：h[1]、w[1]
        h[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[0] # **0.5相当于sqrt开根号，
        w[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[1]

        # 剩下的长宽比按公式来计算。
        for i, j in enumerate(anchor_ratio):
            h[i + 2] = anchor_size[0] / img_size[0] / (j ** 0.5)
            w[i + 2] = anchor_size[0] / img_size[1] * (j ** 0.5)

        return y, x, h, w

    # 解码网络返回box[x0, y0, x1, y1] -》先验框通过平移和缩放接近真实框。其中 prior_scaling 为平移、尺度因子
    def ssd_decode(self, location, box, prior_scaling):
        y_a, x_a, h_a, w_a = box
        # 平移
        cx = location[:, :, :, :, 0] * w_a * prior_scaling[0] + x_a  #location最后一个维度有4，表示4个值：x,y,w,h
        cy = location[:, :, :, :, 1] * h_a * prior_scaling[1] + y_a
        # 缩放
        w = w_a * tf.exp(location[:, :, :, :, 2] * prior_scaling[2])
        h = h_a * tf.exp(location[:, :, :, :, 3] * prior_scaling[3])
        # 计算框的左上和右下坐标：box[x0, y0, x1, y1]
        bboxes = tf.stack(
            [
            cy - h / 2.0,         
            cx - w / 2.0, 
            cy + h / 2.0, 
            cx + w / 2.0
            ], 
            axis=-1
            )
        print(bboxes)
        return bboxes

    
if __name__ == '__main__':
    model = ssd()
    locations, predictions, x = model.set_net()
    x, y, h, w = model.ssd_anchor_layer(model.img_size, (38,38), (21.,45.), [2.,.5], 8, 4)
    print(x, y, h, w)
    print(x.shape, y.shape, h.shape, w.shape)
    plt.scatter(x, y)
    plt.show()
    box = model.ssd_anchor_layer(model.img_size, (10,10), (60, 111), [2.,.5,3.,1/3], 32, 6)
    print("________________________________________________________________")
    print('box',box)

    # 解码网络打印
    bboxes = model.ssd_decode(locations[2],box,model.prior_scaling)
    print(bboxes)

Step 5/x 先验框部分——筛选

由于在进行box提取时，SSD网络提出太多的box（8732个），这么多的box需要进行筛选。才能输出进行最后的输出。
关于8732个box怎么保留，训练和测试的筛选方法不一样。（https://www.jianshu.com/p/5b3ca7201fae）

# 先验框筛选_由于先验框太多了，需要进行减少——将总8732的6层，每层n_box
def choose_anchor_boxes(self, predictions, anchor_box, n_box):
    anchor_box = tf.reshape(anchor_box, [n_box, 4])
    prediction = tf.reshape(predictions, [n_box, 21])
    prediction = prediction[:, 1:]
    classes = tf.argmax(prediction, axis=1) + 1 # 20+1
    scores = tf.reduce_max(prediction, axis=1)  # 当得分大于阈值，保留锚框，一个先验框对应一个类别

    filter_mask = scores > self.threshold
    # tf.boolean_mask(a,b)用来过滤概率值比较低的锚盒，b为过来条件【filter_mask = scores > self.threshold】
    classes = tf.boolean_mask(classes, filter_mask)
    scores = tf.boolean_mask(scores, filter_mask)
    anchor_box = tf.boolean_mask(anchor_box, filter_mask)
    
    return classes, scores, anchor_box

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
class ssd(object):
    def __init__(self):
        # 初始化一：FM、cls和loc设置
        self.feature_map_size = [[38, 38], [19, 19], [10, 10], [5, 5], [3, 3], [1, 1]]
        self.classes = ["aeroplane", "bicycle", "bird", "boat", "bottle",
            "bus", "car", "cat", "chair", "cow", "diningtable",
            "dog", "horse", "motorbike", "person", "pottedplant",
            "sheep", "sofa", "train", "tvmonitor"]
        self.feature_layers = ['block4', 'block7', 'block8', 'block9', 'block10', 'block11']
        self.img_size = (300, 300)
        self.num_classes = 21
        self.boxes_len = [4, 6, 6, 6, 4, 4] # FM1每个像素点取4个尺度框，FM2每个像素点取6个尺度框，。。。
        self.isL2norm = [True, False, False, False, False, False]
        
        # 初始化二：先验框
        # 计算得到：sk：6组min_size和max_size [[h0, w0],[h1, w1],[h2, w2],[h3, w3]]每次取一组两个：[21., 45.]
        '''
        # 官方：60, 111, 162, 213, 264, 315.》》》6组min_size和max_size
        anchor_sizes=[
                (30., 60.),
                (60., 111.),
                (111., 162.),
                (162., 213.),
                (213., 264.),
                (264., 315.)]
        '''
        # 初始化二：先验框
        self.anchor_sizes = [
                [21., 45.],
                [45., 99.], 
                [99., 153.],
                [153., 207.],
                [207., 261.], 
                [261., 315.]
            ]
        # 取ar:{1, 2, 1/2, 3, 1/3},对应每层的ar=[[1,2,1/2]]
        self.anchor_ratios = [
                [2, .5], 
                [2, .5, 3, 1./3], 
                [2, .5, 3, 1./3], 
                [2, .5, 3, 1./3], 
                [2, .5], 
                [2, .5]
            ]
        # 初始化二：先验框实现FM像素点映射到原图300*300的中心点扩张步长。
        self.anchor_steps = [8, 16, 30, 60, 100, 300]
        
        # 初始化三：先验框先验框解码用的缩放比例。
        self.prior_scaling = [0.1, 0.1, 0.2, 0.2] #特征图先验框缩放比例
        
        # 每层FM的默认框个数值，可计算。
        self.n_boxes = [5776, 2166, 600, 150, 36, 4]  #8732个
        
        # IOU阈值设置
        self.threshold = 0.25

    # step 2/x 卷积模块创建，池化模块，随意丢弃模块。
    '''
    tf.layers.conv2d() 经典输入参数：
    f(w*x+b)：
    x = 输入input；
    w = 卷积核个数filter_num，尺寸k_size；
    b = 默认，use_bias=True；
    * = 卷积步长stride，填充方式padding，卷积模式dilation（标准，扩张等），等等一系列；
    f = 激活函数。
    '''
    def conv2d(self,x,filter,k_size,stride=[1,1],padding='same',dilation=[1,1],activation=tf.nn.relu,scope='conv2d'):
        return tf.layers.conv2d(inputs=x, filters=filter, kernel_size=k_size,
                            strides=stride, dilation_rate=dilation, padding=padding,
                            name=scope, activation=activation, use_bias=True)
    # 
    '''
    tf.layers.max_pooling2d()，经典输入参数：
    p*x:
    p = 尺寸pool_size
    x = 输入input
    '''
    def max_pool2d(self,x, pool_size, stride, scope='max_pool2d'):
        return tf.layers.max_pooling2d(inputs=x, pool_size=pool_size, strides=stride, name=scope, padding='same')

    # 
    '''
    tf.pad() 对原图进行填充，为了匹配输入输出尺寸
    '''
    def pad2d(self,x, pad):
        return tf.pad(x, paddings=[[0, 0], [pad, pad], [pad, pad], [0, 0]])

    # 对第四层模块的卷积进行L2归一化，只对通道数进行归一化，因为比较靠前。。。。？？？
    def l2norm(self, x, trainable=True, scope='L2Normalization'):
        n_channels = x.get_shape().as_list()[-1]  # 通道数
        l2_norm = tf.nn.l2_normalize(x, dim=[3], epsilon=1e-12)  # 只对每个像素点在channels上做归一化
        with tf.variable_scope(scope):
            gamma = tf.get_variable("gamma", shape=[n_channels, ], dtype=tf.float32,
                                    trainable=trainable)
        return l2_norm * gamma

    # loc 和 cls 通过卷积进行计算 【num_classes和box_num】
    def ssd_prediction(self, x, num_classes, box_num, isL2norm, scope='multibox'):
        reshape = [-1] + x.get_shape().as_list()[1:-1]  # 去除第一个和最后一个得到shape
        with tf.variable_scope(scope):
            if isL2norm:
                x = self.l2norm(x) # 进行
                print(x)
            # 预测位置loc  --》 坐标和大小  回归
            location_pred = self.conv2d(x, filter=box_num * 4, k_size=[3,3], activation=None,scope='conv_loc')
            location_pred = tf.reshape(location_pred, reshape + [box_num, 4])
            # 预测类别cls   --> 分类 sofrmax
            class_pred = self.conv2d(x, filter=box_num * num_classes, k_size=[3,3], activation=None, scope='conv_cls')
            class_pred = tf.reshape(class_pred, reshape + [box_num, num_classes])
            print(location_pred, class_pred)
            return location_pred, class_pred

    def set_net(self,x=None):
        # 列表放FM
        check_points = {}   # 字典存储{'key':value}
        predictions = []    # 列表存储[value]
        locations = []      # 列表存储[value]
        with tf.variable_scope('ssd_300_vgg'):
            x = tf.placeholder(dtype=tf.float32,shape=[None,300,300,3])
            #b1
            net = self.conv2d(x,filter=64,k_size=[3,3],scope='conv1_1')
            net = self.conv2d(net,64,[3,3],scope='conv1_2')
            net = self.max_pool2d(net,pool_size=[2,2],stride=[2,2],scope='pool1')
            #b2
            net = self.conv2d(net, filter=128, k_size=[3, 3], scope='conv2_1')
            net = self.conv2d(net, 128, [3, 3], scope='conv2_2')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool2')
            #b3
            net = self.conv2d(net, filter=256, k_size=[3, 3], scope='conv3_1')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_2')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_3')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool3')
            #b4
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv4_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_3')
            print("block4_output", net)
            # -------------------------------------------------------------------4
            check_points['block4'] = net
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool4')
            #print('pool4', net)
            #b5
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv5_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_3')
            #print('conv5_3',net)
            net = self.max_pool2d(net, pool_size=[3, 3], stride=[1, 1], scope='pool5')
            #print('pool5',net)
            #b6
            net = self.conv2d(net,1024,[3,3],dilation=[6,6],scope='conv6')
            #print('conv6',net)
            #b7
            net = self.conv2d(net,1024,[1,1],scope='conv7')
            print("block7_output", net)
            # -------------------------------------------------------------------7
            check_points['block7'] = net
            #b8],scope='conv8_1x1')
            net = self.conv2d(net, 256, [1, 1], scope='conv8_1x1')
            #print('conv8_3',net)
            # 该层要进行填补
            print('pad2d-start',net)
            net = self.pad2d(net, 1)
            print('pad2d-end',net)
            net = self.conv2d(net, 512, [3, 3], [2, 2], scope='conv8_3x3', padding='valid')
            # -------------------------------------------------------------------8
            print("block8_output", net)
            check_points['block8'] = net
            #b9
            net = self.conv2d(net, 128, [1, 1], scope='conv9_1x1')
            net = self.pad2d(net, 1)
            net = self.conv2d(net, 256, [3, 3], [2, 2], scope='conv9_3x3', padding='valid')
            # -------------------------------------------------------------------9
            print("block9_output", net)
            check_points['block9'] = net
            #b10
            net = self.conv2d(net, 128, [1, 1], scope='conv10_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv10_3x3', padding='valid')
            # -------------------------------------------------------------------10
            print("block10_output", net)
            check_points['block10'] = net
            #b11
            net = self.conv2d(net, 128, [1, 1], scope='conv11_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv11_3x3', padding='valid')
            # -------------------------------------------------------------------11
            print("block11_output", net)
            check_points['block11'] = net
            print("————————————————————————————————————————————————")
            for i,j in enumerate(self.feature_layers):
                loc, cls = self.ssd_prediction(
                                    x = check_points[j],
                                    num_classes = self.num_classes,
                                    box_num = self.boxes_len[i],
                                    isL2norm = self.isL2norm[i],
                                    scope = j + '_box'
                                    )
                predictions.append(tf.nn.softmax(cls))
                locations.append(loc)
            
            print("————————————————————————————————————————————————")
            print(locations, predictions)
            return locations, predictions, x
        #print("————————————————————————————————————————————————")
        #print(check_points)


##########    先验框部分开始
    # 先验框生成
    def ssd_anchor_layer(self,img_size, feature_map_size, anchor_size, anchor_ratio, anchor_step, box_num, offset=0.5):
        # 提取FM的每个坐标
        y, x = np.mgrid[0:feature_map_size[0],0:feature_map_size[1]] 
        # 映射回原图，映射到原图  anchor_step = SRC[300*300]/FM1[38*38] = 7.89 = 8
        # 返回FM1每个像素点坐标对于的原图坐标，归一化值（0-1）之间的比例值。
        y = (y.astype(np.float32) + offset) * anchor_step /img_size[0] 
        x = (x.astype(np.float32) + offset) * anchor_step /img_size[1]

        y = np.expand_dims(y,axis=-1)
        x = np.expand_dims(x,axis=-1)        
        
        # 有两个默认的长宽比为1,但是大小不同的正方形先验框：计算两个长宽比为1的h、w。——根据先验框个数来确定的，多少个先验框就有多少个长宽。
        h = np.zeros((box_num,), np.float32)
        w = np.zeros((box_num,), np.float32)
        # 第一个：h[0]、w[0]：先验框
        h[0] = anchor_size[0] /img_size[0]
        w[0] = anchor_size[0] /img_size[0]
        # 第二个：h[1]、w[1]
        h[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[0] # **0.5相当于sqrt开根号，
        w[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[1]

        # 剩下的长宽比按公式来计算。
        for i, j in enumerate(anchor_ratio):
            h[i + 2] = anchor_size[0] / img_size[0] / (j ** 0.5)
            w[i + 2] = anchor_size[0] / img_size[1] * (j ** 0.5)

        return x, y, h, w

    # 解码网络返回box[x0, y0, x1, y1] -》先验框通过平移和缩放接近真实框。其中 prior_scaling 为平移、尺度因子
    def ssd_decode(self, location, box, prior_scaling):
        y_a, x_a, h_a, w_a = box
        # 平移
        cx = location[:, :, :, :, 0] * w_a * prior_scaling[0] + x_a  #location最后一个维度有4，表示4个值：x,y,w,h
        cy = location[:, :, :, :, 1] * h_a * prior_scaling[1] + y_a
        # 缩放
        w = w_a * tf.exp(location[:, :, :, :, 2] * prior_scaling[2])
        h = h_a * tf.exp(location[:, :, :, :, 3] * prior_scaling[3])
        # 计算框的左上和右下坐标：box[x0, y0, x1, y1]
        bboxes = tf.stack(
            [
            cy - h / 2.0,         
            cx - w / 2.0, 
            cy + h / 2.0, 
            cx + w / 2.0
            ], 
            axis=-1
            )
        print(bboxes)
        return bboxes
    # 先验框筛选_由于先验框太多了，需要进行减少——将总8732的6层，每层n_box
    def choose_anchor_boxes(self, predictions, anchor_box, n_box):
        anchor_box = tf.reshape(anchor_box, [n_box, 4])
        prediction = tf.reshape(predictions, [n_box, 21])
        prediction = prediction[:, 1:]
        classes = tf.argmax(prediction, axis=1) + 1 # 20+1
        scores = tf.reduce_max(prediction, axis=1)  # 当得分大于阈值，保留锚框，一个先验框对应一个类别

        filter_mask = scores > self.threshold
        # tf.boolean_mask(a,b)用来过滤概率值比较低的锚盒，b为过来条件【filter_mask = scores > self.threshold】
        classes = tf.boolean_mask(classes, filter_mask)
        scores = tf.boolean_mask(scores, filter_mask)
        anchor_box = tf.boolean_mask(anchor_box, filter_mask)
        
        return classes, scores, anchor_box
    
if __name__ == '__main__':
    # 类ssd实例化object：model
    model = ssd()

    # 类ssd实例的对象：model —— 构建网络，返回loc、cls、x
    # 索引：locations[i],predictions[i];    {i=0,1,...}
    locations, predictions, x = model.set_net()

    # FM4层:--------------------------------
    # 类ssd实例的对象：model —— FM4层的锚框生成 可以输出：'box='，也可以输出：'x, y, h, w='
    # ssd_anchor_layer(self,img_size, feature_map_size, anchor_size, anchor_ratio, anchor_step, box_num, offset=0.5)
    # FM4
    box = model.ssd_anchor_layer(model.img_size, (38, 38), (21.,45.), [2.,.5], 8, 4)

    # 类ssd实例的对象：model —— FM8层的锚框解码生成 bboxes
    # 解码网络打印
    bboxes = model.ssd_decode(locations[0], box, model.prior_scaling)
    print(bboxes)

    # 类ssd实例的对象：model —— 先验框进行筛选剔除。
    # 先验框筛选测试 predictions类别得分，先验框传入，
    classes, scores, anchor_box = model.choose_anchor_boxes(predictions[0], bboxes, model.n_boxes[0])
    print(classes, scores, anchor_box)

    # FM8层：--------------------------------
    # x, y, h, w = ssd_anchor_layer(self,img_size, feature_map_size, anchor_size, anchor_ratio, anchor_step, box_num, offset=0.5)
    x, y, h, w = model.ssd_anchor_layer(model.img_size, (10, 10), (99., 153.), [2, 0.5, 3, 1/3], 30, 6)
    box = [x, y, h, w]
    
    # bboxes = ssd_decode(self, location, box, prior_scaling)
    bboxes = model.ssd_decode(locations[2], box, model.prior_scaling)

    # classes, scores, anchor_box = choose_anchor_boxes(self, predictions, anchor_box, n_box)
    classes, scores, anchor_box = model.choose_anchor_boxes(predictions[2], bboxes, model.n_boxes[2])
    print(classes, scores, anchor_box)

Step 6/x 检测部分——检测，使用预训练模型进行网络测试

opencv-python==4.1.1.26
matplotlib==3.1.1
numpy==1.17.3
tensorflow-gpu==1.14.0

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import cv2
class ssd(object):
    def __init__(self):
        # 初始化一：FM、cls和loc设置
        self.feature_map_size = [[38, 38], [19, 19], [10, 10], [5, 5], [3, 3], [1, 1]]
        self.classes = ["aeroplane", "bicycle", "bird", "boat", "bottle",
            "bus", "car", "cat", "chair", "cow", "diningtable",
            "dog", "horse", "motorbike", "person", "pottedplant",
            "sheep", "sofa", "train", "tvmonitor"]
        self.feature_layers = ['block4', 'block7', 'block8', 'block9', 'block10', 'block11']
        self.img_size = (300, 300)
        self.num_classes = 21
        self.boxes_len = [4, 6, 6, 6, 4, 4] # FM1每个像素点取4个尺度框，FM2每个像素点取6个尺度框，。。。
        self.isL2norm = [True, False, False, False, False, False]
        
        # 初始化二：先验框
        # 计算得到：sk：6组min_size和max_size [[h0, w0],[h1, w1],[h2, w2],[h3, w3]]每次取一组两个：[21., 45.]
        # 初始化二：先验框
        self.anchor_sizes = [[21., 45.], [45., 99.], [99., 153.],[153., 207.],[207., 261.], [261., 315.]]
        # 取ar:{1, 2, 1/2, 3, 1/3},对应每层的ar=[[1,2,1/2]]
        self.anchor_ratios = [[2, .5], [2, .5, 3, 1. / 3], [2, .5, 3, 1. / 3], [2, .5, 3, 1. / 3], [2, .5], [2, .5]]
        # 初始化二：先验框实现FM像素点映射到原图300*300的中心点扩张步长。
        # self.anchor_steps = [8, 16, 32, 64, 100, 300]
        self.anchor_steps = [8, 16, 32, 64, 100, 300]
        
        # 初始化三：先验框先验框解码用的缩放比例。
        self.prior_scaling = [0.1, 0.1, 0.2, 0.2] #特征图先验框缩放比例
        
        # 每层FM的默认框个数值，可计算。
        self.n_boxes = [5776, 2166, 600, 150, 36, 4]  #8732个
        
        # IOU阈值设置
        self.threshold = 0.2

    # step 2/x 卷积模块创建，池化模块，随意丢弃模块。
    '''
    tf.layers.conv2d() 经典输入参数：
    f(w*x+b)：
    x = 输入input；
    w = 卷积核个数filter_num，尺寸k_size；
    b = 默认，use_bias=True；
    * = 卷积步长stride，填充方式padding，卷积模式dilation（标准，扩张等），等等一系列；
    f = 激活函数。
    '''
    def conv2d(self,x,filter,k_size,stride=[1,1],padding='same',dilation=[1,1],activation=tf.nn.relu,scope='conv2d'):
        return tf.layers.conv2d(inputs=x, filters=filter, kernel_size=k_size,
                            strides=stride, dilation_rate=dilation, padding=padding,
                            name=scope, activation=activation)
    # 
    '''
    tf.layers.max_pooling2d()，经典输入参数：
    p*x:
    p = 尺寸pool_size
    x = 输入input
    '''
    def max_pool2d(self,x, pool_size, stride, scope='max_pool2d'):
        return tf.layers.max_pooling2d(inputs=x, pool_size=pool_size, strides=stride, name=scope, padding='same')
    # 
    '''
    tf.pad() 对原图进行填充，为了匹配输入输出尺寸
    '''
    def pad2d(self,x, pad):
        return tf.pad(x, paddings=[[0, 0], [pad, pad], [pad, pad], [0, 0]])

    # 对第四层模块的卷积进行L2归一化，只对通道数进行归一化，因为比较靠前。。。。？？？
    def l2norm(self, x, trainable=True, scope='L2Normalization'):
        n_channels = x.get_shape().as_list()[-1]  # 通道数
        l2_norm = tf.nn.l2_normalize(x, dim=[3], epsilon=1e-12)  # 只对每个像素点在channels上做归一化
        with tf.variable_scope(scope):
            gamma = tf.get_variable("gamma", shape=[n_channels, ], dtype=tf.float32,
                                    trainable=trainable)
        return l2_norm * gamma

    # loc 和 cls 通过卷积进行计算 【num_classes和box_num】
    def ssd_prediction(self, x, num_classes, box_num, isL2norm, scope='multibox'):
        reshape = [-1] + x.get_shape().as_list()[1:-1]  # 去除第一个和最后一个得到shape
        with tf.variable_scope(scope):
            if isL2norm:
                x = self.l2norm(x) # 进行
                print(x)
            # 预测位置loc  --》 坐标和大小  回归
            location_pred = self.conv2d(x, filter=box_num * 4, k_size=[3,3], activation=None,scope='conv_loc')
            location_pred = tf.reshape(location_pred, reshape + [box_num, 4])
            # 预测类别cls   --> 分类 sofrmax
            class_pred = self.conv2d(x, filter=box_num * num_classes, k_size=[3,3], activation=None, scope='conv_cls')
            class_pred = tf.reshape(class_pred, reshape + [box_num, num_classes])
            print(location_pred, class_pred)
            return location_pred, class_pred
    # 第一步：网络构建
    def set_net(self,x=None):
        # 列表放FM
        check_points = {}   # 字典存储{'key':value}
        predictions = []    # 列表存储[value]
        locations = []      # 列表存储[value]
        
        with tf.variable_scope('ssd_300_vgg'):         
            x = tf.placeholder(dtype=tf.float32,shape=[None,300,300,3])   
            #b1
            net = self.conv2d(x,filter=64,k_size=[3,3],scope='conv1_1')
            net = self.conv2d(net,64,[3,3],scope='conv1_2')
            net = self.max_pool2d(net,pool_size=[2,2],stride=[2,2],scope='pool1')
            #b2
            net = self.conv2d(net, filter=128, k_size=[3, 3], scope='conv2_1')
            net = self.conv2d(net, 128, [3, 3], scope='conv2_2')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool2')
            #b3
            net = self.conv2d(net, filter=256, k_size=[3, 3], scope='conv3_1')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_2')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_3')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool3')
            #b4
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv4_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_3')
            print("block4_output", net)
            # -------------------------------------------------------------------4
            check_points['block4'] = net
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool4')
            #print('pool4', net)
            #b5
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv5_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_3')
            #print('conv5_3',net)
            net = self.max_pool2d(net, pool_size=[3, 3], stride=[1, 1], scope='pool5')
            #print('pool5',net)
            #b6
            net = self.conv2d(net,1024,[3,3],dilation=[6,6],scope='conv6')
            #print('conv6',net)
            #b7
            net = self.conv2d(net,1024,[1,1],scope='conv7')
            print("block7_output", net)
            # -------------------------------------------------------------------7
            check_points['block7'] = net
            #b8],scope='conv8_1x1')
            net = self.conv2d(net, 256, [1, 1], scope='conv8_1x1')
            #print('conv8_3',net)
            # 该层要进行填补
            print('pad2d-start',net)
            net = self.pad2d(net, 1)
            print('pad2d-end',net)
            net = self.conv2d(net, 512, [3, 3], [2, 2], scope='conv8_3x3', padding='valid')
            # -------------------------------------------------------------------8
            print("block8_output", net)
            check_points['block8'] = net
            #b9
            net = self.conv2d(net, 128, [1, 1], scope='conv9_1x1')
            net = self.pad2d(net, 1)
            net = self.conv2d(net, 256, [3, 3], [2, 2], scope='conv9_3x3', padding='valid')
            # -------------------------------------------------------------------9
            print("block9_output", net)
            check_points['block9'] = net
            #b10
            net = self.conv2d(net, 128, [1, 1], scope='conv10_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv10_3x3', padding='valid')
            # -------------------------------------------------------------------10
            print("block10_output", net)
            check_points['block10'] = net
            #b11
            net = self.conv2d(net, 128, [1, 1], scope='conv11_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv11_3x3', padding='valid')
            # -------------------------------------------------------------------11
            print("block11_output", net)
            check_points['block11'] = net
            print("————————————————————————————————————————————————")
            for i,j in enumerate(self.feature_layers):
                loc, cls = self.ssd_prediction(
                                    x = check_points[j],
                                    num_classes = self.num_classes,
                                    box_num = self.boxes_len[i],
                                    isL2norm = self.isL2norm[i],
                                    scope = j + '_box'
                                    )
                predictions.append(tf.nn.softmax(cls))
                locations.append(loc)
            
            print("————————————————————————————————————————————————")
            print(locations, predictions)
            return locations, predictions, x
        #print("————————————————————————————————————————————————")
        #print(check_points)


##########    先验框部分开始
    # 第二步：分点：锚框
    # 先验框生成
    def ssd_anchor_layer(self,img_size, feature_map_size, anchor_size, anchor_ratio, anchor_step, box_num, offset=0.5):
        # 提取FM的每个坐标
        y, x = np.mgrid[0:feature_map_size[0],0:feature_map_size[1]] 
        # 映射回原图，映射到原图  anchor_step = SRC[300*300]/FM1[38*38] = 7.89 = 8
        # 返回FM1每个像素点坐标对于的原图坐标，归一化值（0-1）之间的比例值。
        y = (y.astype(np.float32) + offset) * anchor_step /img_size[0] 
        x = (x.astype(np.float32) + offset) * anchor_step /img_size[1]

        y = np.expand_dims(y, axis=-1)
        x = np.expand_dims(x, axis=-1)        
        
        # 有两个默认的长宽比为1,但是大小不同的正方形先验框：计算两个长宽比为1的h、w。——根据先验框个数来确定的，多少个先验框就有多少个长宽。
        h = np.zeros((box_num,), np.float32) #类型统一，才可以相乘相除——————修改一
        w = np.zeros((box_num,), np.float32)
        # 第一个：h[0]、w[0]：先验框
        h[0] = anchor_size[0] /img_size[0]
        w[0] = anchor_size[0] /img_size[0]
        # 第二个：h[1]、w[1]
        h[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[0] # **0.5相当于sqrt开根号，
        w[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[1]

        # 剩下的长宽比按公式来计算。
        for i, j in enumerate(anchor_ratio):
            h[i + 2] = anchor_size[0] / img_size[0] / (j ** 0.5)
            w[i + 2] = anchor_size[0] / img_size[1] * (j ** 0.5)

        return y, x, h, w

    # 第二步：分点：解码
    # 解码网络返回box[x0, y0, x1, y1] -》先验框通过平移和缩放接近真实框。其中 prior_scaling 为平移、尺度因子
    def ssd_decode(self, location, box, prior_scaling):
        y_a, x_a, h_a, w_a = box
        # 平移
        cx = location[:, :, :, :, 0] * w_a * prior_scaling[0] + x_a  #location最后一个维度有4，表示4个值：x,y,w,h
        cy = location[:, :, :, :, 1] * h_a * prior_scaling[1] + y_a
        # 缩放
        w = w_a * tf.exp(location[:, :, :, :, 2] * prior_scaling[2])
        h = h_a * tf.exp(location[:, :, :, :, 3] * prior_scaling[3])
        # 计算框的左上和右下坐标：box[x0, y0, x1, y1]
        bboxes = tf.stack([cy - h / 2.0, cx - w / 2.0, cy + h / 2.0, cx + w / 2.0], axis=-1)
        print(bboxes)
        return bboxes
    
    # 第二步：分点：筛选
    # 先验框筛选_由于先验框太多了，需要进行减少——将总8732的6层，每层n_box
    def choose_anchor_boxes(self, predictions, anchor_box, n_box):
        anchor_box = tf.reshape(anchor_box, [n_box, 4])
        prediction = tf.reshape(predictions, [n_box, 21])
        prediction = prediction[:, 1:]
        classes = tf.argmax(prediction, axis=1) + 1 # 20+1
        scores = tf.reduce_max(prediction, axis=1)  # 当得分大于阈值，保留锚框，一个先验框对应一个类别

        filter_mask = scores > self.threshold
        # tf.boolean_mask(a,b)用来过滤概率值比较低的锚盒，b为过来条件【filter_mask = scores > self.threshold】b的制作规则是要用逻辑表达式（>或者<）生成布尔值
        classes = tf.boolean_mask(classes, filter_mask)
        scores = tf.boolean_mask(scores, filter_mask)
        anchor_box = tf.boolean_mask(anchor_box, filter_mask)
        
        return classes, scores, anchor_box

######### 训练部分开始
    # 第四步：先验框分数排序，取top_k个
    # 先验框分数排序，取前400
    def bboxes_sort(self,classes, scores, bboxes, top_k=400):
        idxes = np.argsort(-scores)
        classes = classes[idxes][:top_k]
        scores = scores[idxes][:top_k]
        bboxes = bboxes[idxes][:top_k]
        return classes, scores, bboxes
        # 计算IOU
    
    # 第五步：先验框NMS+IOU去重二
    # IOU
    def bboxes_iou(self,bboxes1, bboxes2):
        bboxes1 = np.transpose(bboxes1)
        bboxes2 = np.transpose(bboxes2)
        # 计算两个box的交集：交集左上角的点取两个box的max，交集右下角的点取两个box的min
        int_ymin = np.maximum(bboxes1[0], bboxes2[0])
        int_xmin = np.maximum(bboxes1[1], bboxes2[1])
        int_ymax = np.minimum(bboxes1[2], bboxes2[2])
        int_xmax = np.minimum(bboxes1[3], bboxes2[3])

        # 计算两个box交集的wh：如果两个box没有交集，那么wh为0(按照计算方式wh为负数，跟0比较取最大值)
        int_h = np.maximum(int_ymax - int_ymin, 0.)
        int_w = np.maximum(int_xmax - int_xmin, 0.)

        # 计算IOU
        int_vol = int_h * int_w  # 交集面积
        vol1 = (bboxes1[2] - bboxes1[0]) * (bboxes1[3] - bboxes1[1])  # bboxes1面积
        vol2 = (bboxes2[2] - bboxes2[0]) * (bboxes2[3] - bboxes2[1])  # bboxes2面积
        iou = int_vol / (vol1 + vol2 - int_vol)  # IOU=交集/并集
        return iou
    
    # 第五步：先验框NMS+IOU去重一
    # NMS
    def bboxes_nms(self,classes, scores, bboxes, nms_threshold=0.5):
        keep_bboxes = np.ones(scores.shape, dtype=np.bool)
        for i in range(scores.size - 1):
            if keep_bboxes[i]:
                overlap = self.bboxes_iou(bboxes[i], bboxes[(i + 1):])
                keep_overlap = np.logical_or(overlap < nms_threshold, classes[(i + 1):] != classes[i])
                keep_bboxes[(i + 1):] = np.logical_and(keep_bboxes[(i + 1):], keep_overlap)
        idxes = np.where(keep_bboxes)
        return classes[idxes], scores[idxes], bboxes[idxes]

######## 训练部分结束

#________________________________________________________________
    # 第三步：图像预处理
    # 图像预处理——均值处理
    def handle_img(self, img_path):
        means = np.array((123., 117., 104.))
        self.img = cv2.imread(img_path)
        # img = self.img
        # img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) - means
        # img = cv2.resize(img,self.img_size)
        # img = np.expand_dims(img,axis=0)
        img = np.expand_dims(cv2.resize(cv2.cvtColor(self.img, cv2.COLOR_BGR2RGB) - means,self.img_size),axis=0)
        return img
    
    def video_handle_img(self, image):
        means = np.array((123., 117., 104.))
        self.img = image
        # img = self.img
        # img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) - means
        # img = cv2.resize(img,self.img_size)
        # img = np.expand_dims(img,axis=0)
        img = np.expand_dims(cv2.resize(cv2.cvtColor(self.img, cv2.COLOR_BGR2RGB) - means,self.img_size),axis=0)
        return img

    # 第六步：画出结果
    # 画框
    def draw_rectangle(self,img, classes, scores, bboxes, colors, thickness=2):
        shape = img.shape
        for i in range(bboxes.shape[0]):
            bbox = bboxes[i]
            # color = colors[classes[i]]
            p1 = (int(bbox[0] * shape[0]), int(bbox[1] * shape[1]))
            p2 = (int(bbox[2] * shape[0]), int(bbox[3] * shape[1]))
            cv2.rectangle(img, p1[::-1], p2[::-1], colors[0], thickness)
            # Draw text...
            s = '%s/%.3f' % (self.classes[classes[i] - 1], scores[i])
            p1 = (p1[0] - 5, p1[1])
            cv2.putText(img, s, p1[::-1], cv2.FONT_HERSHEY_DUPLEX, 0.5, colors[1], 1)
        cv2.namedWindow("img", 0)
        cv2.resizeWindow("img", 640, 480)
        cv2.imshow('img', img)
        cv2.waitKey(0)
        cv2.destroyAllWindows()
    
    def video_draw_rectangle(self,img, classes, scores, bboxes, colors, thickness=2):
        shape = img.shape
        for i in range(bboxes.shape[0]):
            bbox = bboxes[i]
            # color = colors[classes[i]]
            p1 = (int(bbox[0] * shape[0]), int(bbox[1] * shape[1]))
            p2 = (int(bbox[2] * shape[0]), int(bbox[3] * shape[1]))
            cv2.rectangle(img, p1[::-1], p2[::-1], colors[0], thickness)
            # Draw text...
            s = '%s/%.3f' % (self.classes[classes[i] - 1], scores[i])
            p1 = (p1[0] - 5, p1[1])
            cv2.putText(img, s, p1[::-1], cv2.FONT_HERSHEY_DUPLEX, 0.5, colors[1], 1)
        cv2.namedWindow("img", 0)
        cv2.resizeWindow("img", 640, 480)
        cv2.imshow('img', img)

    # 第二步：综合：锚框+解码+筛选
    def predict(self, locations, predictions):
        layers_anchors = []
        classes_list = []
        scores_list = []
        bboxes_list = []
        # 锚框
        for i, s in enumerate(self.feature_map_size):
            anchor_bboxes = self.ssd_anchor_layer(self.img_size, s,
                                                  self.anchor_sizes[i],
                                                  self.anchor_ratios[i],
                                                  self.anchor_steps[i],
                                                  self.boxes_len[i])
            layers_anchors.append(anchor_bboxes)
        for i in range(len(predictions)):
            # 解码
            d_box = self.ssd_decode(locations[i], layers_anchors[i], self.prior_scaling)
            # 筛选
            cls, sco, box = self.choose_anchor_boxes(predictions[i], d_box, self.n_boxes[i])
            classes_list.append(cls)
            scores_list.append(sco)
            bboxes_list.append(box)
        # tf.concat拼接张量
        classes = tf.concat(classes_list, axis=0)
        scores = tf.concat(scores_list, axis=0)
        bboxes = tf.concat(bboxes_list, axis=0)
        return classes, scores, bboxes


import datetime
if __name__ == '__main__':
    # 类ssd实例化object：model —— 建立一个类
    model = ssd() # 实例类ssd的对象：model    
    locations, predictions, x = model.set_net()    # 
    classes, scores, bboxes = model.predict(locations, predictions)    # 
    sess = tf.Session()    # 
    sess.run(tf.global_variables_initializer())    # 
    saver = tf.train.Saver()
    saver.restore(sess, 'ssd_vgg_300_weights.ckpt')    # 
    VIDEO = True #
    if VIDEO == False:
        start_time = datetime.datetime.now()
        print(start_time)
        img = model.handle_img("image4.jpg")    # -------------------------------- -------------

        rclasses, rscores, rbboxes = sess.run([classes, scores, bboxes], feed_dict={x: img})

        rclasses, rscores, rbboxes = model.bboxes_sort(rclasses, rscores, rbboxes)

        rclasses, rscores, rbboxes = model.bboxes_nms(rclasses, rscores, rbboxes)
        print(datetime.datetime.now() - start_time)
        print(datetime.datetime.now())
        model.draw_rectangle(model.img,rclasses,rscores,rbboxes,[[0,0,255],[255,0,0]])
    else:
        cap = cv2.VideoCapture(0)       
        while True:
            if cap.isOpened():
                ret, frame = cap.read()
                start_time = datetime.datetime.now()
                img = model.video_handle_img(frame)
                rclasses, rscores, rbboxes = sess.run([classes, scores, bboxes], feed_dict={x: img})

                rclasses, rscores, rbboxes = model.bboxes_sort(rclasses, rscores, rbboxes)

                rclasses, rscores, rbboxes = model.bboxes_nms(rclasses, rscores, rbboxes)
                model.video_draw_rectangle(model.img,rclasses,rscores,rbboxes,[[0,0,255],[255,0,0]])
                print(datetime.datetime.now() - start_time)
                print(datetime.datetime.now())
                if cv2.waitKey(10)==27:
                    break
        cap.release()
        cv2.destroyAllWindows()

    
'''
import cv2
cap = cv2.VideoCapture(0)
while True:
    if cap.isOpened():
        ret,frame = cap.read()
        cv2.imshow('frame',frame)
        cv2.waitKey(1000)
cap.release()
cv2.destroyAllWindows()
'''

Step 7/x 训练部分——数据转换voc转tfrecords

利用ssd-tensorflow的自带tf_convert_data.py及其子模块datasets进行转换。

Usage:
```shell
python tf_convert_data.py \
    --dataset_name=pascalvoc \
    --dataset_dir=/tmp/pascalvoc \
    --output_name=pascalvoc \
    --output_dir=/tmp/
```
# Window shell:
```
# 规定pascalvoc，数据集文件夹路径*/*/，指定数据集名称，指定数据集输出地址
python tf_convert_data.py  --dataset_name=pascalvoc  --dataset_dir=./voc2007/  --output_name=voc_2007_train  --output_dir=./TFR_Data
```

Step 8/x 训练部分——Trainer

模仿ssd-tensorflow的训练

>> python ssd_train.py

Step 9/x 预测部分——整合1-7步的code

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import cv2
class ssd(object):
    def __init__(self):
        # 初始化一：FM、cls和loc设置
        self.feature_map_size = [[38, 38], [19, 19], [10, 10], [5, 5], [3, 3], [1, 1]]
        self.classes = ["aeroplane", "bicycle", "bird", "boat", "bottle",
            "bus", "car", "cat", "chair", "cow", "diningtable",
            "dog", "horse", "motorbike", "person", "pottedplant",
            "sheep", "sofa", "train", "tvmonitor"]
        self.feature_layers = ['block4', 'block7', 'block8', 'block9', 'block10', 'block11']
        self.img_size = (300, 300)
        self.num_classes = 21
        self.boxes_len = [4, 6, 6, 6, 4, 4] # FM1每个像素点取4个尺度框，FM2每个像素点取6个尺度框，。。。
        self.isL2norm = [True, False, False, False, False, False]
        
        # 初始化二：先验框
        # 计算得到：sk：6组min_size和max_size [[h0, w0],[h1, w1],[h2, w2],[h3, w3]]每次取一组两个：[21., 45.]
        # 初始化二：先验框
        self.anchor_sizes = [[21., 45.], [45., 99.], [99., 153.],[153., 207.],[207., 261.], [261., 315.]]
        # 取ar:{1, 2, 1/2, 3, 1/3},对应每层的ar=[[1,2,1/2]]
        self.anchor_ratios = [[2, .5], [2, .5, 3, 1. / 3], [2, .5, 3, 1. / 3], [2, .5, 3, 1. / 3], [2, .5], [2, .5]]
        # 初始化二：先验框实现FM像素点映射到原图300*300的中心点扩张步长。
        # self.anchor_steps = [8, 16, 32, 64, 100, 300]
        self.anchor_steps = [8, 16, 32, 64, 100, 300]
        
        # 初始化三：先验框先验框解码用的缩放比例。
        self.prior_scaling = [0.1, 0.1, 0.2, 0.2] #特征图先验框缩放比例
        
        # 每层FM的默认框个数值，可计算。
        self.n_boxes = [5776, 2166, 600, 150, 36, 4]  #8732个
        
        # IOU阈值设置
        self.threshold = 0.2

    # step 2/x 卷积模块创建，池化模块，随意丢弃模块。
    '''
    tf.layers.conv2d() 经典输入参数：
    f(w*x+b)：
    x = 输入input；
    w = 卷积核个数filter_num，尺寸k_size；
    b = 默认，use_bias=True；
    * = 卷积步长stride，填充方式padding，卷积模式dilation（标准，扩张等），等等一系列；
    f = 激活函数。
    '''
    def conv2d(self,x,filter,k_size,stride=[1,1],padding='same',dilation=[1,1],activation=tf.nn.relu,scope='conv2d'):
        return tf.layers.conv2d(inputs=x, filters=filter, kernel_size=k_size,
                            strides=stride, dilation_rate=dilation, padding=padding,
                            name=scope, activation=activation)
    # 
    '''
    tf.layers.max_pooling2d()，经典输入参数：
    p*x:
    p = 尺寸pool_size
    x = 输入input
    '''
    def max_pool2d(self,x, pool_size, stride, scope='max_pool2d'):
        return tf.layers.max_pooling2d(inputs=x, pool_size=pool_size, strides=stride, name=scope, padding='same')
    # 
    '''
    tf.pad() 对原图进行填充，为了匹配输入输出尺寸
    '''
    def pad2d(self,x, pad):
        return tf.pad(x, paddings=[[0, 0], [pad, pad], [pad, pad], [0, 0]])

    # 对第四层模块的卷积进行L2归一化，只对通道数进行归一化，因为比较靠前。。。。？？？
    def l2norm(self, x, trainable=True, scope='L2Normalization'):
        n_channels = x.get_shape().as_list()[-1]  # 通道数
        l2_norm = tf.nn.l2_normalize(x, dim=[3], epsilon=1e-12)  # 只对每个像素点在channels上做归一化
        with tf.variable_scope(scope):
            gamma = tf.get_variable("gamma", shape=[n_channels, ], dtype=tf.float32,
                                    trainable=trainable)
        return l2_norm * gamma

    # loc 和 cls 通过卷积进行计算 【num_classes和box_num】
    def ssd_prediction(self, x, num_classes, box_num, isL2norm, scope='multibox'):
        reshape = [-1] + x.get_shape().as_list()[1:-1]  # 去除第一个和最后一个得到shape
        with tf.variable_scope(scope):
            if isL2norm:
                x = self.l2norm(x) # 进行
                print(x)
            # 预测位置loc  --》 坐标和大小  回归
            location_pred = self.conv2d(x, filter=box_num * 4, k_size=[3,3], activation=None,scope='conv_loc')
            location_pred = tf.reshape(location_pred, reshape + [box_num, 4])
            # 预测类别cls   --> 分类 sofrmax
            class_pred = self.conv2d(x, filter=box_num * num_classes, k_size=[3,3], activation=None, scope='conv_cls')
            class_pred = tf.reshape(class_pred, reshape + [box_num, num_classes])
            print(location_pred, class_pred)
            return location_pred, class_pred
    # 第一步：网络构建
    def set_net(self,x=None):
        # 列表放FM
        check_points = {}   # 字典存储{'key':value}
        predictions = []    # 列表存储[value]
        locations = []      # 列表存储[value]
        
        with tf.variable_scope('ssd_300_vgg'):         
            x = tf.placeholder(dtype=tf.float32,shape=[None,300,300,3])   
            #b1
            net = self.conv2d(x,filter=64,k_size=[3,3],scope='conv1_1')
            net = self.conv2d(net,64,[3,3],scope='conv1_2')
            net = self.max_pool2d(net,pool_size=[2,2],stride=[2,2],scope='pool1')
            #b2
            net = self.conv2d(net, filter=128, k_size=[3, 3], scope='conv2_1')
            net = self.conv2d(net, 128, [3, 3], scope='conv2_2')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool2')
            #b3
            net = self.conv2d(net, filter=256, k_size=[3, 3], scope='conv3_1')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_2')
            net = self.conv2d(net, 256, [3, 3], scope='conv3_3')
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool3')
            #b4
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv4_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv4_3')
            print("block4_output", net)
            # -------------------------------------------------------------------4
            check_points['block4'] = net
            net = self.max_pool2d(net, pool_size=[2, 2], stride=[2, 2], scope='pool4')
            #print('pool4', net)
            #b5
            net = self.conv2d(net, filter=512, k_size=[3, 3], scope='conv5_1')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_2')
            net = self.conv2d(net, 512, [3, 3], scope='conv5_3')
            #print('conv5_3',net)
            net = self.max_pool2d(net, pool_size=[3, 3], stride=[1, 1], scope='pool5')
            #print('pool5',net)
            #b6
            net = self.conv2d(net,1024,[3,3],dilation=[6,6],scope='conv6')
            #print('conv6',net)
            #b7
            net = self.conv2d(net,1024,[1,1],scope='conv7')
            print("block7_output", net)
            # -------------------------------------------------------------------7
            check_points['block7'] = net
            #b8],scope='conv8_1x1')
            net = self.conv2d(net, 256, [1, 1], scope='conv8_1x1')
            #print('conv8_3',net)
            # 该层要进行填补
            print('pad2d-start',net)
            net = self.pad2d(net, 1)
            print('pad2d-end',net)
            net = self.conv2d(net, 512, [3, 3], [2, 2], scope='conv8_3x3', padding='valid')
            # -------------------------------------------------------------------8
            print("block8_output", net)
            check_points['block8'] = net
            #b9
            net = self.conv2d(net, 128, [1, 1], scope='conv9_1x1')
            net = self.pad2d(net, 1)
            net = self.conv2d(net, 256, [3, 3], [2, 2], scope='conv9_3x3', padding='valid')
            # -------------------------------------------------------------------9
            print("block9_output", net)
            check_points['block9'] = net
            #b10
            net = self.conv2d(net, 128, [1, 1], scope='conv10_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv10_3x3', padding='valid')
            # -------------------------------------------------------------------10
            print("block10_output", net)
            check_points['block10'] = net
            #b11
            net = self.conv2d(net, 128, [1, 1], scope='conv11_1x1')
            net = self.conv2d(net, 256, [3, 3], scope='conv11_3x3', padding='valid')
            # -------------------------------------------------------------------11
            print("block11_output", net)
            check_points['block11'] = net
            print("————————————————————————————————————————————————")
            for i,j in enumerate(self.feature_layers):
                loc, cls = self.ssd_prediction(
                                    x = check_points[j],
                                    num_classes = self.num_classes,
                                    box_num = self.boxes_len[i],
                                    isL2norm = self.isL2norm[i],
                                    scope = j + '_box'
                                    )
                predictions.append(tf.nn.softmax(cls))
                locations.append(loc)
            
            print("————————————————————————————————————————————————")
            print(locations, predictions)
            return locations, predictions, x
        #print("————————————————————————————————————————————————")
        #print(check_points)


##########    先验框部分开始
    # 第二步：分点：锚框
    # 先验框生成
    def ssd_anchor_layer(self,img_size, feature_map_size, anchor_size, anchor_ratio, anchor_step, box_num, offset=0.5):
        # 提取FM的每个坐标
        y, x = np.mgrid[0:feature_map_size[0],0:feature_map_size[1]] 
        # 映射回原图，映射到原图  anchor_step = SRC[300*300]/FM1[38*38] = 7.89 = 8
        # 返回FM1每个像素点坐标对于的原图坐标，归一化值（0-1）之间的比例值。
        y = (y.astype(np.float32) + offset) * anchor_step /img_size[0] 
        x = (x.astype(np.float32) + offset) * anchor_step /img_size[1]

        y = np.expand_dims(y, axis=-1)
        x = np.expand_dims(x, axis=-1)        
        
        # 有两个默认的长宽比为1,但是大小不同的正方形先验框：计算两个长宽比为1的h、w。——根据先验框个数来确定的，多少个先验框就有多少个长宽。
        h = np.zeros((box_num,), np.float32) #类型统一，才可以相乘相除——————修改一
        w = np.zeros((box_num,), np.float32)
        # 第一个：h[0]、w[0]：先验框
        h[0] = anchor_size[0] /img_size[0]
        w[0] = anchor_size[0] /img_size[0]
        # 第二个：h[1]、w[1]
        h[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[0] # **0.5相当于sqrt开根号，
        w[1] = (anchor_size[0] * anchor_size[1]) ** 0.5 / img_size[1]

        # 剩下的长宽比按公式来计算。
        for i, j in enumerate(anchor_ratio):
            h[i + 2] = anchor_size[0] / img_size[0] / (j ** 0.5)
            w[i + 2] = anchor_size[0] / img_size[1] * (j ** 0.5)

        return y, x, h, w

    # 第二步：分点：解码
    # 解码网络返回box[x0, y0, x1, y1] -》先验框通过平移和缩放接近真实框。其中 prior_scaling 为平移、尺度因子
    def ssd_decode(self, location, box, prior_scaling):
        y_a, x_a, h_a, w_a = box
        # 平移
        cx = location[:, :, :, :, 0] * w_a * prior_scaling[0] + x_a  #location最后一个维度有4，表示4个值：x,y,w,h
        cy = location[:, :, :, :, 1] * h_a * prior_scaling[1] + y_a
        # 缩放
        w = w_a * tf.exp(location[:, :, :, :, 2] * prior_scaling[2])
        h = h_a * tf.exp(location[:, :, :, :, 3] * prior_scaling[3])
        # 计算框的左上和右下坐标：box[x0, y0, x1, y1]
        bboxes = tf.stack([cy - h / 2.0, cx - w / 2.0, cy + h / 2.0, cx + w / 2.0], axis=-1)
        print(bboxes)
        return bboxes
    
    # 第二步：分点：筛选
    # 先验框筛选_由于先验框太多了，需要进行减少——将总8732的6层，每层n_box
    def choose_anchor_boxes(self, predictions, anchor_box, n_box):
        anchor_box = tf.reshape(anchor_box, [n_box, 4])
        prediction = tf.reshape(predictions, [n_box, 21])
        prediction = prediction[:, 1:]
        classes = tf.argmax(prediction, axis=1) + 1 # 20+1
        scores = tf.reduce_max(prediction, axis=1)  # 当得分大于阈值，保留锚框，一个先验框对应一个类别

        filter_mask = scores > self.threshold
        # tf.boolean_mask(a,b)用来过滤概率值比较低的锚盒，b为过来条件【filter_mask = scores > self.threshold】b的制作规则是要用逻辑表达式（>或者<）生成布尔值
        classes = tf.boolean_mask(classes, filter_mask)
        scores = tf.boolean_mask(scores, filter_mask)
        anchor_box = tf.boolean_mask(anchor_box, filter_mask)
        
        return classes, scores, anchor_box

######### 训练部分开始
    # 第四步：先验框分数排序，取top_k个
    # 先验框分数排序，取前400
    def bboxes_sort(self,classes, scores, bboxes, top_k=400):
        idxes = np.argsort(-scores)
        classes = classes[idxes][:top_k]
        scores = scores[idxes][:top_k]
        bboxes = bboxes[idxes][:top_k]
        return classes, scores, bboxes
        # 计算IOU
    
    # 第五步：先验框NMS+IOU去重二
    # IOU
    def bboxes_iou(self,bboxes1, bboxes2):
        bboxes1 = np.transpose(bboxes1)
        bboxes2 = np.transpose(bboxes2)
        # 计算两个box的交集：交集左上角的点取两个box的max，交集右下角的点取两个box的min
        int_ymin = np.maximum(bboxes1[0], bboxes2[0])
        int_xmin = np.maximum(bboxes1[1], bboxes2[1])
        int_ymax = np.minimum(bboxes1[2], bboxes2[2])
        int_xmax = np.minimum(bboxes1[3], bboxes2[3])

        # 计算两个box交集的wh：如果两个box没有交集，那么wh为0(按照计算方式wh为负数，跟0比较取最大值)
        int_h = np.maximum(int_ymax - int_ymin, 0.)
        int_w = np.maximum(int_xmax - int_xmin, 0.)

        # 计算IOU
        int_vol = int_h * int_w  # 交集面积
        vol1 = (bboxes1[2] - bboxes1[0]) * (bboxes1[3] - bboxes1[1])  # bboxes1面积
        vol2 = (bboxes2[2] - bboxes2[0]) * (bboxes2[3] - bboxes2[1])  # bboxes2面积
        iou = int_vol / (vol1 + vol2 - int_vol)  # IOU=交集/并集
        return iou
    
    # 第五步：先验框NMS+IOU去重一
    # NMS
    def bboxes_nms(self,classes, scores, bboxes, nms_threshold=0.5):
        keep_bboxes = np.ones(scores.shape, dtype=np.bool)
        for i in range(scores.size - 1):
            if keep_bboxes[i]:
                overlap = self.bboxes_iou(bboxes[i], bboxes[(i + 1):])
                keep_overlap = np.logical_or(overlap < nms_threshold, classes[(i + 1):] != classes[i])
                keep_bboxes[(i + 1):] = np.logical_and(keep_bboxes[(i + 1):], keep_overlap)
        idxes = np.where(keep_bboxes)
        return classes[idxes], scores[idxes], bboxes[idxes]

######## 训练部分结束

#________________________________________________________________
    # 第三步：图像预处理
    # 图像预处理——均值处理
    def handle_img(self, img_path):
        means = np.array((123., 117., 104.))
        self.img = cv2.imread(img_path)
        # img = self.img
        # img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) - means
        # img = cv2.resize(img,self.img_size)
        # img = np.expand_dims(img,axis=0)
        img = np.expand_dims(cv2.resize(cv2.cvtColor(self.img, cv2.COLOR_BGR2RGB) - means,self.img_size),axis=0)
        return img
    
    def video_handle_img(self, image):
        means = np.array((123., 117., 104.))
        self.img = image
        # img = self.img
        # img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) - means
        # img = cv2.resize(img,self.img_size)
        # img = np.expand_dims(img,axis=0)
        img = np.expand_dims(cv2.resize(cv2.cvtColor(self.img, cv2.COLOR_BGR2RGB) - means,self.img_size),axis=0)
        return img

    # 第六步：画出结果
    # 画框
    def draw_rectangle(self,img, classes, scores, bboxes, colors, thickness=2):
        shape = img.shape
        for i in range(bboxes.shape[0]):
            bbox = bboxes[i]
            # color = colors[classes[i]]
            p1 = (int(bbox[0] * shape[0]), int(bbox[1] * shape[1]))
            p2 = (int(bbox[2] * shape[0]), int(bbox[3] * shape[1]))
            cv2.rectangle(img, p1[::-1], p2[::-1], colors[0], thickness)
            # Draw text...
            s = '%s/%.3f' % (self.classes[classes[i] - 1], scores[i])
            p1 = (p1[0] - 5, p1[1])
            cv2.putText(img, s, p1[::-1], cv2.FONT_HERSHEY_DUPLEX, 0.5, colors[1], 1)
        cv2.namedWindow("img", 0)
        cv2.resizeWindow("img", 640, 480)
        cv2.imshow('img', img)
        cv2.waitKey(0)
        cv2.destroyAllWindows()
    
    def video_draw_rectangle(self,img, classes, scores, bboxes, colors, thickness=2):
        shape = img.shape
        for i in range(bboxes.shape[0]):
            bbox = bboxes[i]
            # color = colors[classes[i]]
            p1 = (int(bbox[0] * shape[0]), int(bbox[1] * shape[1]))
            p2 = (int(bbox[2] * shape[0]), int(bbox[3] * shape[1]))
            cv2.rectangle(img, p1[::-1], p2[::-1], colors[0], thickness)
            # Draw text...
            s = '%s/%.3f' % (self.classes[classes[i] - 1], scores[i])
            p1 = (p1[0] - 5, p1[1])
            cv2.putText(img, s, p1[::-1], cv2.FONT_HERSHEY_DUPLEX, 0.5, colors[1], 1)
        cv2.namedWindow("img", 0)
        cv2.resizeWindow("img", 640, 480)
        cv2.imshow('img', img)

    # 第二步：综合：锚框+解码+筛选
    def predict(self, locations, predictions):
        layers_anchors = []
        classes_list = []
        scores_list = []
        bboxes_list = []
        # 锚框
        for i, s in enumerate(self.feature_map_size):
            anchor_bboxes = self.ssd_anchor_layer(self.img_size, s,
                                                  self.anchor_sizes[i],
                                                  self.anchor_ratios[i],
                                                  self.anchor_steps[i],
                                                  self.boxes_len[i])
            layers_anchors.append(anchor_bboxes)
        for i in range(len(predictions)):
            # 解码
            d_box = self.ssd_decode(locations[i], layers_anchors[i], self.prior_scaling)
            # 筛选
            cls, sco, box = self.choose_anchor_boxes(predictions[i], d_box, self.n_boxes[i])
            classes_list.append(cls)
            scores_list.append(sco)
            bboxes_list.append(box)
        # tf.concat拼接张量
        classes = tf.concat(classes_list, axis=0)
        scores = tf.concat(scores_list, axis=0)
        bboxes = tf.concat(bboxes_list, axis=0)
        return classes, scores, bboxes


import datetime
if __name__ == '__main__':
    # 类ssd实例化object：model —— 建立一个类
    model = ssd() # 实例类ssd的对象：model    
    locations, predictions, x = model.set_net()    # 
    classes, scores, bboxes = model.predict(locations, predictions)    # 
    sess = tf.Session()    # 
    sess.run(tf.global_variables_initializer())    # 
    saver = tf.train.Saver()
    saver.restore(sess, 'ssd_vgg_300_weights.ckpt')    # 
    VIDEO = True #
    if VIDEO == False:
        start_time = datetime.datetime.now()
        print(start_time)
        img = model.handle_img("image4.jpg")    # -------------------------------- -------------

        rclasses, rscores, rbboxes = sess.run([classes, scores, bboxes], feed_dict={x: img})

        rclasses, rscores, rbboxes = model.bboxes_sort(rclasses, rscores, rbboxes)

        rclasses, rscores, rbboxes = model.bboxes_nms(rclasses, rscores, rbboxes)
        print(datetime.datetime.now() - start_time)
        print(datetime.datetime.now())
        model.draw_rectangle(model.img,rclasses,rscores,rbboxes,[[0,0,255],[255,0,0]])
    else:
        cap = cv2.VideoCapture(0)       
        while True:
            if cap.isOpened():
                ret, frame = cap.read()
                start_time = datetime.datetime.now()
                img = model.video_handle_img(frame)
                rclasses, rscores, rbboxes = sess.run([classes, scores, bboxes], feed_dict={x: img})

                rclasses, rscores, rbboxes = model.bboxes_sort(rclasses, rscores, rbboxes)

                rclasses, rscores, rbboxes = model.bboxes_nms(rclasses, rscores, rbboxes)
                model.video_draw_rectangle(model.img,rclasses,rscores,rbboxes,[[0,0,255],[255,0,0]])
                print(datetime.datetime.now() - start_time)
                print(datetime.datetime.now())
                if cv2.waitKey(10)==27:
                    break
        cap.release()
        cv2.destroyAllWindows()

    
'''
import cv2
cap = cv2.VideoCapture(0)
while True:
    if cap.isOpened():
        ret,frame = cap.read()
        cv2.imshow('frame',frame)
        cv2.waitKey(1000)
cap.release()
cv2.destroyAllWindows()
'''

参考

视频：

https://www.bilibili.com/video/av43996494/?p=1

https://www.bilibili.com/video/av45571739

https://space.bilibili.com/5462468?spm_id_from=333.788.b_765f7570696e666f.2

github:

https://github.com/bbaibowen/computer-vision

DL500问

https://github.com/bbaibowen/DeepLearning-500-questions

你可能感兴趣的:(深度学习,#,深度学习,目标检测)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h