WYXHAHAHA123

物体检测 RetinaNet

老师说到torchcv物体检测代码中的数据增强非常丰富，其中涵盖了one stage detector的3个模型：SSD FPNSSD RetinaNet。之前和一位大神交流时，她提到，现在在经典的物体检测模型中性能最好的是：Faster R-CNN（缺点是对于小物体的检测效果不好），Retinanet和YOLO V3。现在希望来详细讲解torchcv中的RetinaNet模型

faster R-CNN对于面积较小的物体检测效果不好，这是因为最原始版本的faster R-CNN模型在RPN阶段，只在output stride=16的特征图上进行region proposal的选择和提取，特征图的分辨率较小，像素感受野大，故而适合于对面积较大的物体的检测，而对于分辨率较大的特征图则由于感受野尺寸较小从而能够提取到面积较小的物体的更多特征（参见FPN feature pyramid network特征金字塔网络），故而如果将特征金字塔网络得到的不同尺度的特征图上都进行对于region proposal的设定，则有希望通过在分辨率较大的特征图上的anchor学习以提高对于面积较小的物体的检测。

RetinaNet的主要特点在于其融合了SSD，FPN，Focal loss的结构，故而作为one-stage method，能够达到很高的性能。

下面重点讲解 https://github.com/kuangliu/torchcv 大神的RetinaNet代码。

对于focal loss的代码修改部分感谢https://github.com/yhenon/pytorch-retinanet

一、ListDataset 解析并读取训练图像和ground truth 标签

1.ListDataset(data.Dataset)加载数据

def __init__方法

对于训练数据集中的所有图片的所有ground truth包围框和对应的标签，都变成长tensor    box，labels   
但是根据self.boxes和self.labels这两个列表，依然能够根据索引值idx找到与当前图片所对应的所有ground truth 包围框及其对应的标签
self.boxes是长度为self.num_imgs的列表，即长度为当前训练数据集中的所有训练图片总数，列表中的每个元素是一个列表，
子列表box的长度是当前的训练图片中的ground truth包围框的总数，子列表中的每个元素是一个长度为4的float类型list，表示当前ground truth boxes的4个坐标
self.labels是长度为self.num_imgs的列表，列表中的每个元素是一个列表，子列表box的长度是当前的训练图片中的ground truth包围框的总数的longtensor
子列表中的每个元素是一个长度为1的整数，表示当前的GT框类别标号（类别从0开始标注）

如果训练数据集有两个子文件夹，那么还是保存在一个列表中，即boxes，labels

def __getitem__方法 return img, boxes, labels

2.数据增强

RetinaNet的数据增强包括：

（1）random flip horizontally 对于输入图像进行水平方向的翻转，以0.5的概率进行随机翻转，对图像进行翻转后，对相应的ground truth boxes和ground truth labels标签也应进行翻转

大多数情况下是指进行水平翻转而不进行竖直翻转，这是因为，数据集中所拍摄的图像大多都是经过水平校准的。

（2）resize 将图像的最长边resize到640，并保证输入图像的aspect ratios不变

（3）padding 将输入图像通过padding=0的方式，填充到640*640大小

二、RetinaNet ground truth boxes encode（the same with SSD,Faster R-CNN）

经过_getitem__方法返回的img, boxes, labels，

variable	shape	vaue
img	[batch_size,3,640,640]	RGB顺序，经过transform.ToTensor操作，输出0-1之间的数值
boxes	[#objs,4]	在对于当前输入图像进行数据增强之后的图像中，#objs表示ground truth boxes的绝对坐标信息，data type为float类型（因为经历了resize操作），[xmin,ymin,xmax,ymax]结构
labels	[#objs,]	经过数据增强变换之后的当前图像中共有多少个object以及对应的类别标签编号，这里的编号从1开始，并不涉及背景

编码方法在torchcv-master\torchcv\models\retinanet\box_coder.py中

def encode(self, boxes, labels):
    '''Encode target bounding boxes and class labels.
    传入这个函数中的形参表示训练数据集中的每一张训练图像所对应的ground truth boxes信息

    We obey the Faster RCNN box coder:
      tx = (x - anchor_x) / anchor_w
      ty = (y - anchor_y) / anchor_h
      tw = log(w / anchor_w)
      th = log(h / anchor_h)

    Args:
      boxes: (tensor) bounding boxes of (xmin,ymin,xmax,ymax), sized [#obj, 4].
            行数为当前训练图像中所包含的ground truth boxes个数，
            此时的gt boxes坐标数值已经转换成了在经过数据增强后的图像上的绝对坐标值
            （因为在数据增强的每个步骤中，输入图像发生变化时，对应的gt信息也随之变化）
      labels: (tensor) object class labels, sized [#obj,]. 列数为4
            表示ground truth boxes对应的类别标签信息

    Returns:
      loc_targets: (tensor) encoded bounding boxes, sized [#anchors,4].
      这里和Faster R-CNN模型中的anchor target layer一样，先对所有的anchor boxes进行位置编码
      即找到网络模型需要预测的 所有ground truth boxes所对应的位置偏移量ground truth 和类别标签
      由于输入图像的分辨率相同，故而所有的anchor boxes（没有经过网络预测的，仅仅根据特征图分辨率
      得到的，这些anchor boxes的生成和位置坐标与图像内容无关）对于所有的输入图像都相同，然后再根据所提供的
      对于当前图像的ground truth 信息，看当前的anchor boxes与哪一个gt boxes具有最大的overlap值，
      就将anchor boxes编码成哪个gt_boxes，这是因为我们需要的输出是对于不同的输入图像
      可能需要预测出不同个数的bounding boxes，但是CNN模型只能预测结构化的输出，所以就根据输入图像的分辨率
      设置一些regular boxes（或称之为anchor boxes），这些框的数量和位置坐标对于任意的输入图像（前提当然是
      空间分辨率相同，内容不同）都相同，然后根据每张图像的ground truth boxes信息对于每个anchor boxes进行编码
      让CNN网络模型预测这些编码后的位置偏移量，从而能够保证使得对于不同内容的输入图像，CNN能够产生固定shape
      的结构化输出
      但是要注意的是，在训练时计算损失函数时，并不需要对所有的anchor boxes计算损失函数，而是会根据anchor boxes
      （这里所指的经过网络模型预测之后的）与ground truth boxes之间的IOU，对于anchor boxes区分正负样本，然后按照一定的
      比例进行采样（对于SSD loss，正负样本比例为1：3），再计算分类损失和回归损失
      这是因为在所有的anchor boxes中，绝大多数都是负框，如果将所有的anchor boxes都拿来计算损失，则达不到期望的训练效果
      因为网络模型实际上区分出某些anchor boxes是负样本（background boxes）是很容易的，必须要挖掘出困难的负样本，
      才能有效地提高网络模型的训练准确度（on-line hard example mining）
      cls_targets: (tensor) encoded class labels, sized [#anchors,].
    '''
    anchor_boxes = self.anchor_boxes
    ious = box_iou(anchor_boxes, boxes)#shape   [#anchors,#objs]
    max_ious, max_ids = ious.max(1)
    '''
    对于所有的anchor boxes，将每个anchor boxes的ground truth boxes以及对应的ground truth labels
    设置成与之具有最大IOU数值的gt boxes
    也就是说，在训练之前对于anchor boxes进行预处理编码时，会对于每个anchor boxes分配gt boxes和gt labels
    所对应的就是看anchor boxes和图像中哪一个gt boxes之间的IOU最大     
    max_ids  range [0,#objs]    shape  [#anchors]
    '''
    boxes = boxes[max_ids]#shape [#anchors]挑选出与每个anchor boxes之间具有最大IOU的gt boxes作为anchor boxes的ground truth

    boxes = change_box_order(boxes, 'xyxy2xywh')
    anchor_boxes = change_box_order(anchor_boxes, 'xyxy2xywh')

    loc_xy = (boxes[:,:2]-anchor_boxes[:,:2]) / anchor_boxes[:,2:]
    loc_wh = torch.log(boxes[:,2:]/anchor_boxes[:,2:])
    loc_targets = torch.cat([loc_xy,loc_wh], 1)
    cls_targets = 1 + labels[max_ids]
    '''
   根据当前的anchor boxes和哪一个gt boxes之间的IOU值最大，对于anchor boxes的classification target和
   regression target进行encode
   得到RetinaNet的 loc_targets, cls_targets
   loc_targets    shape   [#anchors,4]
   cls_targets    shape   [#anchors]      
   '''

    # cls_targets[max_ious<0.5] = 0
    # ignore = (max_ious>0.4) & (max_ious<0.5)  # ignore ious between [0.4,0.5]
    # cls_targets[ignore] = -1                  # mark ignored to -1
    return loc_targets, cls_targets

三、RetinaNet model architecture（the same as FPNSSD）

FPN网络结构：

class FPN(nn.Module):
    def __init__(self, block, num_blocks):
        super(FPN, self).__init__()
        self.in_planes = 64

        '''
        FPN50=FPN(Bottleneck, [3,4,6,3])
        
        
       '''


        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        '''第一个卷积层：输入通道数3，输出通道数64'''

        # Bottom-up layers
        self.layer1 = self._make_layer(block,  64, num_blocks[0], stride=1)
        self.layer2 = self._make_layer(block, 128, num_blocks[1], stride=2)
        self.layer3 = self._make_layer(block, 256, num_blocks[2], stride=2)
        self.layer4 = self._make_layer(block, 512, num_blocks[3], stride=2)
        self.conv6 = nn.Conv2d(2048, 256, kernel_size=3, stride=2, padding=1)
        self.conv7 = nn.Conv2d( 256, 256, kernel_size=3, stride=2, padding=1)
        self.conv8 = nn.Conv2d( 256, 256, kernel_size=3, stride=2, padding=1)
        self.conv9 = nn.Conv2d( 256, 256, kernel_size=3, stride=2, padding=1)

        # Top-down layers
        self.toplayer = nn.Conv2d(2048, 256, kernel_size=1, stride=1, padding=0)

        # Lateral layers
        self.latlayer1 = nn.Conv2d(1024, 256, kernel_size=1, stride=1, padding=0)
        self.latlayer2 = nn.Conv2d( 512, 256, kernel_size=1, stride=1, padding=0)

        # Smooth layers
        self.smooth1 = nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1)
        self.smooth2 = nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1)



        #self.layer3 = self._make_layer(block,  256, 6, stride=2)
    def _make_layer(self, block, planes, num_blocks, stride):
        '''

        :param block: 所使用的卷积块   nn.Modules
        :param planes: 256   输入到当前卷积块的特征图通道数
        :param num_blocks:   对于block中块重复多少次
        :param stride:   block中的卷积步长
        :return:
        '''
        strides = [stride] + [1]*(num_blocks-1)
        '''
        构造一个长度为num_blocks的list类型，list中第0个元素是第一个block中的步长
        之后的步长都是1
           
        '''

        '''
        +    *    运算符对于列表list对象的特殊操作
        +表示将两个子列表合并成一个长列表，如果每个子列表中只有一个元素，则类似于list.append(element)操作
        *表示将当前列表中的元素乘以倍数（即将列表中的所有元素按照当前次序重复倍数次）
        [1,4,6,5]*2=[1, 4, 6, 5, 1, 4, 6, 5]        
        
        这一操作后，strides 为长度为num_blocks的列表,当前的_make_layer所产生的层数中有num_block个substructure
        每个substructure中包含3部分的卷积，其中num_blocks个stride参数表示当前的_make_layers中的num_blocks中每个
        substructure的第二个卷积（3*3  conv）操作的步长
        
        其中strides列表中元素构成如下：
        第0个元素表示当前_make_layer中的第0个substructure中的3*3卷积核的stride       stride
        后面的第1个元素到第num_blocks-1个元素都是1，表示第1个substructure到最后一个substructure的步长都是1
        
        
        strides  [2,1,1,1,1,1]
        '''
        layers = []
        for stride in strides:#512,
            layers.append(block(self.in_planes, planes, stride))
            self.in_planes = planes * block.expansion
            #block中的expansion表示经过block后，对于输入图特征图的通道数增大了多少倍
        return nn.Sequential(*layers)

    def _upsample_add(self, x, y):
        '''Upsample and add two feature maps.

        函数功能：对特征图x进行2倍上采样，再与特征图y进行element-wise addition
        特征图x与特征图y的通道数相同，只是由于x是更为深度的特征图，其分辨率是y的1/2，所以要先对于x进行2倍上采样，使特征图
        x和y的分辨率相同
        Args:
          x: (Variable) top feature map to be upsampled.
          y: (Variable) lateral feature map.

        Returns:
          (Variable) added feature map.

        Note in PyTorch, when input size is odd, the upsampled feature map
        with `F.upsample(..., scale_factor=2, mode='nearest')`
        maybe not equal to the lateral feature map size.

        e.g.
        original input size: [N,_,15,15] ->
        conv2d feature map size: [N,_,8,8] ->
        upsampled feature map size: [N,_,16,16]

        So we choose bilinear upsample which supports arbitrary output sizes.双线性上采样
        '''
        _,_,H,W = y.size()
        return F.upsample(x, size=(H,W), mode='bilinear', align_corners=False) + y

    def forward(self, x):
        # Bottom-up
        c1 = F.relu(self.bn1(self.conv1(x)))
        c1 = F.max_pool2d(c1, kernel_size=3, stride=2, padding=1)#1/4  channel=64
        c2 = self.layer1(c1)#1/4 ，channel=256
        c3 = self.layer2(c2)#1/8，channel=512
        c4 = self.layer3(c3)#1/16，channel=1024
        c5 = self.layer4(c4)#1/32，channel=2048
        p6 = self.conv6(c5) #1/64，channel=256
        p7 = self.conv7(F.relu(p6))#1/128，channel=256
        p8 = self.conv8(F.relu(p7))#1/256，channel=256
        p9 = self.conv9(F.relu(p8))#1/512，channel=256
        # Top-down
        p5 = self.toplayer(c5)#1/32，channel=256
        p4 = self._upsample_add(p5, self.latlayer1(c4))#self.latlayer1(c4)：1/16 channel=256    p4:1/16,channel=256
        p3 = self._upsample_add(p4, self.latlayer2(c3))#self.latlayer2(c3):1/8 channel=256      p3:1/8 channel=256
        p4 = self.smooth1(p4)#p4:1/16,channel=256
        p3 = self.smooth2(p3)#p3:1/8 channel=256

        # print('p3',p3.shape)

        return p3, p4, p5, p6, p7, p8, p9

        #输出7个不同尺度的特征图
        '''
        p3:1/8 channel=256     output stride=8
        p4:1/16 channel=256    output stride=16
        p5:1/32，channel=256    output stride=32
        p6:1/64，channel=256    output stride=64
        p7:1/128，channel=256   output stride=128
        p8:1/256，channel=256   output stride=256
        p9:1/512，channel=256   output stride=512
        特征图的分辨率一直减小，但是特征图通道数不变，都是256
        '''

RetinaNet网络结构：

class RetinaNet(nn.Module):
    num_anchors = 9

    def __init__(self, num_classes):
        super(RetinaNet, self).__init__()
        self.fpn = FPN50()
        self.num_classes = num_classes
        self.loc_head = self._make_head(self.num_anchors*4)
        self.cls_head = self._make_head(self.num_anchors*self.num_classes)

    def forward(self, x):
        cls_preds = []
        loc_preds = []
        fms = self.fpn(x)
        '''
        fms  list列表结构
        通过使用resnet101和FPN产生7个不同尺度的特征图
        p3:1/8 channel=256     output stride=8
        p4:1/16 channel=256    output stride=16
        p5:1/32，channel=256    output stride=32
        p6:1/64，channel=256    output stride=64
        p7:1/128，channel=256   output stride=128
        p8:1/256，channel=256   output stride=256
        p9:1/512，channel=256   output stride=512
        特征图的分辨率一直减小，但是特征图通道数不变，都是256 
        '''
        for fm in fms:
            loc_pred = self.loc_head(fm)
            cls_pred = self.cls_head(fm)
            loc_pred = loc_pred.permute(0,2,3,1).reshape(x.size(0),-1,4)                 # [N, 9*4,H,W] -> [N,H,W, 9*4] -> [N,H*W*9, 4]
            cls_pred = cls_pred.permute(0,2,3,1).reshape(x.size(0),-1,self.num_classes)  # [N,9*NC,H,W] -> [N,H,W,9*NC] -> [N,H*W*9,NC]
            loc_preds.append(loc_pred)
            cls_preds.append(cls_pred)
        '''
        对于Resnet FPN输出的每个尺度的特征图，分别使用相同结构（模型相同，模型参数数量相同，参数数值不同）
        的classifier和regression对特征图上的每个像素点的num_anchor个 anchor boxes进行类别预测和位置偏移量预测
        classification  经过3*3卷积操作之后，输出特征图空间分辨率不变，channel_num=num_anchor*num_classes
        regression      经过3*3卷积操作之后，输出特征图空间分辨率不变，channel_num=num_anchor*4
        这里与Faster R-CNN中的RPN使用的卷积方式不同，RPN中使用的是kernel_size=1的卷积核作为regression和classification
        loc_pred   shape [batch_size,36,H,W]->[batch_size,H,W,36]->[batch_size,(H*W*9),4]
        cls_pred   shape [batch_size,9*num_classes,H,W]->[batch_size,H,W,9*num_classes]->[batch_size,(H*W*9),num_classes]
        
        经过在dimension=1的维度上对于多个不同尺度的特征图进行concatenate后，此时loc_preds.shape[1]=cls_preds.shape[1]
        所表示的含义是：当前RetinaNet模型中总共包含多少个anchor boxes
        '''
        return torch.cat(loc_preds, 1), torch.cat(cls_preds, 1)
        '''
        返回值    loc_preds   torch.tensor  shape [batch_size,num_total_anchors,4]
                 cls_preds   torch.tensor  shape [batch_size,num_total_anchors,num_classes]  
       '''

可以看出，实际上，RetinaNet网络结构使用的实际上就是SSD+FPN，然后将输入图像变换成为640*640，故而RetinaNet的主要贡献在于提出了Focal Loss，而并不是像SSD中直接对正负样本进行1：3的采样，然后加上on-line hard example mining，它的重要改进之处是改变了损失函数的数学表达式。

要注意的是，对于每个不同尺度的特征图上的anchor 进行classification prediction和regress prediction，都只是使用了3*3的卷积操作，并没有使用Relu的激活函数操作，这是因为，对于regression offset prediction task而言，可能需要预测的offset数值比较大，超过了Relu函数的值域，而对于classification任务而言，只需要给出预测数值即可，调用计算cross entropy函数时会自动包含对于prediction map的softmax操作。

四、Focal Loss（RetinaNet的创新点）

def train(epoch):
    print('\nEpoch: %d' % epoch)
    net.train()
    train_loss = 0
    for batch_idx, (inputs, loc_targets, cls_targets) in enumerate(trainloader):
        inputs = inputs.to(device)
        loc_targets = loc_targets.to(device)
        cls_targets = cls_targets.to(device)

        optimizer.zero_grad()
        loc_preds, cls_preds = net(inputs)
        loss = criterion(loc_preds, loc_targets, cls_preds, cls_targets)
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        print('train_loss: %.3f | avg_loss: %.3f [%d/%d]'
              % (loss.item(), train_loss/(batch_idx+1), batch_idx+1, len(trainloader)))

在训练函数中这样的写法：即由网络模型输出结构化的预测值（这里的结构化，指的是具有固定且相同shape的输出，而并不会对于含有不同数量object的图像输出不同shape的prediction tensor，为了保证使得网络模型对于不同content的image的输出，能够产生结构化的输出，所引入的technique就是anchor，使用CNN网络来预测每个anchor的类别和regression offset，而对于相同分辨率的输入图像，特征图分辨率也相同，由于事先设定了anchor的aspect ratios和scales，则事先产生的anchor也相同，注意：anchor的生成函数实际上只需要输入：特征图分辨率（可以转换成输入原始的输入图像分辨率和每个尺度特征图的output stride）），anchor的宽高比和尺度值设定，就可以了。并不需要任何与CNN网络或者参数相关的信息。

训练函数中，通常是这样的写法：由网络模型的forward方法产生结构化的prediction tensor，然后将prediction和target送入loss函数中计算损失。

loss = criterion(loc_preds, loc_targets, cls_preds, cls_targets)

	shape	value
loc_preds	[batch_size,num_total_anchors,4]	batch_size中的每张图像，在每个不同尺度特征图上的每个像素点的9个anchor boxes，网络模型输出：预测出来的相对于anchor boxes的坐标偏移量
loc_targets	[batch_size,num_total_anchors,4]	经过与SSD和Faster R-CNN中编码方式相同的方式，根据图像中的gt_boxes坐标信息对于每个anchor boxes进行编码后的希望CNN网络模型预测出来的gt值，这里是对所有的anchor boxes都进行位置编码，它所对应gt_boxes就是看图像中的所有gt_boxes中哪个gt_boxes与anchor具有最大的IOU值，然后进行位置编码
cls_preds	[batch_size,num_total_anchors,num_classes]	网络模型所预测出来的对于所有的anchor boxes的类别，这里所预测的类别中也不包含背景类别
cls_targets	[batch_size,num_total_anchors,]	batch_size中的每张图像，对于每个anchor boxes的类别gt信息，这里标注方式是：对于每个anchor boxes，看它与中的所有gt_boxes中哪个gt_boxes与anchor具有最大的IOU值，就将anchor的类别设置成什么，这里是假设所有的anchor boxes所对应的ground truth classes类别都是前景类别，并不对anchor区分正框和负框，在计算loss时再做区分，与Faster R-CNN中的RPN操作相同

这里的操作方式很简洁，就是先假设认为所有的anchor boxes都是正样本，其所对应的ground truth regression和ground truth classes信息就来源于（从当前图像中所有的ground truth boxes中挑选出的）与anchor boxes具有最大IOU值的gt boxes，然后网络模型进行类别预测时并没有引入背景的预测，比如Pascal voc20个类别（COCO数据集80个类别），就直接使用3*3卷积操作输出通道数为20/80的prediction map。

好吧，觉得有些坑，发现这份代码里面对于正负样本的区分以及困难样本挖掘代码存在错误。打算换成另外的代码继续阅读。

分类损失：多个类别的cross entropy+focal loss

回归损失：对于所有是正样本的anchor boxes计算：网络模型预测出的anchor boxes偏移量offset与anchor boxes的ground truth 偏移量（根据anchor boxes与图像中的ground truth boxes之间的IOU对gt boxes进行编码）之间的smooth L1 loss

class FocalLoss(nn.Module):
    def __init__(self, num_classes):
        super(FocalLoss, self).__init__()
        self.num_classes = num_classes

    def _focal_loss(self, x, y):
        '''Focal loss.

        This is described in the original paper.
        With BCELoss, the background should not be counted in num_classes.

        x  包含batch size中每张图像所对应的所有anchor boxes，包含正样本和负样本，网络模型所预测出来的类别概率
          （此时x仅仅是经过3*3卷积操作输出，并没有经过任何激活函数的操作）
        y  包含batch size中对应anchor boxes的类别标签
        Args:
          x: (tensor) predictions, sized [N,D].
          y: (tensor) targets, sized [N,].

        Return:
          (tensor) focal loss.
        '''
        alpha = 0.25
        gamma = 2

        t = one_hot_embedding(y-1, self.num_classes)
        '''
        t torch.tensor   shape [#anchor_all_image,num_classses]
        对于batch size中的每张图像中的每个anchor boxes中的类别标号
        进行one hot编码
        因此每个anchor boxes对应的类别标签变成一个长度为num_classes的vector
        '''
        p = x.sigmoid()
        pt = torch.where(t>0, p, 1-p)    # pt = p if t > 0 else 1-p
        '''
        pt torch.tensor   shape [#anchor_all_image,num_classses]
        t所对应的是每个anchor boxes的gt classes类别编码
        在anchor boxes为某类别处，得到当前网络模型对于anchor boxes
        判断为那个ground truth 类别的概率值，其他的地方就转换成1-p_gt
        p_gt 表示anchor boxes被预测成为正确类别的概率值      
        '''
        w = (1-pt).pow(gamma)#shape [#anchor_all_image,num_classses]
        w = torch.where(t>0, alpha*w, (1-alpha)*w)
        loss = F.binary_cross_entropy_with_logits(x, t, w, size_average=False)
        '''
        也不太明白为什么这里就变成2个类别的cross entropy了
        明明ground truth boxes可以是多个类别的
        '''
        return loss

上述代码存在问题，修改后的focal loss.py如下：

'''
    这里对于class_prediction也就是网络模型对于各个类别的概率预测值，只包含对于当前的anchor boxes是前景类别
   （在EAD数据集中是7个前景类别）中每一个类别的分数，并不包含对于背景的分数，这种操作无论是在二分类还是多分类问题中
    都很常见，如果不加入背景类别则使用sigmoid作为激活函数（表示anchor boxes属于某个前景类别的分数），
    如果加入了背景类别则使用softmax作为激活函数，
    class_taregt也就是分类的ground truth经历过很多次的变换，首先在数据加载器dataloader中，由于训练数据集中每个图像样本的
    txt标签文件给出的bounding boxes的类别从0-6（共7个前景类别），
    在retinanet/box_coder.py中的encode编码函数中，对标签进行了如下的变换：
    首先将所有标签值加1    则前景类别  1  2 3 4 5 6 7
    将IOU_max(指的是对于当前anchor boxes，计算出了它与每个ground truth boxes之间的IOU，取出最大的IOU值作为当前anchor 
    boxes的IOU_max)大于0.5的作为正样本anchor，
    IOU_max介于0.4-0.5之间的样本看作是ignore，classification ground truth = -1
    将IOU_max小于0.4的记作为负样本，classification ground truth = 0
    这是训练过程中数据加载器输出的classification target（ground truth）
    在focal loss中的forward函数中，先取出所有classification target>-1的anchor boxes，也就是所有的正样本和负样本
    anchor boxes，将所有正样本和负样本的classification target和classification prediction送入focal_loss函数中
    计算分类损失
    
    classification prediction  shape [#anchor,num_classes]
    表示对于当前anchor所预测为每个num_classes的类别分数，这里的#anchor指的是所有参与到计算分类损失函数计算的
    正样本anchor和负样本anchor，经过了sigmoid激活函数，num_classes不包含背景类别
    classification target  希望得到 shape [#anchor,num_classes]
    其中可以看作是对于shape 为[#anchor,num_classes]的2-dimension 图上的每个像素点进行binary cross entropy的计算
    即表示当前的anchor boxes属于某个前景类别的概率分数值
    classification target 应该具有这样的形式：
    对于类别为第2个类的anchor boxes ，其classification target为
    [0,1,0,0,0,0,0]
    对于负样本
    [0,0,0,0,0,0,0]

    loss = F.binary_cross_entropy_with_logits(x, t, w, size_average=False)
    也可以用
    bce = -(targets * torch.log(classification) + (1.0 - targets) * torch.log(1.0 - classification))
    cls_loss = focal_weight * bce

这两行代码代替

    具体原因参见https://pytorch.org/docs/stable/nn.htmlhighlight=binary_cross_entropy_with_logits#torch.nn.BCEWithLogitsLoss
    因为torch.nn.functional.binary_cross_entropy_with_logits函数本身就要求输入的prediction tensor和target tensor具有
    相同的shape，然后target tensor每个点是0/1取值

    简单提下，focal loss的要点在于，在原来的二分类交叉熵基础上加上权重，如果是正样本（这里之所以能够使用二分类
    交叉熵就是因为它把对于每个anchor 的多分类问题变成了对于每个类别的二分类问题），则权重(1-p)，则p越接近1（表示分类正确），
    样本权重越小，如果是负样本，则权重p，如果p越接近于0（表示分类正确），则样本权重越小。反之越大，就能保证
    网络模型在训练过程中重点focus on hard examples，也就是分类不准确的样本（包含正样本和负样本）
    '''

def _focal_loss(self, x, y):
    '''Focal loss.

    This is described in the original paper.
    With BCELoss, the background should not be counted in num_classes.

    Args:
      x: (tensor) predictions, sized [N,D].
      y: (tensor) targets, sized [N,].

    Return:
      (tensor) focal loss.
    '''
    alpha = 0.25
    gamma = 2

    t = one_hot_embedding(y - 1, self.num_classes)
    # plus one during encode stage , here minus one to let classes   -1  0  1  2  3  4  5  6 for 7 different foreground classes and a background
    # t=-1  ingore
    # t>0
    # t=1

    # positive_indices=torch.ge(y,0)
    # num_positive_anchors=positive_indices.sum()
    
    negative_indices = torch.eq(y, 0)

    t[negative_indices, :] = 0

    # t = t[:, 1:]  # exclude background
    t = Variable(t).cuda()  # [N,20]

    # print(t.shape,x.shape,'xshape')

    p = x.sigmoid()
    pt = torch.where(t > 0, 1 - p, p)  # pt = p if t > 0 else 1-p
    w = pt.pow(gamma)
    w = torch.where(t > 0, alpha * w, (1 - alpha) * w)
    loss = F.binary_cross_entropy_with_logits(x, t, w, size_average=False)

    # loss=torch.where(torch.ne(y,-1.0),loss,torch.zeros(loss.shape).cuda())

    # loss=loss.sum()

    return loss


def forward(self, loc_preds, loc_targets, cls_preds, cls_targets):
    '''Compute loss between (loc_preds, loc_targets) and (cls_preds, cls_targets).

    Args:
      loc_preds: (tensor) predicted locations, sized [batch_size, #anchors, 4].
      loc_targets: (tensor) encoded target locations, sized [batch_size, #anchors, 4].
      cls_preds: (tensor) predicted class confidences, sized [batch_size, #anchors, #classes].
      cls_targets: (tensor) encoded target labels, sized [batch_size, #anchors].

    loss:
      (tensor) loss = SmoothL1Loss(loc_preds, loc_targets) + FocalLoss(cls_preds, cls_targets).
    '''

    # print('cls_targets',cls_targets.shape,loc_targets.shape)

    batch_size, num_boxes = cls_targets.size()
    pos = cls_targets > 0  # [N,#anchors]

    # print('pos',pos.shape,(pos.unsqueeze(2)).shape,loc_preds.shape)

    num_pos = pos.sum().item()

    # ===============================================================
    # loc_loss = SmoothL1Loss(pos_loc_preds, pos_loc_targets)
    # ===============================================================
    mask = pos.unsqueeze(2).expand_as(loc_preds)  # [N,#anchors,4]
    loc_loss = F.smooth_l1_loss(loc_preds[mask], loc_targets[mask], size_average=False)

    # ===============================================================
    # cls_loss = FocalLoss(cls_preds, cls_targets)
    # ===============================================================
    pos_neg = cls_targets > -1  # exclude ignored anchors
    mask = pos_neg.unsqueeze(2).expand_as(cls_preds)
    masked_cls_preds = cls_preds[mask].view(-1, self.num_classes)
    cls_loss = self._focal_loss(masked_cls_preds, cls_targets[pos_neg])

    # print('loc_loss: %.3f | cls_loss: %.3f' % (loc_loss.item()/num_pos, cls_loss.item()/num_pos), end=' | ')
    #

    num_pos = float(max(num_pos, 1))

    loss = (loc_loss + cls_loss) / num_pos

    return loss, loc_loss / num_pos, cls_loss / num_pos

你可能感兴趣的:(RetinaNet)

图像识别技术与应用课后总结（18）一元钱面包人工智能
·YOLO-V3RetinaNet系列，YOLO-V3在不同变体（如YOLOV3-320、YOLOV3-416等）下，在推理时间和精度上有不同的表现，展示了其在速度和准确性上的平衡。YOLO-V3的改进点网络结构：相比之前版本，YOLO-V3的网络结构进行了优化，使其更适合小目标检测。特征处理：对特征的处理更加细致，通过融入多持续特征图信息来预测不同规格的物体。先验框：先验框更加丰富，有3种sca
焦损函数（Focal Loss）与RetinaNet目标检测模型详解人工智能
焦损函数（FocalLoss）与RetinaNet目标检测模型详解阅读时长：19分钟发布时间：2025-02-14近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】目前，精度最高的目标检测器大多基于由R-CNN推广的两阶段方法，即对稀疏的候选目标位置集应用分类器。相比之下，在规则、密集的可
【计算机视觉面经四】基于深度学习的目标检测算法面试必备（RCNN~YOLOv5）旅途中的宽~ 计算机视觉面经总结计算机视觉深度学习目标检测 YOLO RCNN
文章目录一、前言二、两阶段目标检测算法2.1RCNN2.2Fast-RCNN2.3FasterR-CNN三、多阶段目标检测算法3.1CascadeR-CNN四、单阶段目标检测算法4.1编码方式4.1.1基于中心坐标4.1.1.1方案14.1.1.2方案24.1.1.3方案34.2YOLOv14.3SSD4.4YOLOv24.5RetinaNet4.6YOLOv34.7YOLOv44.8YOLOv5
M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid _忙中偷闲_
AAAI2019——https://github.com/qijiezhao/M2Det摘要特征金字塔广泛用于单阶段检测器，如DSSD，RetinaNet，RefineDet和双阶段检测器中，如MaskR-CNN，DeTNet，以解决多尺度目标检测问题。但是一般的金字塔结构是为图像分类任务而设计的，或者说，目标检测和图像识别任务是存在冲突的，浅层特征往往对于目标检测任务是重要的，深层特征往往是具有
RetinaNet：推动计算机视觉中的目标检测小北的北计算机视觉目标检测目标跟踪人工智能机器学习
介绍在计算机视觉领域，目标检测是一项基础任务，使机器能够识别和定位图像或视频帧中的对象。这种能力在各个领域都有深远的影响，从自动驾驶车辆和机器人技术到医疗保健和监控应用。RetinaNet，作为一种开创性的目标检测框架，已经成为解决在复杂场景中检测各种大小的对象时准确性和效率方面挑战的显著解决方案。目标检测：一个基础挑战目标检测涉及在图像中识别多个对象，同时提供有关它们的空间位置和类别标签的信息。
深度学习基本理论 3 ：之物体检测（Anchor base/NMS/softmax/损失函数/BCE/CE/zip 机器学习杨卓越计算机视觉人工智能语义分割 unet 图像分割
1、Anchorbase和Anchorfree1.1AnchorbaseAnchorbase，译为基于锚点的一个物体检测方法，也可以叫做基于一组预定义的框模型会预测每个锚点是否存在对象，并预测需要对锚点进行的调整以更好地适应该对象Anchorbase物体检测方法：FastR-CNN、SSD、YOLO、RetinaNet1.2AnchorFreeAnchorFree，无锚点方法则不依赖于预定义的锚点
目标检测-One Stage-RetinaNet 学海一叶目标检测目标检测人工智能计算机视觉算法深度学习
文章目录前言一、RetinaNet的网络结构和流程二、RetinaNet的创新点BalancedCrossEntropyFocalLoss总结前言根据前文目标检测-OneStage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升，但是OneStage目标检测模型仍存在一个很大的问题：前景(positive)和背景(negatives)类别的不平衡ps：假设我们有一个医学图像分类任务
目标检测网络之retinanet解读（一） wenyilab
[Paper:FocalLossforDenseObjectDetection][https://arxiv.org/abs/1708.02002]关于目标检测主要分为两大类别：onestage，twostageonestage代表：yolo系列，ssd（特点：检测精度低，但检测速度快）twostage代表：R-CNN系列,SPPNet（特点：检测精度高，但检测速度慢）在论文中作者去探讨了造成on
ATSS算法怎么全是重名论文笔记算法目标检测人工智能
文章目录前言ATSS算法的基本原理ATSS算法的主要设计步骤算法实现伪代码描述如下：pytorch分析主要优点：ATSS算法在一定程度上保证了TinyObject的阳性样本：原文前言作者比较了FCOS和RetinaNet，发现它们之间主要有三个区别：(1)每个位置平铺锚的数量。RetinaNet在每个位置平铺几个锚盒，而FCOS在每个位置平铺一个锚点。(2)正、负样本的定义。RetinaNet采用
RetinaNet：Focal Loss for Dense Object Detection（CVPR2018）怎么全是重名论文笔记目标检测人工智能计算机视觉
文章目录Abstract北京发现问题并给出方法成果IntroductionRelatedWorkRobust评估FocalLossBalancedCrossEntropyFocalLossDefinitionClassImbalanceandModelInitializationClassImbalanceandTwo-stageDetectorsRetinaNetDetectorExperime
第97步深度学习图像目标检测：RetinaNet建模 Jet4505 《100 Steps to Get ML》—JET学习笔记深度学习目标检测人工智能 RetinaNet
基于WIN10的64位系统演示一、写在前面本期开始，我们继续学习深度学习图像目标检测系列，RetinaNet模型。二、RetinaNet简介RetinaNet是由FacebookAIResearch(FAIR)的研究人员在2017年提出的一种目标检测模型。它是一种单阶段（one-stage）的目标检测方法，但通过引入一个名为FocalLoss的创新损失函数，RetinaNet解决了单阶段检测器常面
Focal-EIOU Loss：用于精确边界框回归的高效IOU损失 Amusi（CVer）计算机视觉论文速递目标检测人工智能深度学习机器学习计算机视觉自动驾驶
性能优于EIOU、FocalLoss、CIOU等，直接替换大多数检测网络中的原损失函数，均涨点明显！如PAA、ATSS和RetinaNet等。注：文末附【目标检测】交流群FocalandEfficientIOULossforAccurateBoundingBoxRegression作者单位：华南理工大学,地平线,中科院(谭铁牛等)论文：https://arxiv.org/abs/2101.0815
AI技术应用帮助残疾人过更独立的生活广问AI
广问AI新闻社讯目前美国拥有100万残障人士无法自主进食，他们别无选择只能在吃饭的时候依靠另一个人，这既尴尬又费时。现在华盛顿大学的研究人员已经制造了一个辅助灵巧机械手臂（ADA），一个拥有人工智能的机器人手臂，能够用叉子把食物从一个人的盘子里送到他们的嘴里，帮助残疾人过上更加独立的生活。在最近发表的论文中，UW团队描述了一对算法如何使ADA有能力为一个人提供食物。第一个算法retinanet是一
《Pytorch深度学习和图神经网络(卷 2)》学习笔记——第二章 404detective PyTorch—学习笔记深度学习 pytorch 神经网络
基于图片内容的处理任务主要包括目标检测、图片分割两大任务。目标检测：精度相对较高，主要是以检测框的方式，找出图片中目标物体所在坐标。模型运算量相对较小，相对较快。图片分割：精度相对较低，主要是以像素点的集合方式，找出图片中目标物体边缘的具体像素点。模型运算量相对较大，相对较慢。目标检测单阶段：也叫Region-free方法，直接从模型获得预测结果，有YOLO、SSD、RetinaNet等。两阶段：
使用GluonCV+OpenCV+YoloV3调用摄像头实现实时人脸检测 Maplect
1.写在前面最近组里有个项目与目标识别有关，去网上找了一下，发现目前SOTA的目标识别算法基本都是one-stage的，比如SSD、DSSD、RetinaNet、YOLO等，但是速度上YOLO是最快的。而且看了下YOLO主页，作者的风格我很喜欢。所以仔细研究了一下。本文的内容基于GluonCV、OpenCV和YoloV3，运行平台为Ubuntu16.04版本。ps：因为组里采购的服务器还没到，目前
13.初识Pytorch 复现VGG16及卷积神经网络图的可视化(Tensorboard) 游客26024 手把手学习Pytorch pytorch cnn 深度学习计算机视觉人工智能
搭建VGG16网络用黄框画出vgg中vgg16的部分，将此网络分为8个部分，s1(stage1)，s2(stage2)，s3(stage3)，s4，s5，s6，s7，s8，其中stage出自RetinaNet分析公式out_size=1+(in_size+2*padding_size-kernel_size)/stride(1)1.input_1224*224*3->112*112*64其后有2层
【自动驾驶论文阅读笔记——精读RetinaTrack】书玮嘎自动驾驶人工智能机器学习
[阅读心得]自动驾驶经典论文——RetinaTrack写在前面1.Abstract2.Introduction3.RetinaTrack3.1Overview3.2RetinaNet3.3Modifying:Per-Anchor+Embbeding-Branch3.4TrainingLoss+LabelAssign3.5Inference4.Experiment4.1Architectual4.2
使用Retinanet训练自己的数据集 babyzbb636 深度学习 Retinanet linux
目录目录1构建Retinanet环境2生成CSV文件3训练4.转化模型5.测试6.评测loss可视化ap，precision-recall数据集什么的看我之前博客，资源里也有标记好的数据集，这里主要写一下我配置使用训练过程。1构建Retinanet环境1.代码库下载地址https://github.com/fizyr/keras-retinanet，或git命令：gitclonehttps://g
基于TensorFlow Object Detection API实现RetinaNet目标检测网络（附源码） liuqiker 机器学习/深度学习 tensorflow 目标检测深度学习人工智能神经网络
文章目录一、RetinaNet简介1.Backbone网络2.FPN网络二、RetinaNet实现1.tf.train.CheckPoint简介2.RetinaNet的TensorFlow源码一、RetinaNet简介 RetinaNet是作者Tsung-YiLin和KaimingHe于2018年发表的论文FocalLossforDenseObjectDetection中提出的网络。Retina
目标检测算法之RetinaNet（引入Focal Loss）君临天下夜未央
前言今天来介绍一下目标检测算法中RetinaNet，这篇论文是ICCV2017的作品，KaimingHe也是作者之一，同时这篇论文提出的FocalLoss也对工程上训练更好的目标检测模型做出了贡献，所以我们尝试理解一下这篇论文的思想。论文地址为：https://arxiv.org/pdf/1708.02002.pdf研究背景前面我们介绍了一些One-Stage目标检测算法和Two-Stage目标检
OpenMMLab MMYOLO目标检测算法原理（二） qq_41627642 MMYOLO 目标检测算法人工智能
算法原理及YOLOV5实现YOLOv5是一种面向实时工业应用的开源目标检测算法，受到了广泛的关注。YOLOv5之所以能火爆，并不仅仅是因为其优异的性能。它更多的是关于其库的整体实用性和稳健性。简而言之，YOLOv5的主要特点是：（1）友好完善的部署支持（2）训练速度快：300epoch情况下的训练时间与大多数12epoch下的一阶段和两阶段算法相似，例如RetinaNet、ATSS和FasterR
[SRN] Selective Refinement Network for High Performance Face Detection 凉拌东坡肉
SRN网络结构图SRN网络结构和RefineDet有比较类似的思路，基于RetinaNet,并引入focalloss,在anchorbased人脸检测器中引入了two-step的cls+reg任务，有效地降低了人脸检测中的falsepositives,提开了人脸定位的精度，且有利于小尺度人脸的检出。STC（SelectiveTwoStepClassification)通过C2,C3,C4(1st-
YOLOv3 best_iou问题 AI视觉网奇 pytorch知识宝典 yolo
YOLOv3解读转自：https://xmfbit.github.io/2018/04/01/paper-yolov3/YOLO的作者又放出了V3版本，在之前的版本上做出了一些改进，达到了更好的性能。这篇博客介绍这篇论文：YOLOv3:AnIncrementalImprovement。下面这张图是YOLOV3与RetinaNet的比较。可以使用搜索功能，在本博客内搜索YOLO前作的论文阅读和代码。
pytorch 绘制多个算法loss_Pytorch - FocalLoss的几种实现窦福成 pytorch 绘制多个算法loss
FocalLoss用于one-stage目标检测算法(Retinanet)，提升检测效果.也可以被用于分类任务中，解决数据不平衡问题.1.Github-DeepLabV3Plus-Pytorchimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFclassFocalLoss(nn.Module):def__init__(self,alp
YOLO(八) YOLOF blackmanba_084b
paper:YouOnlyLookOne-levelFeaturecode:megvii-model/YOLOF一、原理介绍结构图这篇文章主要是在提取特征以及对于loss平衡做了改进。提取特征网络主要是针对RetinaNet的FPN的结构进行改进，如下是所示作者通过四个实验分别是MiMo,SiMo,MiSo以及SiSo最终发现SiMo和MiSo的表现能力相当。这里总结出一个结论多尺度特征融合(C3
BCE loss和 CE理解 huluhuluwa123 #Pytorch 深度学习 BCE CE Loss
1.BCEloss：BinaryCrossEntropyLossBCElosspytorch官网链接1.1解释pytorch中调用如下。设置weight,使得不同类别的损失权值不同。其中x是预测值，取值范围(0,1),target是标签，取值为0或1.在Retinanet的分类部分最后一层的激活函数用的是sigmoid，损失函数是BCEloss.BCEloss可以对单个类别进行求损失，配合sigm
图像检测 - RetinaNet: Focal Loss for Dense Object Detection (arXiv 2018) 77wpa #图像检测目标检测人工智能计算机视觉
图像检测-RetinaNet:FocalLossforDenseObjectDetection-密集目标检测中的焦点损失（arXiv2018）摘要1.引言2.相关工作References声明：此翻译仅为个人学习记录文章信息标题：RetinaNet:FocalLossforDenseObjectDetection(arXiv2018)作者：Tsung-YiLin,PriyaGoyal,RossGir
Windows下搭建TensorFlow-gpu2.3环境，训练测试keras-retinanet 一路前行，幸运相伴开发环境与工具 tensorflow 深度学习 cuda cudnn
Windows下搭建TensorFlow-gpu2.3环境，训练测试keras-retinanet1.安装GPU环境——cuda、cudnn1.1安装显卡驱动1.2安装cuda1.3安装cudnn1.4验证是否安装成功2.安装Python环境2.1安装conda虚拟环境2.2安装TensorFlow及keras2.3安装其他依赖项2.4进行keras-retinanet所需的编译3.训练测试ker
SSD data_augmentation对自己数据集做增强 miahuang
前言:目前我在做车辆目标检测任务,虽然对实时性的要求不高,但是对检测的准确性有比较高的要求.使用yolo,retinanet神经网络进行检测的时候发现,喂数据的多少,很影响检测的结果.不论是做什么任务,数据一直都是一个比较头痛的问题.ssd是一个优秀的网络模型.在数据增强方法做了很多处理,例如裁剪,明亮强度等.我在github上面,找到了ssd源码,https://github.com/amdeg
目标检测—7 RetinaNet 山居秋暝LS 计算机视觉
RetinaNet1主干网络2数据处理3训练4预测5模型评价1主干网络主干网络：RestNet50+FPN+(cls,reg)RestNet50:对Inputs用ConvBlock和IdentityBlock进行5次下采样，输出3个特征层FPN:对上一步输入的特征层上采样得到5个特征层。cls,reg:根据上一步的结果分别进行回归和分类。2数据处理把数据分为训练集、验证集、测试集1.0设置xml地
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置