【Faster R-CNN论文精度系列】从Faster R-CNN源码中，我们“学习”到了什么？

【Faster R-CNN论文精度系列】

（如下为建议阅读顺序）
1【Faster R-CNN论文精度系列】从Faster R-CNN源码中，我们“学习”到了什么？
2【Faster R-CNN论文精度系列】代码解读并深入理解Region Proposal Network
3【Faster R-CNN论文精度系列】代码解读并深入理解Anchor和Anchor Box
4【Faster R-CNN论文精度系列】原文精析
5 Faster R-CNN: Down the rabbit hole of modern object detection

1 Github代码

从Github上搜索faster rcnn代码，可以看到很多版本，star数最多的版本都是论文的作者，对源码框架文件的分析很有必要的，可以弄清楚很多我们无法从论文中读懂的点。

RBG大神写的Python版本code：
https://github.com/rbgirshick/py-faster-rcnn
ShaoqingRen大神写的Matlab版本code：
https://github.com/ShaoqingRen/faster_rcnn

2 框架代码解读

在最初的学习之中，我总是强调对论文的解读，对原文中原理的理解，但是我在今天的学习中我发现，论文与代码同步进行是一个很好的选择，具体的代码可以让你很好的理解这篇文章做了些什么东西，可以加深你对论文的理解，这个学习方法很值得推荐。

2.1 train.prototxt文件解读

找到在目录py-faster-rcnn/models/pascal_voc/VGG16/faster_rcnn_end2end下有一个train.prototxt文件，这是整个论文的框架理解，本文选取经典模型进行解读，ZF的框架可以在源码中找到必看！

阅读代码前必须要理解的参数：

lr_mult: 学习率的系数，最终的学习率是这个数乘以solver.prototxt配置文件中的base_lr。如果有两个lr_mult, 则第一个表示权值的学习率，第二个表示偏置项的学习率。一般偏置项的学习率是权值学习率的两倍。

num_output: 过滤器（filfter)的个数

weight_filler: 权值初始化。默认为“constant"，值全为0，很多时候我们用"xavier"算法来进行初始化，也可以设置为”gaussian"

bias_filler: 偏置项的初始化。一般设置为"constant",值全为0

bias_term: 是否开启偏置项，默认为true, 开启

Relu激活函数解读

对于修正线性单元(Rectified linear unit，ReLU）优点如下：
①单侧抑制 ②相对宽阔的兴奋边界 ③稀疏激活性

资料参考
https://blog.csdn.net/cherrylvlei/article/details/53149381
https://www.cnblogs.com/qw12/p/6294430.html

2.2 Code分析

name: "VGG_ILSVRC_16_layers"
layer {
  name: 'input-data'
  type: 'Python'
  top: 'data'
  top: 'im_info'
  top: 'gt_boxes'	# top指输入的数据，包括data、image & gt
  python_param
  {
    module: 'roi_data_layer.layer'
    layer: 'RoIDataLayer'
    param_str: "'num_classes': 21"	# 21个分类
  }
}
# conv1_1
layer {
  name: "conv1_1"
  type: "Convolution"
  bottom: "data"    # bottom是输入
  top: "conv1_1"    # top是输出
  param {
    lr_mult: 0
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  convolution_param {
    num_output: 64
    pad: 1
    kernel_size: 3
  }
}
# relu1_1
layer {
  name: "relu1_1"
  type: "ReLU"
  bottom: "conv1_1"
  top: "conv1_1"
}
# conv1_2
layer {
  name: "conv1_2"
  type: "Convolution"
  bottom: "conv1_1"
  top: "conv1_2"
  param {
    lr_mult: 0
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  convolution_param {
    num_output: 64
    pad: 1
    kernel_size: 3
  }
}
# relu1_2
layer {
  name: "relu1_2"
  type: "ReLU"
  bottom: "conv1_2"
  top: "conv1_2"
}
# pool1
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1_2"
  top: "pool1"
  pooling_param {
    pool: MAX	# max pooling
    kernel_size: 2
    stride: 2
  }
}
# conv2_1
layer {
  name: "conv2_1"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2_1"
  param {
    lr_mult: 0
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  convolution_param {
    num_output: 128
    pad: 1
    kernel_size: 3
  }
}
# relu2_1
layer {
  name: "relu2_1"
  type: "ReLU"
  bottom: "conv2_1"
  top: "conv2_1"
}
# conv2_2
layer {
  name: "conv2_2"
  type: "Convolution"
  bottom: "conv2_1"
  top: "conv2_2"
  param {
    lr_mult: 0
    decay_mult: 0
  }
  param {
    lr_mult: 0
    decay_mult: 0
  }
  convolution_param {
    num_output: 128
    pad: 1
    kernel_size: 3
  }
}
# relu2_2
layer {
  name: "relu2_2"
  type: "ReLU"
  bottom: "conv2_2"
  top: "conv2_2"
}
# pool2
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2_2"
  top: "pool2"
  pooling_param {
    pool: MAX   # max pooling
    kernel_size: 2
    stride: 2
  }
}
# conv3_1
layer {
  name: "conv3_1"
  type: "Convolution"
  bottom: "pool2"
  top: "conv3_1"
  param {
    lr_mult: 1  # weight项的学习率（从这里开始了学习率的调整更新）
  }
  param {
    lr_mult: 2  # bias项的学习率，一般是weight的两倍
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
  }
}
# relu3_1
layer {
  name: "relu3_1"
  type: "ReLU"
  bottom: "conv3_1"
  top: "conv3_1"
}
# conv3_2
layer {
  name: "conv3_2"
  type: "Convolution"
  bottom: "conv3_1"
  top: "conv3_2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
  }
}
# relu3_2
layer {
  name: "relu3_2"
  type: "ReLU"
  bottom: "conv3_2"
  top: "conv3_2"
}
# conv3_3
layer {
  name: "conv3_3"
  type: "Convolution"
  bottom: "conv3_2"
  top: "conv3_3"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu3_3"
  type: "ReLU"
  bottom: "conv3_3"
  top: "conv3_3"
}
layer {
  name: "pool3"
  type: "Pooling"
  bottom: "conv3_3"
  top: "pool3"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
# conv4_1
layer {
  name: "conv4_1"
  type: "Convolution"
  bottom: "pool3"
  top: "conv4_1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
# relu4_1
layer {
  name: "relu4_1"
  type: "ReLU"
  bottom: "conv4_1"
  top: "conv4_1"
}
# conv4_2
layer {
  name: "conv4_2"
  type: "Convolution"
  bottom: "conv4_1"
  top: "conv4_2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
# relu4_2
layer {
  name: "relu4_2"
  type: "ReLU"
  bottom: "conv4_2"
  top: "conv4_2"
}
# conv4_3
layer {
  name: "conv4_3"
  type: "Convolution"
  bottom: "conv4_2"
  top: "conv4_3"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
# relu4_3
layer {
  name: "relu4_3"
  type: "ReLU"
  bottom: "conv4_3"
  top: "conv4_3"
}
# pool4
layer {
  name: "pool4"
  type: "Pooling"
  bottom: "conv4_3"
  top: "pool4"
  pooling_param {
    pool: MAX   # max pooling
    kernel_size: 2
    stride: 2
  }
}
# conv5_1
layer {
  name: "conv5_1"
  type: "Convolution"
  bottom: "pool4"
  top: "conv5_1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
# relu5_1
layer {
  name: "relu5_1"
  type: "ReLU"
  bottom: "conv5_1"
  top: "conv5_1"
}
# conv5_2
layer {
  name: "conv5_2"
  type: "Convolution"
  bottom: "conv5_1"
  top: "conv5_2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
# relu5_2
layer {
  name: "relu5_2"
  type: "ReLU"
  bottom: "conv5_2"
  top: "conv5_2"
}
# conv5_3
layer {
  name: "conv5_3"
  type: "Convolution"
  bottom: "conv5_2"
  top: "conv5_3"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
# relu5_3
layer {
  name: "relu5_3"
  type: "ReLU"
  bottom: "conv5_3"
  top: "conv5_3"
}

# ============ RPN ==============

# rpn_conv/3x3
# 对卷积网络传来的feature map做RPN的第一步操作：卷积
layer {
  name: "rpn_conv/3x3"
  type: "Convolution"
  bottom: "conv5_3" # 接在conv5_3后接了一个RPN-layer
  top: "rpn/output"
  param { lr_mult: 1.0 }
  param { lr_mult: 2.0 }
  convolution_param {
    num_output: 512
    kernel_size: 3 pad: 1 stride: 1 # conv参数设定
    weight_filler { type: "gaussian" std: 0.01 }
    bias_filler { type: "constant" value: 0 }
  }
}
# 接relu激活函数，增加其非线性
layer {
  name: "rpn_relu/3x3"
  type: "ReLU"
  bottom: "rpn/output"
  top: "rpn/output"
}
# # 开始cls和reg
# rpn_cls_score
layer {
  name: "rpn_cls_score"
  type: "Convolution"
  bottom: "rpn/output"
  top: "rpn_cls_score"
  param { lr_mult: 1.0 }
  param { lr_mult: 2.0 }
  convolution_param {
    num_output: 18   # 2(label+prob) * 9(anchors)
    kernel_size: 1 pad: 0 stride: 1
    weight_filler { type: "gaussian" std: 0.01 }
    bias_filler { type: "constant" value: 0 }
  }
}
# rpn_bbox_pred
layer {
  name: "rpn_bbox_pred"
  type: "Convolution"
  bottom: "rpn/output"
  top: "rpn_bbox_pred"
  param { lr_mult: 1.0 }
  param { lr_mult: 2.0 }
  convolution_param {
    num_output: 36   # 4 * 9(anchors)
                     # 含有36个输出，每个anchor有4个坐标值
    kernel_size: 1 pad: 0 stride: 1
    weight_filler { type: "gaussian" std: 0.01 }
    bias_filler { type: "constant" value: 0 }
  }
}

layer {
   bottom: "rpn_cls_score"
   top: "rpn_cls_score_reshape"
   name: "rpn_cls_score_reshape"
   type: "Reshape"
   reshape_param { shape { dim: 0 dim: 2 dim: -1 dim: 0 } }
}

# rpn-data
# 这一块进行了很多的操作，在送入回归之前，对很多框进行筛选
# 比如在边缘上出界的框怎么处理，多个框重叠怎么处理（NMS）
layer {
  name: 'rpn-data'
  type: 'Python'
  # 输入
  bottom: 'rpn_cls_score'   # 分类得分
  bottom: 'gt_boxes'
  bottom: 'im_info'
  bottom: 'data'    # 输入data
  # 输出
  top: 'rpn_labels' # 利用对9个anchor给一个label（>0.7为前景）（<0.3为背景）
  top: 'rpn_bbox_targets'   # 算出原文中3.1.2节中给出的8个参数
  top: 'rpn_bbox_inside_weights'
  top: 'rpn_bbox_outside_weights'   # 俩weight为了计算loss而设置的
  python_param {
    module: 'rpn.anchor_target_layer'
    layer: 'AnchorTargetLayer'
    param_str: "'feat_stride': 16"
  }
}
# rpn_loss_cls
# 分类的loss
layer {
  name: "rpn_loss_cls"
  type: "SoftmaxWithLoss"
  bottom: "rpn_cls_score_reshape"
  bottom: "rpn_labels"
  propagate_down: 1
  propagate_down: 0
  top: "rpn_cls_loss"
  loss_weight: 1
  loss_param {
    ignore_label: -1
    normalize: true
  }
}
# rpn_loss_bbox
# b.box的回归的loss
layer {
  name: "rpn_loss_bbox"
  type: "SmoothL1Loss"
  bottom: "rpn_bbox_pred"
  bottom: "rpn_bbox_targets"
  bottom: 'rpn_bbox_inside_weights'
  bottom: 'rpn_bbox_outside_weights'
  top: "rpn_loss_bbox"
  loss_weight: 1
  smooth_l1_loss_param { sigma: 3.0 }
}

#============ RoI Proposal ===============

layer {
  name: "rpn_cls_prob"
  type: "Softmax"
  bottom: "rpn_cls_score_reshape"
  top: "rpn_cls_prob"
}

layer {
  name: 'rpn_cls_prob_reshape'
  type: 'Reshape'
  bottom: 'rpn_cls_prob'
  top: 'rpn_cls_prob_reshape'
  reshape_param { shape { dim: 0 dim: 18 dim: -1 dim: 0 } }
}

layer {
  name: 'proposal'
  type: 'Python'
  bottom: 'rpn_cls_prob_reshape'
  bottom: 'rpn_bbox_pred'
  bottom: 'im_info' # 输入了三个东西reshape后的分类概率、预测的框和im信息
  top: 'rpn_rois'   # 产生一些region，
#  top: 'rpn_scores'
  python_param {
    module: 'rpn.proposal_layer'
    layer: 'ProposalLayer'
    param_str: "'feat_stride': 16"
  }
}

#layer {
#  name: 'debug-data'
#  type: 'Python'
#  bottom: 'data'
#  bottom: 'rpn_rois'
#  bottom: 'rpn_scores'
#  python_param {
#    module: 'rpn.debug_layer'
#    layer: 'RPNDebugLayer'
#  }
#}

layer {
  name: 'roi-data'
  type: 'Python'
  bottom: 'rpn_rois'
  bottom: 'gt_boxes'
  top: 'rois'
  top: 'labels'
  top: 'bbox_targets'
  top: 'bbox_inside_weights'
  top: 'bbox_outside_weights'
  python_param {
    module: 'rpn.proposal_target_layer'
    layer: 'ProposalTargetLayer'
    param_str: "'num_classes': 21"
  }
}

#========= RCNN ============
# 分类任务层

# 对大小不同的框进行roi-pooling
layer {
  name: "roi_pool5"
  type: "ROIPooling"
  bottom: "conv5_3"
  bottom: "rois"
  top: "pool5"
    
  # 对不同的框pooling到固定的尺度大小（参数设定），便于做最后的分类
  roi_pooling_param {
    pooled_w: 7
    pooled_h: 7
    spatial_scale: 0.0625 # 1/16
  }
}
# fc6
# pooling后当然是接上一些全连接层
layer {
  name: "fc6"
  type: "InnerProduct"
  bottom: "pool5"
  top: "fc6"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 4096
  }
}
layer {
  name: "relu6"
  type: "ReLU"
  bottom: "fc6"
  top: "fc6"
}
# 做了一个dropout
layer {
  name: "drop6"
  type: "Dropout"
  bottom: "fc6"
  top: "fc6"
  dropout_param {
    dropout_ratio: 0.5
  }
}
layer {
  name: "fc7"
  type: "InnerProduct"
  bottom: "fc6"
  top: "fc7"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 4096
  }
}
layer {
  name: "relu7"
  type: "ReLU"
  bottom: "fc7"
  top: "fc7"
}
layer {
  name: "drop7"
  type: "Dropout"
  bottom: "fc7"
  top: "fc7"
  dropout_param {
    dropout_ratio: 0.5
  }
}
layer {
  name: "cls_score"
  type: "InnerProduct"
  bottom: "fc7"
  top: "cls_score"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 21
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "bbox_pred"
  type: "InnerProduct"
  bottom: "fc7"
  top: "bbox_pred"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 84
    weight_filler {
      type: "gaussian"
      std: 0.001
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}
layer {
  name: "loss_cls"
  type: "SoftmaxWithLoss"
  bottom: "cls_score"
  bottom: "labels"
  propagate_down: 1
  propagate_down: 0
  top: "loss_cls"
  loss_weight: 1
}
layer {
  name: "loss_bbox"
  type: "SmoothL1Loss"
  bottom: "bbox_pred"
  bottom: "bbox_targets"
  bottom: "bbox_inside_weights"
  bottom: "bbox_outside_weights"
  top: "loss_bbox"
  loss_weight: 1
}

下面给出vgg16网络结构图（使用PPT绘制，不会画的可以留言给我）

2.3 重要理解——什么是“学习”？

问题提出：为什么在源代码中设置18和36？逻辑关系是如何描述？机器如何学习到anchor是什么？如下代码所示：

# 在rpn_cls_score中给出了：
num_output: 18   # 2(bg/fg) * 9(anchors)
# 在rpn_bbox_pred中给出了
num_output: 36   # 4 * 9(anchors)

但是机器在此时以及此时之前，是不知道anchor是啥，更不会知道anchor背后对应的18和36个数字代表的是啥，对于此时的机器来说，只知道18+36个参数。

学习的本质
经过以下的代码rpn_loss_cls的分类和rpn_loss_bbox的回归

layer 
{
  name: "rpn_loss_cls"
  type: "SoftmaxWithLoss"
  bottom: "rpn_cls_score_reshape"
  bottom: "rpn_labels"
  propagate_down: 1
  propagate_down: 0
  top: "rpn_cls_loss"
  loss_weight: 1
  loss_param {
    ignore_label: -1
    normalize: true
  }
}
layer 
{
  name: "rpn_loss_bbox"
  type: "SmoothL1Loss"	# 引入Smooth L1 Loss函数
  bottom: "rpn_bbox_pred"
  bottom: "rpn_bbox_targets"
  bottom: 'rpn_bbox_inside_weights'
  bottom: 'rpn_bbox_outside_weights'
  top: "rpn_loss_bbox"
  loss_weight: 1
  smooth_l1_loss_param { sigma: 3.0 }
}

即经过了Loss Function后，机器对其参数值（18个或者36个）计算与label之间的“距离”（即：loss，同理越小越好），这个“距离”越小越好。在这个不断迭代、学习的过程之中，学到了当这18或36个参数带入运算时，能够达到最小的Loss，即可以“学习”到了其内涵。

所以在实际的网络中，这些框不是被截取出来的一块区域，而是在计算loss之前，被送进入的data，而是在loss的过程中学习到的，这是我们的anchor，所以这个anchor以及这些框不是实际存在的，是人为的想象出来而设定的

现在整体来理一下上文中的逻辑关系，机器在Loss步骤之前是不知道anchor是什么的，也不知道为什么会有18/36个参数在面前，当时给了一个Loss后，会进行迭代修正，直到拟合到了True Answer上或者接近于它的时候，会达到一个最小的Loss值，在这个不断迭代（机器学习的本质：迭代=学习）的过程中，机器学习到了一个东西：只有这样调整参数才能使我们预先设定的Loss下降到最小。

也可以结合梯度下降算法来看，目标函数（Loss Function）通过GD算法（SGD、BSGD）下降到一个函数的最优解（可能是局部最优，也可能是全局最优），在机器中这个“下降”的过程就是对应人脑中“学习”的过程，这就是机器“学习”的本质。

smooth_l1_loss是啥?https://blog.csdn.net/wfei101/article/details/77778462

3 原文扼要分析

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun

3.1 为什么选则Faster R-CNN

分析论文，不能拿到手从头开始看起，要有所整体认知，鄙人认为，应给出几个看论文的理由，才会有动力让你看到最后，这也就是我的3.1节不选择分析摘要的原因。

其次对于看论文，得有精度得有泛读，泛读适合读摘要读图片读表格，弄清他的思路；而对于大牛实验室的著作，我们需要从源码入手，解读其内涵，分析其思路，模仿其文体。选择Faster R-CNN，我给出了以下几个理由：

论文文体优秀，结构分明，适合精度语句并加以模仿
开源（作者给出了.m & .py）
公开数据（可获取且可信度高）
算法代码适合精读

3.2 摘要

摘要给出了论文的核心凝练内容（黄色部分标出），对于2015年的这篇论文，着实是state-of-the-art的相当高的水准了，文章创造性的提出了一个RPN网络，并在多个数据集上去的了优秀的成绩，且开源。

3.2.1 什么是目标检测？

很简单，目标检测 = 目标 + 检测。对于图像分类、物体检测、物体分割、实例分割、语义分割的区别，在笔者的这篇文章中有所提及，推荐阅读，入门必备：
https://blog.csdn.net/Gerwels_JI/article/details/82990189

3.2.2 什么是real-time object detection

对于人眼的极限是20 FPS算是极限了，一般我们玩的LOL和PUBG游戏是70 FPS左右，而在本文中可以达到5 FPS的成绩。当然这个成绩在2018年的今天不算太优秀：现在two stage方法的有rcnn、Fast rcnn、Faster rcnn、Mask rcnn；One shot 的方法有ssd和yolo。速度快请选yolo大法，精度高，请选择rcnn系列。

3.2.3 Faster R-CNN只能做物体检测?

人脸检测可以通过这个算法做（比如从96%提升到97%，小米在FDDB上得到了第一名的准确率）。也就是Faster R-CNN的应用面非常广，对于车牌识别、人脸检测、以及传统的物体识别，都可以带入Faster RCNN这个框架中来。

3.2.4 region proposal

问题引入
对于分类任务，无非是对一个类别判0、1，模式识别这门课程讲了很多分类的方法（怎么线性分类，怎么使用高维空间对低维空间不可线性分类的类别进行高维线性分类，以及特征降维等等知识）。在图像理解领域中，对框内的物体进行分类并不难，我们只需要对框内的物体进行线性二分类问题就行了，但我们怎么proposal这个框，是一个值得研究考虑的问题。
任务目标
难点在于找框，图中有框吗？框在哪？框多大？框是正方形吗？框出去了怎么办？
传统方法
Selective Research（根据像素、纹理进行框的提议2000个、并对这些框进行固定阈值下的分类任务，耗时耗力）
本文中的新颖方法
提出了第三代R-CNN系列算法：RPN算法（找框算法），不是对每个框逐个判定分类，而是通过了一个卷积网络提取特征，再进行整体上的操作，实现了卷积内容和参数上的共享，大大提升了整体速度，实现了“Real-time”的功能
最后这篇文章的强大之处在于把图像理解过程中的所有的工作全部糅合在了卷积神经网络上面，整合成了由layer-to-layer组成的end-to-end的结构。

3.2.4 Index Terms

Object Detection, Region Proposal, Convolutional Neural Network

4 Image Pyramid（Figure-1 ）

Different schemes for addressing multiple scales and sizes

4.1 图像金字塔格式（图(a)）

4.1.1 什么是Image Pyramid？

百度百科给出的定义（不愿意看直接看下面的精简版）：图像金字塔是图像多尺度表达的一种，是一种以多分辨率来解释图像的有效但概念简单的结构。一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低，且来源于同一张原始图的图像集合。其通过梯次向下采样获得，直到达到某个终止条件才停止采样。我们将一层一层的图像比喻成金字塔，层级越高，则图像越小，分辨率越低。

注意：上采样和下采样是非线性处理，不可逆，有损的处理！

4.1.2 图1 (a)解读：不同的Image

简单来说一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低，且来源于同一张原始图的图像集合。图1 (a)中构建了图像和特征映射图金字塔，分类器在各种尺度图上运行。在经过Scale变换操作后，图像大小不同其中框住的内容是不同的（这会导致处理速度变慢：相同的filter在不同像素大小的同一张图片上滑动，其每一个感受野所感受到的内容是不一样的，速度也是不一样的）。总之，事物是发展的，老的事物有其存在的意义，也有其被替代的理由，他的速度太慢了。

4.1.3 图1 (b)解读：不同的Filter

在同一张feature image上做不同的multiple fliter sizes（即：在特征映射图上run具有多个比例/大小的Filter所组成的金字塔），从而得到了不同的感受野的大小。

补充：感受野是什么？
在卷积神经网络CNN中，决定某一层输出结果中一个元素所对应的输入层的区域大小，被称作感受野receptive field。
推荐阅读：https://blog.csdn.net/u010725283/article/details/78593410

4.1.4 图1 (c )解读：Anchor机制

以上都是传统算法的表现，本文中在回归函数中使用金字塔边界框参数进行回归操作，并引入了anchor的概念，至于怎么实现，请看下文

5 Anchor（Figure-3）

5.1 问题引入

怎么通过引入anchor来提取出我们所需要的不同大小的框？

5.2 预先认知

在feature map中每个特征点（也叫锚点anchor），每个锚点上有k个anchor boxes（论文中k=9=3*3，k个都是基于multiple scales(像素值) and aspect ratios(1:1/1:2/2:1)）

5.3 为什么不在conv之前做预测box？

传统方法：产生box，再经过conv，每一个框要被fed into一个神经网络running
但若在feature map上找anchor，从而对应imput image上的9个anchor box，在“image-to-conv”这个过程中的整个卷积层的parameter和feature内容是共享的（省时）
这就是为什么在feature map上的一个点要产生9个不同大小的框（原文：we introduce novel “anchor” boxes that serve as references at multiple scales and aspect ratios.）

5.4 对图3的解读

图3左图是RPN网络，在feature map上的每个点有9个anchor box
默认情况下，我们使用3个尺度和3个长宽比，在每个滑动位置产生 $k = 9$ 个Anchors boxes。对于大小为 $W \times H$ （通常约为2400）的convolutional feature map，总计 $W \times H \times k$ 个Anchors boxes。
具体实现解读和代码分析请戳此链接：

6 Region Proposal Networks

6.1 原文解读

RPN的输入与输出
RPN也以任意大小的图像作为输入（因为input不同），输出一组rectangular object proposals（每个proposals都有一个objectness score）。在本节我们将描述怎么用fully convolutional network [7]对这个过程进行建模。
Share computation
因为我们的最终目标是将RPN与Fast R-CNN object detection network [2] 进行share computation，所以我们假设两个网络共享一组相同的卷积层。
引入ZF-net与VGG-16
在本文的实验中，分别研究了具有5个shareable convolutional layers的Zeiler and Fergus (ZF) model [32]和具有13个shareable convolutional layers的the Simonyan and Zisserman (VGG-16) model [3]。
mini-network降维特征
为了生成region proposals，我们在the last shared convolutional layer所输出的the convolutional feature map上建立一个mini-network。这个mini-network将输入卷积特征映射图的 $n \times n$ 的spatial window作为输入。每个滑动窗口会将feature map映射到一个低维特征（ZF为256-d，VGG为512-d，后面再跟一个ReLU）。（在本文中使用n=3，注意输入图像上的有效感受野 (the effective receptive field)很大 (171 and 228 pixels inputs for ZF and VGG, respectively)。）
所得的features被输入到两个sibling fully connected layers: 分别是box-regression layer(reg-layer)和box-classification layer (cls-layer)。
图3(左)
Figure 3 (left)显示了这个mini-network的一个位置，注意：因为小网络以Sliding-window方式工作，所有空间位置(all spatial locations)共享全连接层。这种架构通过一个n×n卷积层，后面是两个子1×1卷积层（分别用于reg-layer和cls-layer）来实现。

6.2 细节分析

最终我们需要分类的不是图像，而是通过整个过程生成的框。其中输入的image的大与小是无所谓的（当然实际代码中会有一个判定的限定过程，最长边不能大于1000）
image-CONV-RPN-output的过程：输入any size的image，输出是一系列的矩形框（坐标）和框的objectness score（是不是物体的分数，是前景还是背景，置信度多少）
This feature is fed into two sibling fullyconnected layers—a box-regression layer (reg) and a box-classification layer (cls).

7 Loss Function

7.1 Positive/Negative Label

为了训练RPN，我们为每个anchor分配一个binary class label (of being an object or not)，label的分配规则如下：

Positive label：（i）具有与实际边界框的重叠最高交并比（IoU）的anchor box，或者（ii）具有与实际边界框的重叠超过0.7 的IoU阈值的anchor box。（注意，单个真实边界框可以为多个锚点分配正标签。通常第二个条件足以确定正样本；但我们仍然采用第一个条件，因为在一些极少数情况下，第二个条件可能找不到正样本）
Negative label：如果一个anchor box的IoU比值低于0.3，我们给负anchor box分配一个negative label
Neither positive nor negative label：既不正面也不负面的anchor box不会有助于训练目标函数（这个思想和MTCNN中label思想设置的相一致，如下图==（注意！下图不是Faster R-CNN的label设定！）==）

总之，看proposal region（box框）与GT（true answer）作比较，看两者之间的重合程度，重合程度高是前景，重合程度低是背景，处于中间IOU值的anchor box的对于训练是没有用的

7.2 回归

b.box regression：首先理解啥是回归？（一点一点的迭代拟合到true answer（GT）），这里通过loss来回归（需要找一个衡量的标准），这里不用欧式距离或者曼哈顿距离来衡量，而是用 $t_x$ 和 $t_y$ （坐标差除以w或者h）来表示。

7.3 如何进行回归——损失函数

7.3.1 Multi-task Loss

7.3.2 $L_{cls}$ 和 $L_{reg}$ 的定义

7.3.3 参数化的坐标

8 流程图（Figure-2）

8.1 流程

Two module (RPN + Fast RCNN detector)（原文描述）
Our object detection system, called Faster R-CNN, is composed of two modules. The first module is a deep fully convolutional network that proposes regions, and the second module is the Fast R-CNN detector that uses the proposed regions.
背景介绍
经过R-CNN和Fast RCNN的积淀，Ross B. Girshick在2016年提出了新的Faster RCNN，在原有的结构基础上，Faster R-CNN将特征抽取(feature extraction)、proposal提取、bounding box regression(rect refine)、classification都整合在了卷积神经网络之上，利用卷积神经网络的优异特性（train时间长，test时间短），使得其目标检测领域的综合性能有较大提高，在检测速度方面尤为明显。
框架图分析（Faster RCNN其实可以分为4个主要内容）：

Conv Layers
作为一种CNN网络目标检测方法，Faster RCNN首先使用一组基础的CNN层提取image的feature maps。该feature maps被shared（划重点：卷积层共享）用于后续RPN层和RoI Pooling层。
Region Proposal Networks
RPN网络用于生成region proposals。该层通过softmax判断anchors box属于foreground或者background，并给出分类分数和box坐标，再利用bounding box regression修正anchors获得精确的proposals。
RoI Pooling
该层主要作用是将region proposals，pooling到同一个大小尺寸（7*7），收集feature maps和proposals并综合这些信息送入后续全连接层，用于判定目标类别。
Classification & B.box Regression
利用proposal feature maps计算proposal的类别，同时再次bounding box regression获得检测框最终的精确位置。

8.2 细节分析

8.2.1 框架图核心元素

conv layer（vgg-16或者ZF-net）、RPN、RoI Pooling层，具体分析就是围绕以上展开的

8.2.2 RoI Pooling层的作用

传统的卷积网络中（CONV-FC-Classification）：从conv送到到FC中的图像的大小是固定的，但本文中从input就是任意的，anchor box也是任意的，当然最终进行分类的，不是对图像进行分类，而是对框内的东西进行分类。

问题产生：
产生k=9个框，其大小是不一样的，现在如何与全连接层连接在一起？没有fc-layer如何进行后续的回归与分类？
解决方案：
对不同的框做一个RoI Pooling，这个RoI Pooling是一个自适应的，使得不同大小的框的resize到同一个大小（7*7），现在就可以做classification了（这个方法也是他人提出的）

8.2.3 具体代码描述

图2展示了python版本中的VGG16模型中的faster_rcnn_test.prototxt的网络结构，可以清晰的看到该网络：

对于一副任意大小PxQ的图像，首先缩放至固定大小MxN，然后将MxN图像送入网络；
Conv layers中包含了13个conv层+13个relu层+4个pooling层（对输入MxN图像进行特征提取，并便于后面的卷积层参数共享和RoI Pooling）
RPN网络首先经过3x3卷积，再分别生成foreground anchors与bounding box regression偏移量，通过Loss和梯度下降，给出Region Proposals
而Roi Pooling层则综合region proposal和feature maps成为proposal feature map送入后续的FC-layer和softmax网络作classification并给出得分（即分类proposal到底属于什么类别）

你可能感兴趣的:(MachineLearning,python,目标识别,DeepLearning)

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
python的while双重循环九九乘法表 Jinm_R python 开发语言
a=1whilea<=9:b=1#乘数每次需要从1开始whileb<=a:print(f"{a}*{b}={a*b}\t",end='')#\t为制表符使乘法表整齐end=''代表用空格代替换行b+=1a+=1print()#乘数每加一换行
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
Python自动化测试web常见框架汇总自动化测试薰儿软件测试技术分享 python 前端开发语言
1、前言目前，有非常多的Python框架，用来帮助你更轻松的创建web应用。这些框架把相应的模块组织起来，使得构建应用的时候可以更快捷，也不用去关注一些细节（例如socket和协议），所以需要的都在框架里了。接下来我们会介绍不同的选项。经过初期的不起眼，Python已经成为互联网最流行的服务端编程语言之一。根据W3Techs的统计，它被用于很多的大流量的站点很多的大流量的站点很多的大流量的站点，超
python安装jupter在线ide 晚风拂柳颜生活小经验 python3 ide jupter
我在虚拟3.6.8的环境里面安装的，具体用了以下命令；pipinstallipython-ihttps://mirrors.aliyun.com/pypi/simple/pipinstalljupyter-ihttps://mirrors.aliyun.com/pypi/simple/jupyternotebook当然，jupter可以直接通过python环境里script目录下的jupyter-
opencv 十八 python下实现0缓存掉线重连的rtsp直播流播放器摸鱼的机器猫 opencv实战 opencv python 缓存
使用opencv打开rtsp视频流时，会因为网络问题导致VideoCapture掉线；也会因为图像的后处理阶段耗时过长导致opencv缓冲区数据堆积，从而使程序无法及时处理最新的数据。为此对cv2.VideoCapture进行封装，实现0缓存掉线重连的rtsp直播流播放器，让程序能一直处理最新的数据。代码实现fromcollectionsimportdequeimportthreadingimpo
Windows如何安装poppler库，python的PDF转PPTX项目跨不过 pdf
资源库在这里下载https://github.com/oschwartz10612/poppler-windows/releases/tag/v21.03.0其他的参考这篇博客，里面提到的资源链接失效了https://blog.csdn.net/wy01415/article/details/110257130
用Python批量更改图片大小马达马达达 AI python
#提取目录下所有图片,更改尺寸后保存到另一目录fromPILimportImageimportos.pathimportglobdefconvertjpg(jpgfile,outdir,width=128,height=128):img=Image.open(jpgfile)try:new_img=img.resize((width,height),Image.BILINEAR)new_img.s
3.Python数据分析—数据分析入门知识图谱&索引(知识体系中篇) 以山河作礼。 Python数据分析项目数据分析知识图谱数据挖掘 python 开发语言
3.Python数据分析—数据分析入门知识图谱&索引-知识体系中篇一·个人简介二·数据获取和处理2.1数据来源：2.2数据清洗：2.2.1缺失值处理：2.2.2异常值处理：2.3数据转换：2.3.1数据类型转换：2.3.2数据编码：2.4数据合并与重塑：2.4.1数据合并：2.4.2数据拼接：2.4.3数据重塑：三·数据探索与分析3.1描述性统计分析3.2数据可视化原则和技巧3.3探索性数据分析（
SWIFT环境配置及大模型微调实践 weixin_43870390 swift 开发语言 ios
SWIFT环境配置及大模型微调实践SWIFT环境配置基础配置增量配置SWIFTQwen_audio_chat大模型微调实践问题1:问题2:问题定位解决方法手动安装pytorchSWIFT介绍参考：这里SWIFT环境配置基础配置condacreate-nswiftpython=3.8pipinstallms-swift[all]-U#下载项目gitclonehttps://github.com/mo
【Python】 Python脚本实现某平台视频流下载音乐学家方大刚 Python 爬虫 python chrome 开发语言
亲爱的玛丽我会想念着你我是多么的讨厌分离加油站旁的海鸥机场路上的松柏挥挥手眼泪就落下来我多想和那些光阴永远住下来我不能我不能赵雷《玛丽》在视频内容的分发上，m3u8格式的视频流越来越常见。它将视频切分成多个小片段（TS文件），然后通过索引文件（m3u8文件）来组织播放顺序，有效地支持了视频的流式传输。这篇博客将引导您使用Python脚本来下载m3u8格式的视频流，并将其合并成一个单一的视频文件。准
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d