stesha_chen

Faster RCNN（2）代码分析

运行代码

原作者的代码实现py-faster-rcnn，用的框架是caffe，由于对caffe不熟悉，所以在github上找了一个tensorflow版本的代码实现，地址是tf-faster-rcnn

在github上阅读代码之前，肯定是要先读一遍readme，根据作者写的说明将代码运行起来，这样也便于后面在代码中添加log来分析代码。

1.安装环境

下载代码

git clone https://github.com/endernewton/tf-faster-rcnn.git

保证除了tensorflow外还需要cython, opencv-python, easydict这三个包。

sudo pip install Cython
sudo pip install opencv-python
sudo pip install easydict

根据自己的电脑配置来修改setup.py

cd tf-faster-rcnn/lib
vim setup.py

比如根据我的电脑是GTX 1080 (Ti)，所以修改了-arch为sm_61，具体的型号可以在README中查看。

        extra_compile_args={'gcc': ["-Wno-unused-function"],
                            'nvcc': ['-arch=sm_61',
                                     '--ptxas-options=-v',
                                     '-c',
                                     '--compiler-options',
                                     "'-fPIC'"]},
        include_dirs = [numpy_include, CUDA['include']]

如果我们的训练电脑只有CPU，那么可以把./lib/model/config.py中的__C.USE_GPU_NMS = True改为False。

然后运行make编译出gpu_nms.so和cpu_nms.so，这部分是原作者为nms做GPU加速而设计出来的代码。

2.准备数据

下载VOCdevkit

wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCdevkit_08-Jun-2007.tar

tar xvf VOCtrainval_06-Nov-2007.tar
tar xvf VOCtest_06-Nov-2007.tar
tar xvf VOCdevkit_08-Jun-2007.tar

创建软链接

cd $FRCN_ROOT/data
ln -s $VOCdevkit VOCdevkit2007

3.下载Pre-trained Weights

./data/scripts/fetch_faster_rcnn_models.sh

下载使用Resnet101网络对VOC07+12数据集训练出来的weights。如果无法下载可以试试作者提供的google drive下载。

下载的文件解压后放在data目录下，然后创建软链接

NET=res101
TRAIN_IMDB=voc_2007_trainval+voc_2012_trainval
mkdir -p output/${NET}/${TRAIN_IMDB}
cd output/${NET}/${TRAIN_IMDB}
ln -s ../../../data/voc_2007_trainval+voc_2012_trainval ./default
cd ../../..

我们准备的数据是VOC2007，而下载的weights是根据2007和2012进行训练的，不过我们只是需要将流程跑通，不下载VOC2012关系不大。

4.运行demo和test

运行demo

GPU_ID=0
CUDA_VISIBLE_DEVICES=${GPU_ID} ./tools/demo.py

可以看到对data/demo中的图片都进行了预测。

运行test

GPU_ID=0
./experiments/scripts/test_faster_rcnn.sh $GPU_ID pascal_voc_0712 res101

可以得到对每个类别预测的准确率

Saving cached annotations to /local/share/DeepLearning/stesha/tf-faster-rcnn-master/data/VOCdevkit2007/VOC2007/ImageSets/Main/test.txt_annots.pkl
AP for aeroplane = 0.8300
AP for bicycle = 0.8684
AP for bird = 0.8129
AP for boat = 0.7411
AP for bottle = 0.6853
AP for bus = 0.8764
AP for car = 0.8805
AP for cat = 0.8830
AP for chair = 0.6231
AP for cow = 0.8683
AP for diningtable = 0.7080
AP for dog = 0.8852
AP for horse = 0.8727
AP for motorbike = 0.8297
AP for person = 0.8272
AP for pottedplant = 0.5319
AP for sheep = 0.8115
AP for sofa = 0.7767
AP for train = 0.8461
AP for tvmonitor = 0.7938
Mean AP = 0.7976
~~~~~~~~
Results:
0.830
0.868
0.813
0.741
0.685
0.876
0.880
0.883
0.623
0.868
0.708
0.885
0.873
0.830
0.827
0.532
0.811
0.777
0.846
0.794
0.798
~~~~~~~~

5.训练数据集

基于ImageNet的分类训练的权重来训练Faster RCNN，所以我们需要先下载ImageNet训练权重

mkdir -p data/imagenet_weights
cd data/imagenet_weights
wget -v http://download.tensorflow.org/models/vgg_16_2016_08_28.tar.gz
tar -xzvf vgg_16_2016_08_28.tar.gz
mv vgg_16.ckpt vgg16.ckpt
cd ../..

然后就可以训练了，也可以将数据集替换成自己的数据进行训练。

./experiments/scripts/train_faster_rcnn.sh 0 pascal_voc vgg16

代码分析

模型训练

1.配置和数据准备

当我们运行train_faster_rcnn.sh进行训练时实际上是运行python ./tools/trainval_net.py并且传入了一些参数。在trainval_net.py一开始会打印出所有参数

if __name__ == '__main__':
  args = parse_args()

  print('Called with args:')
  print(args)


output：
Called with args:
Namespace(cfg_file='experiments/cfgs/vgg16.yml', imdb_name='voc_2007_trainval', imdbval_name='voc_2007_test', max_iters=70000, net='vgg16', set_cfgs=['ANCHOR_SCALES', '[8,16,32]', 'ANCHOR_RATIOS', '[0.5,1,2]', 'TRAIN.STEPSIZE', '[50000]'], tag=None, weight='data/imagenet_weights/vgg16.ckpt')

然后读取cfg_file中的配置信息放入config.py，整理set_cfgs中的信息后也放入config.py。常用的配置信息一开始已经放入config.py中了，这步操作相当于是增加了一些网络特有的配置信息。代码如下

  if args.cfg_file is not None:
    cfg_from_file(args.cfg_file)
  if args.set_cfgs is not None:
    cfg_from_list(args.set_cfgs)

接着准备imdb和roidb

  imdb, roidb = combined_roidb(args.imdb_name)
  print('{:d} roidb entries'.format(len(roidb)))

imdb是imdb.py的类对象，便于后面使用imdb提供的方法。

roidb是通过_load_pascal_annotation解析xml文件，获取其中ground truth的boxes，gt_classes，gt_overlaps，flipped，seg_areas信息。

boxes的shape是(len(objs), 4)，表示图片中每个元素有一组box信息：xmin，xmax，ymin，ymax

gt_classes的shape是len(objs)，图片中每个元素有一个数字表示的类别信息cls

gt_overlaps的shape是(len(objs), num_classes)，图片中每个类别有一个对应cls位置为1.0，其他位置都为0的矩阵。

flipped表示是原图还是翻转图True或者False。

seg_areas的shape是len(objs)，每个类别有一个矩阵面积。

然后在prepare_roidb函数的调用过程中还会增加一些信息到roidb中：

image表示对应的image的路径

width表示图片的宽

height表示图片的长

max_overlaps表示gt_overlaps每一行最大的值。因为是ground truth的最大值，所以都是1.0，比如一张图片4个物体那么max_overlaps的值为[1. 1. 1. 1.]

max_classes表示gt_overlaps每一行最大值的位置。其实就是一张图片上每个物体的类别，比如一张图片上4个物体，max_classes的值为[15 15 18 9]

下面设置output_dir

  output_dir = get_output_dir(imdb, args.tag)
  print('Output will be saved to `{:s}`'.format(output_dir))
#./tensorboard/vgg16/voc_2007_trainval/default

再设置tensorboard路径

  #tensorboard/vgg16/voc_2007_trainval/default
  tb_dir = get_output_tb_dir(imdb, args.tag)
  print('TensorFlow summaries will be saved to `{:s}`'.format(tb_dir))

用同样的方式取出validation set的valroidb，但是不进行图片的翻转

  orgflip = cfg.TRAIN.USE_FLIPPED
  cfg.TRAIN.USE_FLIPPED = False
  _, valroidb = combined_roidb(args.imdbval_name)
  print('{:d} validation roidb entries'.format(len(valroidb)))
  cfg.TRAIN.USE_FLIPPED = orgflip

准备网络实例，以vgg16网络结构为例

net = vgg16()

最后一步就是训练网络，将前面准备的所有数据都传入了train_net函数。

  train_net(net, imdb, roidb, valroidb, output_dir, tb_dir,
            pretrained_model=args.weight,
            max_iters=args.max_iters)

2.训练网络train_net

对roidb和valroidb进行过滤，就是只保留max_overlaps大于等于0.5（前景），或者小于0.5大于等于0.1（背景）的值。我想对于ground truth的roidb而言，应该只能去掉一些图片中没有任何标记的例子。

  roidb = filter_roidb(roidb)
  valroidb = filter_roidb(valroidb)

创建SolverWrapper对象，将函数的参数都保存在SolverWrapper内部，便于后面调用train_model的时候直接使用。

    sw = SolverWrapper(sess, network, imdb, roidb, valroidb, output_dir, tb_dir,
                       pretrained_model=pretrained_model)

然后进行训练，max_iters是传入的值为70000

sw.train_model(sess, max_iters)

3.train_model

首先对roidb和valroidb初始化RoIDataLayer对象，并且调用_shuffle_roidb_inds打乱db index顺序，比如roidb的长度是10022，所以RoIDataLayer内部存储的self._perm是打乱[0, 1, 2, ......, 10019, 10020, 10021]这个数组的顺序的向量。另外因为cfg.TRAIN.ASPECT_GROUPING为False，所以调用的是np.random.permutation，这个方法和shuffle的区别是会返回一个打乱顺序的数组，但是不会改变原来的数组。

    self.data_layer = RoIDataLayer(self.roidb, self.imdb.num_classes)
    self.data_layer_val = RoIDataLayer(self.valroidb, self.imdb.num_classes, random=True)

接着调用construct_graph函数

    lr, train_op = self.construct_graph(sess)

在这个函数中调用了一个很重要的函数create_architecture，这个函数是搭建网络的核心，现在先跳过，后面重点分析这个函数。另外在construct_graph中取出了'total_loss'，设定了learning_rate，指定了optimizer。

再回到train_model函数，接着判断是否有可以restore的snapshot，如果有就恢复最后一个snapshot

    # Find previous snapshots if there is any to restore from
    lsf, nfiles, sfiles = self.find_previous()

    # Initialize the variables or restore them from the last snapshot
    if lsf == 0:
      rate, last_snapshot_iter, stepsizes, np_paths, ss_paths = self.initialize(sess)
    else:
      rate, last_snapshot_iter, stepsizes, np_paths, ss_paths = self.restore(sess, 
                                                                            str(sfiles[-1]), 
                                                                            str(nfiles[-1]))

如果调用initialize，其实会将ImageNet中训练的vgg16的checkpoint恢复。恢复参数的代码在vgg16.py中的fix_variables函数中实现。

接着进入训练的循环中，blobs是每次取出来的一个minibatch，因为data_layer中的self._perm是已经打乱过顺序了，所以第一次取minibatch顺序就是乱的。另外因为TRAIN.IMS_PER_BATCH为1，所以我们每次只取一个roidb的数据，对应一张图片。

blobs = self.data_layer.forward()

  def forward(self):
    """Get blobs and copy them into this layer's top blob vector."""
    blobs = self._get_next_minibatch()
    return blobs

具体准备blobs的代码在get_minibatch函数中实现，blobs的内容有三部分:

blobs['data']：是预处理后的图片数据。1.图片减去均值，2.短边压缩到600，如果压缩后长边大于1000，那么长边压缩到1000

blobs['im_info']：三个数字，前两个是压缩后的图片宽高，第三个是图片的压缩比例

blobs['gt_boxes']：shape是(len(objs), 5)，5个数字中前4个是boxes信息，第5个是对应obj的cls信息，过滤掉了background这个类别的数据。

然后调用train_step进行训练

        # Compute the graph without summary
        rpn_loss_cls, rpn_loss_box, loss_cls, loss_box, total_loss = \
          self.net.train_step(sess, blobs, train_op)

  def train_step(self, sess, blobs, train_op):
    feed_dict = {self._image: blobs['data'], self._im_info: blobs['im_info'],
                 self._gt_boxes: blobs['gt_boxes']}
    rpn_loss_cls, rpn_loss_box, loss_cls, loss_box, loss, _ = sess.run([self._losses["rpn_cross_entropy"],
                                                                        self._losses['rpn_loss_box'],
                                                                        self._losses['cross_entropy'],
                                                                        self._losses['loss_box'],
                                                                        self._losses['total_loss'],
                                                                        train_op],
                                                                       feed_dict=feed_dict)
    return rpn_loss_cls, rpn_loss_box, loss_cls, loss_box, loss

训练是将rpn的loss和fast rcnn的loss相加作为total loss来进行优化的，跟论文中提到的交替训练方式不太一样。不过这样会让训练更加的方便。

4.搭建网络create_architecture

前面跳过了create_architecture，现在再来分析这个函数。

首先创建了三个placeholder，对应我们从minibatch中取出来的blobs的三个信息。因为传入图片的尺寸并不固定，所以self._image的长宽shape设置为None。

    self._image = tf.placeholder(tf.float32, shape=[1, None, None, 3])
    self._im_info = tf.placeholder(tf.float32, shape=[3])
    self._gt_boxes = tf.placeholder(tf.float32, shape=[None, 5])

然后初始化了一些参数，self._num_anchors表示每个中心点anchor的个数，是9个。

self._num_anchors = self._num_scales * self._num_ratios

然后两个关键的函数就是self._build_network和self._add_losses，将搭建网络的中间参数和创建的loss最后都放入layers_to_output中做为create_architecture函数的返回值。

先看_build_network，在这个函数的实现中也有两个主要的部分，

1.调用_image_to_head，搭建了vgg网络，如果传入的图片尺寸是(1, 600, 800, 3)，经过计算后成为(1, 38, 50, 512)

  def _image_to_head(self, is_training, reuse=None):
    with tf.variable_scope(self._scope, self._scope, reuse=reuse):
      net = slim.repeat(self._image, 2, slim.conv2d, 64, [3, 3],
                          trainable=False, scope='conv1')
      net = slim.max_pool2d(net, [2, 2], padding='SAME', scope='pool1')
      net = slim.repeat(net, 2, slim.conv2d, 128, [3, 3],
                        trainable=False, scope='conv2')
      net = slim.max_pool2d(net, [2, 2], padding='SAME', scope='pool2')
      net = slim.repeat(net, 3, slim.conv2d, 256, [3, 3],
                        trainable=is_training, scope='conv3')
      net = slim.max_pool2d(net, [2, 2], padding='SAME', scope='pool3')
      net = slim.repeat(net, 3, slim.conv2d, 512, [3, 3],
                        trainable=is_training, scope='conv4')
      net = slim.max_pool2d(net, [2, 2], padding='SAME', scope='pool4')
      net = slim.repeat(net, 3, slim.conv2d, 512, [3, 3],
                        trainable=is_training, scope='conv5')

    self._act_summaries.append(net)
    self._layers['head'] = net
    
    return net

2.调用self._anchor_component()

  def _anchor_component(self):
    with tf.variable_scope('ANCHOR_' + self._tag) as scope:
      # just to get the shape right
      # 用图片原本的长宽除以16，得到的就是经过vgg运算后的feature map的尺寸
      height = tf.to_int32(tf.ceil(self._im_info[0] / np.float32(self._feat_stride[0])))
      width = tf.to_int32(tf.ceil(self._im_info[1] / np.float32(self._feat_stride[0])))
      if cfg.USE_E2E_TF:
        # 生成了相对原图的所有anchors
        anchors, anchor_length = generate_anchors_pre_tf(
          height,
          width,
          self._feat_stride,
          self._anchor_scales,
          self._anchor_ratios
        )
      ......

关键函数是generate_anchors_pre_tf，这个函数的目的是生成相对原图坐标而言的所有anchors。以feature map的坐标还原到原图上的位置，然后以这些位置为中心点与相对尺寸的9个anchors相加，为每个中心点生成9个anchors。所以anchors的个数为38*50*9=17100，就是论文中说的，feature map的每个像素点对应9个anchors。

def generate_anchors_pre_tf(height, width, feat_stride=16, anchor_scales=(8, 16, 32), anchor_ratios=(0.5, 1, 2)):
  # 将feature map的横向还原到原图，并且间隔16设置一个点
  shift_x = tf.range(width) * feat_stride # width
  # 将feature map的纵向还原到原图，并且间隔16设置一个点
  shift_y = tf.range(height) * feat_stride # height
  # 将x与y的坐标对应起来，生成原图上横纵都间隔16的网格点坐标sw和sy。
  shift_x, shift_y = tf.meshgrid(shift_x, shift_y)
  sx = tf.reshape(shift_x, shape=(-1,))
  sy = tf.reshape(shift_y, shape=(-1,))
  # sx和sy作为原图框的起始坐标和结束坐标，因为起始坐标和结束坐标相同，所以其实[sx,sy,sx,sy]框是一个面积为0的点
  shifts = tf.transpose(tf.stack([sx, sy, sx, sy]))
  K = tf.multiply(width, height)
  # shifts尺寸为(width*height, 1, 4)
  shifts = tf.transpose(tf.reshape(shifts, shape=[1, K, 4]), perm=(1, 0, 2))

  # 利用anchor_ratios和anchor_scales生成固定比例的框
  # array([[ -83.,  -39.,  100.,   56.],
  #       [-175.,  -87.,  192.,  104.],
  #       [-359., -183.,  376.,  200.],
  #       [ -55.,  -55.,   72.,   72.],
  #       [-119., -119.,  136.,  136.],
  #       [-247., -247.,  264.,  264.],
  #       [ -35.,  -79.,   52.,   96.],
  #       [ -79., -167.,   96.,  184.],
  #       [-167., -343.,  184.,  360.]])
  anchors = generate_anchors(ratios=np.array(anchor_ratios), scales=np.array(anchor_scales))
  A = anchors.shape[0]
  # anchor_constant尺寸为(1, 9, 4)
  anchor_constant = tf.constant(anchors.reshape((1, A, 4)), dtype=tf.int32)

  length = K * A
  # (1, 9, 4) + (width*height, 1, 4),按照广播原则相加得到的尺寸为(width*height, 9, 4)，然后reshape成(width*height*9, 4)，这就是相对原图上的所有anchors
  anchors_tf = tf.reshape(tf.add(anchor_constant, shifts), shape=(length, 4))
  
  return tf.cast(anchors_tf, dtype=tf.float32), length

3.调用self._region_proposal搭建rpn网络

  def _region_proposal(self, net_conv, is_training, initializer):
    rpn = slim.conv2d(net_conv, cfg.RPN_CHANNELS, [3, 3], trainable=is_training, weights_initializer=initializer,
                        scope="rpn_conv/3x3")
    self._act_summaries.append(rpn)
    rpn_cls_score = slim.conv2d(rpn, self._num_anchors * 2, [1, 1], trainable=is_training,
                                weights_initializer=initializer,
                                padding='VALID', activation_fn=None, scope='rpn_cls_score')
    # change it so that the score has 2 as its channel size
    rpn_cls_score_reshape = self._reshape_layer(rpn_cls_score, 2, 'rpn_cls_score_reshape')
    rpn_cls_prob_reshape = self._softmax_layer(rpn_cls_score_reshape, "rpn_cls_prob_reshape")
    rpn_cls_pred = tf.argmax(tf.reshape(rpn_cls_score_reshape, [-1, 2]), axis=1, name="rpn_cls_pred")
    rpn_cls_prob = self._reshape_layer(rpn_cls_prob_reshape, self._num_anchors * 2, "rpn_cls_prob")
    rpn_bbox_pred = slim.conv2d(rpn, self._num_anchors * 4, [1, 1], trainable=is_training,
                                weights_initializer=initializer,
                                padding='VALID', activation_fn=None, scope='rpn_bbox_pred')
    if is_training:
      rois, roi_scores = self._proposal_layer(rpn_cls_prob, rpn_bbox_pred, "rois")
      rpn_labels = self._anchor_target_layer(rpn_cls_score, "anchor")
      # Try to have a deterministic order for the computing graph, for reproducibility
      with tf.control_dependencies([rpn_labels]):
        rois, _ = self._proposal_target_layer(rois, roi_scores, "rpn_rois")
    ......

    self._predictions["rpn_cls_score"] = rpn_cls_score
    self._predictions["rpn_cls_score_reshape"] = rpn_cls_score_reshape
    self._predictions["rpn_cls_prob"] = rpn_cls_prob
    self._predictions["rpn_cls_pred"] = rpn_cls_pred
    self._predictions["rpn_bbox_pred"] = rpn_bbox_pred
    self._predictions["rois"] = rois

    return rois

以feature map尺寸为(38, 50, 512)为例，下图是这些变量之间的生成关系与尺寸。

里面调用的三个比较重要的函数需要解说一下

# 由于计算出来的rpn_bbox_pred中的dx，dy，dw，dh都是相对anchor的偏移
# 所以这个函数就是相对anchors计算出来pred_boxes的坐标，将超出范围的pred_box进行裁剪
# 然后先取出分数排行前12000的scores和boxes，再用nms取出2000个boxes和对应的scroes
# 剩下proposals的shape是(2000, 4),返回的rois是对proposals第一列增加了一个数字全为0的列
# 所以rois的shape是(2000, 5)，roi_scores的shape是(2000,)
rois, roi_scores = self._proposal_layer(rpn_cls_prob, rpn_bbox_pred, "rois")

# 这个函数实际上是调用了anchor_target_layer函数
# anchor_target_layer函数的实现比较复杂，是为了生成四个返回值
# rpn_labels, rpn_bbox_targets, rpn_bbox_inside_weights, rpn_bbox_outside_weights
# 1.所有anchors中超出图片范围的剔除，生成在图片内部的anchor列表，假设是5944个
# 2.创建labels向量，长度为5944，里面的值默认全部设置为-1
# 3.计算每一个anchor与每一个gt_box之间的IOU，假设有4个gt_box，那么生成的overlaps尺寸为(5944, 4)
# 4.每个anchor与4个gt_box之间的IOU取出最大值，如果最大值小于0.3，那么这个anchor对应的label标记为0（负样本）
# 5.每个anchor与4个gt_box之间的IOU取出最大值，如果最大值小于0.7，那么这个anchor对应的label标记为1（正样本）
# 6.为了防止最大值没有大于0.7的情况，取出overlaps中列最大值，如果有相同的最大值也一起取出，对应的label标记为1
# 7. 筛选正负样本，使它们的个数都不超过128个，没有被筛选上的anchor对应的label标记为-1（不关心的值）
# 8. gt_boxes[argmax_overlaps, :]表示取gt_boxes的哪一组值来进行计算，是根据anchor跟哪一个box的IOU最大决定的
# 9. bbox_targets的数据是anchor相对gt_box的dx，dy，dw，dh，是偏移压缩比例。(5944, 4)
# 10. bbox_inside_weights是(5944, 4)的全0矩阵，将label为1的位置的数据改为[1.0,1.0,1.0,1.0]
# 11. bbox_outside_weights是(5944, 4)的全0矩阵，将label为1和为0的位置的数据改为[0.00390625 0.00390625 0.00390625 0.00390625]（用1除以正负样本总和算出来的）
# 12. 把长度5944的label还原长度为17100的label，用-1来补新增位置的值
# 13. 把尺寸为(5944, 4)的bbox_targets，还原到尺寸为(17100, 4)，用0来补新增位置的值
# 14. bbox_inside_weights和bbox_outside_weights同样操作，尺寸都成为(17100, 4)
# 15. rpn_labels是对labels进行reshape，尺寸为(1, 1, 9*38, 50)
# 16. rpn_bbox_targets是对bbox_targets进行reshape，尺寸为(1, 38, 50, 36)
# 17. rpn_bbox_inside_weights和rpn_bbox_outside_weights同上一样，尺寸为(1, 38, 50, 36)
rpn_labels = self._anchor_target_layer(rpn_cls_score, "anchor")

# 这个函数实际上是调用了proposal_target_layer，然后调用_sample_rois
# 因为anchors已经准备了256个正负样本参与计算，而proposal还是2000个，所以要进一步过滤proposal的个数
# 1.overlaps是计算出来的大约2000个proposal与gt_boxes之间的IOU，(2000, 4)
# 2.gt_assignment表示这2000个proposal跟哪个obj的overlap最大,(2000,)
# 3.labels = gt_boxes[gt_assignment, 4],gt_boxes的尺寸是(len(objs), 5),所以labels是每一个proposal对应的object的cls，(2000,)
# 4.fg_inds是最大IOU大于等于0.5的index，bg_inds是最大IOU大于等于0.1小于0.5的index
# 5.调整fg_inds和bg_inds，使他们的个数相加为rois_per_image（256）
# 6.保留labels中的fg_inds和bg_inds，(256,)
# 7.从fg_rois_per_image到结束是背景位置，设置label的值为0，而此时前景的label仍然是cls id
# 8.计算出proposal与gt_box的相对位移dx，dy，dw，dh，放入bbox_target_data并将label列放入第一列的位置，尺寸是(256, 5)
# 9.创建尺寸为(256, 84)的bbox_targets和bbox_inside_weights，84是因为有21个类，每个类留4个位置
# 经过计算后返回的rois尺寸为(256, 5)
rois, _ = self._proposal_target_layer(rois, roi_scores, "rpn_rois")

4.调用_crop_pool_layer实现RoI Pooling层，因为proposal的尺寸各不相同，如果要送入region calssification会计算出问题，所以这里将他们统一尺寸。原理上是将每个proposal对应到feature map上的位置，然后划分成同样的尺寸比如7*7，这样在49个区域里面进行max pooling，就可以将所有proposal转成7x7的尺寸。最后的返回值是(256, 7, 7, 512)

5.调用_head_to_tail继续构建网络，最后的fc7尺寸为(256, 4096)

  def _head_to_tail(self, pool5, is_training, reuse=None):
    with tf.variable_scope(self._scope, self._scope, reuse=reuse):
      pool5_flat = slim.flatten(pool5, scope='flatten')
      fc6 = slim.fully_connected(pool5_flat, 4096, scope='fc6')
      if is_training:
        fc6 = slim.dropout(fc6, keep_prob=0.5, is_training=True, 
                            scope='dropout6')
      fc7 = slim.fully_connected(fc6, 4096, scope='fc7')
      if is_training:
        fc7 = slim.dropout(fc7, keep_prob=0.5, is_training=True, 
                            scope='dropout7')

    return fc7

6.调用_region_classification搭建proposal的分类网络，cls_score的尺寸为(256, 21)，cls_prob的尺寸为(256, 21)，cls_pred的尺寸为(256,)，bbox_pred的尺寸为(256, 84)

  def _region_classification(self, fc7, is_training, initializer, initializer_bbox):
    cls_score = slim.fully_connected(fc7, self._num_classes, 
                                       weights_initializer=initializer,
                                       trainable=is_training,
                                       activation_fn=None, scope='cls_score')
    cls_prob = self._softmax_layer(cls_score, "cls_prob")
    cls_pred = tf.argmax(cls_score, axis=1, name="cls_pred")
    bbox_pred = slim.fully_connected(fc7, self._num_classes * 4, 
                                     weights_initializer=initializer_bbox,
                                     trainable=is_training,
                                     activation_fn=None, scope='bbox_pred')

    self._predictions["cls_score"] = cls_score
    self._predictions["cls_pred"] = cls_pred
    self._predictions["cls_prob"] = cls_prob
    self._predictions["bbox_pred"] = bbox_pred

    return cls_prob, bbox_pred

至此，_build_network的所有工作就完成了，返回值是rois, cls_prob, bbox_pred，但是还保存了很多中间变量放在了self._predictions中。

再看_add_losses，

首先是RPN class loss，RPN的loss都是相对anchors来计算的。

      # 是RPN网络中由feature map通过卷积计算生成的(1, 38, 50, 18)reshape得到的，尺寸是(9*38*50, 2)
      rpn_cls_score = tf.reshape(self._predictions['rpn_cls_score_reshape'], [-1, 2])
      # (9*38*50,)
      rpn_label = tf.reshape(self._anchor_targets['rpn_labels'], [-1])
      # 找出rpn_label中不为-1的部分，-1表示not care的数据
      rpn_select = tf.where(tf.not_equal(rpn_label, -1))
      # 根据rpn_select找出rpn_cls_score的对应位置
      rpn_cls_score = tf.reshape(tf.gather(rpn_cls_score, rpn_select), [-1, 2])
      # 根据rpn_select找出rpn_label的对应位置
      rpn_label = tf.reshape(tf.gather(rpn_label, rpn_select), [-1])
      # 计算cross entropy loss
      rpn_cross_entropy = tf.reduce_mean(
        tf.nn.sparse_softmax_cross_entropy_with_logits(logits=rpn_cls_score, labels=rpn_label))

其次是RPN bbox loss

      # (1, 38, 50, 36)
      rpn_bbox_pred = self._predictions['rpn_bbox_pred']
      # (1, 38, 50, 36)
      rpn_bbox_targets = self._anchor_targets['rpn_bbox_targets']
      # (1, 38, 50, 36)
      rpn_bbox_inside_weights = self._anchor_targets['rpn_bbox_inside_weights']
      # (1, 38, 50, 36)
      rpn_bbox_outside_weights = self._anchor_targets['rpn_bbox_outside_weights']
      # l1 loss
      rpn_loss_box = self._smooth_l1_loss(rpn_bbox_pred, rpn_bbox_targets, rpn_bbox_inside_weights,
                                          rpn_bbox_outside_weights, sigma=sigma_rpn, dim=[1, 2, 3])

接着是RCNN class loss，RCNN的loss都是相对proposal

      # (256, 21)
      cls_score = self._predictions["cls_score"]
      # (256,)
      label = tf.reshape(self._proposal_targets["labels"], [-1])
      # cross entropy loss
      cross_entropy = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=cls_score, labels=label))

最后是RCNN bbox loss

      # (256, 84)
      bbox_pred = self._predictions['bbox_pred']
      # (256, 84)
      bbox_targets = self._proposal_targets['bbox_targets']
      # (256, 84)
      bbox_inside_weights = self._proposal_targets['bbox_inside_weights']
      # (256, 84)
      bbox_outside_weights = self._proposal_targets['bbox_outside_weights']
      # l1 loss
      loss_box = self._smooth_l1_loss(bbox_pred, bbox_targets, bbox_inside_weights, bbox_outside_weights)

total_loss就是将以上4个loss相加，我们要优化的就是total_loss的值。

总结一下RPN和RCNN的loss：

模型预测

1.demo.py

从demo.py入手看如何预测一张图片。

当运行demo.py脚本的时候，会运行main下面的代码。

主要是准备session，调用create_architecture构建网络，restore网络，调用demo预测

2.构建网络

函数create_architecture的实现主体和training时一样，有以下几个区别。

1.在构建网络的时候_region_proposal中只需要调用_proposal_layer，因为我们不需要构建loss，所以training中后面的步骤不需要。

    if is_training:
      rois, roi_scores = self._proposal_layer(rpn_cls_prob, rpn_bbox_pred, "rois")
      rpn_labels = self._anchor_target_layer(rpn_cls_score, "anchor")
      # Try to have a deterministic order for the computing graph, for reproducibility
      with tf.control_dependencies([rpn_labels]):
        rois, _ = self._proposal_target_layer(rois, roi_scores, "rpn_rois")
    else:
      if cfg.TEST.MODE == 'nms':
        rois, _ = self._proposal_layer(rpn_cls_prob, rpn_bbox_pred, "rois")
      elif cfg.TEST.MODE == 'top':
        rois, _ = self._proposal_top_layer(rpn_cls_prob, rpn_bbox_pred, "rois")
      else:
        raise NotImplementedError

另外在_proposal_layer函数中，因为cfg_key为test，所以pre_nms_topN为6000，pos_nms_topN为300，因此我们的proposal有300个。

def proposal_layer(rpn_cls_prob, rpn_bbox_pred, im_info, cfg_key, _feat_stride, anchors, num_anchors):
  ......
  pre_nms_topN = cfg[cfg_key].RPN_PRE_NMS_TOP_N
  post_nms_topN = cfg[cfg_key].RPN_POST_NMS_TOP_N
  nms_thresh = cfg[cfg_key].RPN_NMS_THRESH

2.在create_architecture中需要对预测数据做处理

    if testing:
      stds = np.tile(np.array(cfg.TRAIN.BBOX_NORMALIZE_STDS), (self._num_classes))
      means = np.tile(np.array(cfg.TRAIN.BBOX_NORMALIZE_MEANS), (self._num_classes))
      self._predictions["bbox_pred"] *= stds
      self._predictions["bbox_pred"] += means

做这些处理是因为我们对target做过相反的处理

  if cfg.TRAIN.BBOX_NORMALIZE_TARGETS_PRECOMPUTED:
    # Optionally normalize targets by a precomputed mean and stdev
    targets = ((targets - np.array(cfg.TRAIN.BBOX_NORMALIZE_MEANS))
               / np.array(cfg.TRAIN.BBOX_NORMALIZE_STDS))

self._predictions["bbox_pred"]的尺寸是(300, 84)，就是我们前面选出来的300个proposal。

3.demo函数

im_detect就是进行预测的主要代码，生成的scores shape是(300, 21)，boxes的shape是(300, 84)

scores, boxes = im_detect(sess, net, im)

然后对除了__background__以外的每个类别单独分析

    for cls_ind, cls in enumerate(CLASSES[1:]):
        cls_ind += 1 # because we skipped background
        #将对应class的box挑选出来，(300, 4)
        cls_boxes = boxes[:, 4*cls_ind:4*(cls_ind + 1)]
        #将对应class的分数挑选出来，(300, 1)
        cls_scores = scores[:, cls_ind]
        #合并成(300, 5)的数据score放在最后
        dets = np.hstack((cls_boxes,
                          cls_scores[:, np.newaxis])).astype(np.float32)
        #keep表示通过nms挑选出来的index，比如挑选出来30个
        keep = nms(dets, NMS_THRESH)
        #取出挑选出来的dets，(30, 5)
        dets = dets[keep, :]
        #将dets中score大于0.8的框保留下来画在图片上，这样就拿到了bbox和score和class id
        im = vis_detections(im, cls, dets, thresh=CONF_THRESH)

4.im_detect预测

调用net.test_image进行预测

  def test_image(self, sess, image, im_info):
    feed_dict = {self._image: image,
                 self._im_info: im_info}

    cls_score, cls_prob, bbox_pred, rois = sess.run([self._predictions["cls_score"],
                                                     self._predictions['cls_prob'],
                                                     self._predictions['bbox_pred'],
                                                     self._predictions['rois']],
                                                    feed_dict=feed_dict)
    return cls_score, cls_prob, bbox_pred, rois

然后再根据相对坐标计算出真实坐标

  if cfg.TEST.BBOX_REG:
    # Apply bounding-box regression deltas
    box_deltas = bbox_pred
    pred_boxes = bbox_transform_inv(boxes, box_deltas)
    pred_boxes = _clip_boxes(pred_boxes, im.shape)

预测完成。

以上为本文所有内容，感谢阅读，欢迎留言。

你可能感兴趣的:(定位网络)

Pytorch:以CIFAR-10分类为例，给出了神经网络的训练流程 Xiao_Ya__ 深度学习 pytorch pytorch 分类神经网络
下面给出了神经网络的训练流程，包括数据加载与预处理、网络定义、损失函数和优化器定义、网络训练和网络测试。importtorchastimporttorchvisionastvimporttorchvision.transformsastransformsfromtorchvision.transformsimportToPILImageimporttorch.nnasnnimporttorch.n
梯度累加（结合DDP）梯度检查点糖葫芦君 LLM 算法人工智能大模型深度学习
梯度累加目的梯度累积是一种训练神经网络的技术，主要用于在内存有限的情况下处理较大的批量大小（batchsize）。通常，较大的批量可以提高训练的稳定性和效率，但受限于GPU或TPU的内存，无法一次性加载大批量数据。梯度累积通过多次前向传播和反向传播累积梯度，然后一次性更新模型参数，从而模拟大批量训练的效果。总结：显存限制：GPU/TPU显存有限，无法一次性加载大批量数据。训练稳定性：大批量训练通常
Tensorflow2.x框架-神经网络八股扩展-acc曲线与loss曲线诗雨时
loss/loss可视化，可视化出准确率上升、损失函数下降的过程博主微信公众号（左）、Python+智能大数据+AI学习交流群（右）：欢迎关注和加群，大家一起学习交流，共同进步！目录摘要一、acc曲线与loss曲线二、完整代码摘要loss/loss可视化，可视化出准确率上升、损失函数下降的过程一、acc曲线与loss曲线history=model.fit(训练集数据,训练集标签,batch_siz
卷积神经网络八股（一）------20行代码搞定鸢尾花分类有幸添砖java opencv
编写不易，未有VIP但想白嫖文章的朋友可以关注我的个人公众号“不秃头的码农”直接查看文章，后台回复java资料、单片机、安卓可免费领取资源。你的支持是我最大的动力！卷积神经网络八股（一）------20行代码搞定鸢尾花分类引言用TensorflowAPI：tf.keras实现神经网络搭建八股Sequential的用法compile的用法fit的用法（batch是每次喂入神经网络的样本数、epoch
深度学习笔记——循环神经网络RNN 好评笔记补档深度学习 rnn 人工智能机器学习计算机视觉神经网络 AIGC
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍面试过程中可能遇到的循环神经网络RNN知识点。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习文本特征提取的方法1.基础方法1.1词袋模型（BagofWords,BOW）工作原理举例优点缺点1.2TF-IDF（TermFrequency-InverseDocumentFr
第三讲-神经网络八股 loveysuxin Tensorflow tensorflow
一、搭建神经网络六部法tf.keras搭建神经网络六部法1、import相关模块 2、train,test #训练集、测试集3、model=tf.keras.models.Sequential #逐层搭建网络结构4、model.compile #配置训练方法，选择训练使用的优化器、损失函数和最终评价指标5、model.fit #执行训练过程，告知训练集和测试集的输入值和标签、每个batc
神经网络八股（3） SylviaW08 神经网络人工智能深度学习
1.什么是梯度消失和梯度爆炸梯度消失是指梯度在反向传播的过程中逐渐变小，最终趋近于零，这会导致靠前层的神经网络层权重参数更新缓慢，甚至不更新，学习不到有用的特征。梯度爆炸是指梯度在方向传播过程中逐渐变大，权重参数更新变化较大，导致损失函数的上下跳动，导致训练不稳定可以使用一些合理的损失函数如relu,leakRelu，归一化处理，batchnorm,确保神经元的输出值在合理的范围内2.为什么需要特
共识算法 —— DPoS yezhijing 区块链共识算法区块链算法
定义2014年4月由Bitshares的首席开发者DanLarimer提出。DPoS的全称是DelegatedProofofStake代理权益证明，它是由持有币的人选出一定数量（一般是101个，不一定，由项目方决定，不能少于11个）的代表节点（受托人）来运营网络（类似于人民群众选举出来的人大代表，由人大代表来维护人民的权益）。受托节点有记账的权力（也就是有生成区块、验证交易、区块上链的权限），但是
【PyTorch 实战2：UNet 分割模型】10min揭秘 UNet 分割网络如何工作以及pytorch代码实现（详细代码实现） xiaoh_7 pytorch 网络图像处理计算机视觉
UNet网络详解及PyTorch实现一、UNet网络原理 U-Net，自2015年诞生以来，便以其卓越的性能在生物医学图像分割领域崭露头角。作为FCN的一种变体，U-Net凭借其Encoder-Decoder的精巧结构，不仅在医学图像分析中大放异彩，更在卫星图像分割、工业瑕疵检测等多个领域展现出强大的应用能力。UNet是一种常用于图像分割的卷积神经网络架构，其特点在于其U型结构，包括一个收缩路径
1/30每日一题转码的小石服务器运维
从输入URL到页面展示到底发生了什么？1.输入URL与浏览器解析当你在浏览器地址栏输入URL并按下回车，浏览器首先会解析这个URL（统一资源定位符），比如https://www.example.com。浏览器会解析这个URL中的不同部分：协议（如：http或https）：决定了数据传输的方式和安全性。域名（如：www.example.com）：确定请求的目标服务器。路径（如：/index.html
【PyTorch项目实战】图像分割 —— U-Net：Semantic segmentation with PyTorch 胖墩会武术深度学习 PyTorch项目实战 python unet pytorch
文章目录一、项目介绍二、项目实战2.1、环境搭建2.1.1、下载源码2.1.2、下载预训练模型2.1.3、下载训练集2.2、环境配置2.3、代码优化+架构优化2.4、模型预测：predict.pyU-Net是一种用于生物医学图像分割的卷积神经网络架构，最初由OlafRonneberger等人于2015年提出。论文：U-Net:ConvolutionalNetworksforBiomedicalIm
车辆网络安全ISOSAE 21434解读（一）概述_网络安全21434标准解网络安全小宇哥 web安全安全网络安全计算机网络安全架构系统安全密码学
ISO/SAE21434《道路车辆网络安全工程》是SAE和ISO共同制定的一项针对道路车辆的网络安全标准，它是一个面向汽车行业全供应链（OEM及各级供应商）的车辆网络安全管理指导文件，其目的是指导行业内相关组织：定义网络安全方针和流程；管理网络安全风险；推动网络安全文化。2020年联合国欧洲经济委员会(UNECE)WP.29工作组发布了网络安全法规**UNECER155，**在其解释文件中明确引用
jwt + redis 登录 code-布丁 JAVA redis java web安全分布式
jwt+redis登录在用户注册或登录后，我们想记录用户的登录状态，或者为用户创建身份认证的凭证。我们不再使用Session认证机制，而使用JsonWebToken认证机制。Jsonwebtoken(JWT),是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准（(RFC7519).该token被设计为紧凑且安全的，特别适用于分布式站点的单点登录（SSO）场景。JWT的声明一般被用来在
easy connect 连接不上网络，本地环境出现异常玩人工智能的辣条哥计算机应用软件 easy connect
环境：Win7专业版easyconnect问题描述：easyconnect连接不上网络，本地环境出现异常解决方案：1.打开IE的lnternet选项–高级看看是否勾选了SSL3.0TLS1.0，取消（未解决）2.请先关闭防火墙和杀毒软件3.右击以管理员身份运行测试一下4.用windows环境诊断修复工具扫描测试5.卸载重装一下客户端,更新客户端（解决本案例）
造成内存溢出（OOM）的原因以及如何快速定位 oom
造成内存溢出（OOM）的原因：一次性申请过多对象在应用程序中，可能会出现一次性申请过多内存的情况，特别是当涉及到大量数据查询时。例如，如果你从数据库一次性加载所有数据（例如，千万级别的数据）并将其全部存入一个列表中，这样就可能导致内存溢出。解决此问题的方式是减少一次性加载的数据量，例如使用分页查询，每次查询10个或100个数据，而不是一次性加载所有数据。内存资源未及时释放在高并发环境下，常见的内存
分布式服务框架 Dubbo
Dubbo是一款高性能的分布式服务框架，主要用于实现服务的调用、管理和监控。它最早由阿里巴巴开发，现已成为一个开源项目，并且广泛应用于微服务架构中。Dubbo的核心功能远程过程调用（RPC）：Dubbo主要用于服务之间的远程调用，它允许不同的服务在不同的机器上运行，并通过网络相互调用。Dubbo会自动处理网络通信、序列化和反序列化、服务发现等细节，开发者只需要关注服务的接口定义。服务注册与发现：D
火绒终端安全管理系统V2.0访问控制功能大揭底火绒终端安全管理系统火绒安全安全网络网络安全火绒
火绒终端安全管理系统V2.0访问控制功能，提供针对IP协议层访问控制、计算机应用程序执行与网络访问、设备控制等功能的查看与细节配置。协议控制在IP协议层控制数据包进站、出站行为，并且针对这些行为做规则化的控制。需用户或管理员手动配置对应规则，当发现有触发IP协议控制规则的操作时，火绒可根据用户设置的规则放过或阻止。IP黑名单当终端有不受欢迎的IP访问时，用户可以添加这些IP加入IP黑名单中，以阻止
Python从0到100（三十三）：xpath和lxml类库是Dream呀 python 开发语言
1.为什么要学习xpath和lxmllxml是一款高性能的PythonHTML/XML解析器，我们可以利用XPath，来快速的定位特定元素以及获取节点信息2.什么是xpathXPath，全称为XMLPathLanguage，是一种用于在XML文档中进行导航和数据提取的语言，可用来在HTML\XML文档中对元素和属性进行遍历。W3School官方文档：http://www.w3school.com.
火绒终端安全管理系统V2.0网络防御功能介绍火绒终端安全管理系统网络火绒安全安全网络安全火绒
火绒终端安全管理系统V2.0【火绒企业版V2.0】网络防御功能包含网络入侵拦截、横向渗透防护、对外攻击检测、僵尸网络防护、Web服务保护、暴破攻击防护、远程登录防护、恶意网址拦截。火绒企业版V2.0的网络防御功能，多层次、多方位，守护用户终端安全。1、网络入侵拦截网络入侵拦截将检测网络传输的数据包中是否包含恶意攻击代码，通过中断这些数据包传输以避免您的电脑被黑客入侵。2、横向渗透防护横向渗透防护可
【YOLOv11改进[注意力]】引入YOLOv12的A2C2f模块改进v11 Jackilina_Stone 【改进】YOLO系列 YOLO python 计算机视觉 OD
本文将进行在YOLOv11中引入A2C2f模块魔改v11，文中含全部代码、详细修改方式。助您轻松理解改进的方法。目录一YOLOv121区域注意力(AreaAttention)2R-ELAN(残差高效层聚合网络)3架构优化4实验二魔改YOLOv111整体修改
linux服务器双网卡做bond-安装ifconfig 寻址00000001 安服学习以及实战演练 linux 网络运维 ifconfig
环境：CentOSLinuxrelease7.6.1810(Core)yuminstallnet-tools安装ifconfig1目前有三张网卡分别是ens33\37\38,我们将ens3337绑定为bond02分别更改ens3337的配置文件cat/etc/sysconfig/network-scripts/ifcfg-ens33/37bond13down掉bond0中的一块网卡，看网络连通性。
运维实践 | 使用K3S之快速搭建精简版本K8S集群环境，助力开发测试环境! 全栈工程师修炼指南云原生落地实用指南 kubernetes 运维容器云原生 docker
欢迎关注「WeiyiGeek」点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到全栈实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：请关注
k8s集群内的pod连接集群外部的mysql， k8s集群内部服务如何连接集群外部mysql？一文搞明白终端行者 Kubernetes kubernetes mysql 容器
一、为什么不将mysql服务部署到k8s集群中使用呢？1.有状态服务在K8s中的管理比较复杂，特别是持久化存储的问题。虽然K8s有StatefulSet和PV/PVC，但配置和维护起来需要更多工作,同时以下问题仍需解决：-存储可靠性：如果使用本地存储（如hostPath），节点故障可能导致数据丢失；若用网络存储（如云盘），需确保性能和延迟满足数据库需求。-备份与恢复：需额外配置定期备份工具（如my
Linux 服务器多网卡进行网络绑定 Kubit~ 服务器 linux 网络
要在配置了LACP（LinkAggregationControlProtocol）的交换机上设置Linux服务器的网络绑定，并包含DNS和网关的完整配置，你可以按照以下步骤进行操作。这里以CentOS/RHEL和Ubuntu/Debian为例。一、CentOS/RHEL配置示例确保bonding模块已加载sudomodprobebonding为了在系统启动时自动加载该模块，可以将其添加到/etc/
RHEL5系统配置双网卡绑定 Linux GvCybersecurity linux php 运维
使用Linux配置双网卡绑定以提高网络性能在企业网络环境中，使用多个网络接口卡（NIC）可以提高网络性能和可靠性。在RedHatEnterpriseLinux5（RHEL5）系统中，我们可以配置双网卡绑定（也称为网卡绑定、链路聚合或链路聚合控制协议）来利用多个网络接口卡的带宽。本文将介绍如何在RHEL5系统中配置双网卡绑定。双网卡绑定的优势双网卡绑定通过将多个NIC绑定为一个逻辑接口，提供了以下优
荣耀电脑，win11增加pin码登录选项后：电脑出现问题，你的PIN不可用。请单击以重新设置 lalapanda windows
在网上看到很多人说改了自己的msconfig导致电脑重启后提示pin不可使用。而我非常悲惨的也忘记了自己的密码，指纹解锁不知道为啥被禁用了官方建议的解决方案：1.可能是网络不行，pin码需要联网验证，建议用电脑连手机热点登十分钟后再试2.有可能是电脑配置出错，（荣耀电脑按del键），来到疑难问题解答页面，按照步骤【疑难解答】➜【高级选项】➜【卸载更新】，卸载最新的更新，看看电脑是否能回到错误发生之
RESTful 是什么？一起来理解 RESTful 架构疯狂的小镪 php &mysql
传统上，软件和网络是两个不同的领域，很少有交集；软件开发主要针对单机环境，网络则主要研究系统之间的通信。互联网的兴起，使得这两个领域开始融合，即"互联网软件"，比网站、网络游戏、各种非单机版APP等，这种"互联网软件"采用客户端/服务器（C/S）模式，建立在分布式体系上，通过互联网通信，具有高延时（highlatency）、高并发等特点。那么如何开发在互联网环境中使用的软件呢？传统上，软件和网络是
RESTful API设计与实现：Java开发者指南微赚淘客机器人开发者联盟@聚娃科技 restful java python
RESTfulAPI设计与实现：Java开发者指南大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！引言RESTful（RepresentationalStateTransfer）是一种设计风格，用于构建轻量级、可扩展的网络应用程序接口（API）。在Java开发中，使用RESTful风格设计和实现API可以提升应用程序的灵活性、可维护
centos搭建 Node.js 开发环境 geejkse_seff 面试学习路线阿里巴巴 centos node.js linux
Node.js，通常简称为Node，是一个事件驱动I/O服务端JavaScript环境，基于ChromeV8引擎，具备速度快、性能强等特点，可用于搭建各类网络应用，及作为小程序后端服务环境。npm和npx都是和Node.js相关的命令行工具，它们在JavaScript开发中扮演着重要的角色。npm：1、允许开发者在项目中安装、管理和共享JavaScript包和模块；2、可以自动处理项目依赖，确保所
探索Google Serper API：实现高效的网络搜索 dfitghjk python
#探索GoogleSerperAPI：实现高效的网络搜索##引言在现代的编程和AI应用中，实时数据和信息的获取变得至关重要。GoogleSerperAPI提供了一种便捷的方式，可以在项目中集成强大的网络搜索功能。本篇文章将深入探讨如何使用GoogleSerperAPI进行不同类型的网络搜索，包括获取网页、图片、新闻、以及地理位置数据。##主要内容###1.设置GoogleSerperAPI首先，您
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&