努力努力再努力tq

深度学习|RPN网络解析

感谢转自：https://blog.csdn.net/jiongnima/article/details/79781792

1) 直接进行论文阅读：https://arxiv.org/abs/1506.01497

2) 由于Faster R-CNN先验知识很多，觉得论文阅读有困难的读者，不妨参考笔者的博客：

实例分割模型Mask R-CNN详解：从R-CNN，Fast R-CNN，Faster R-CNN再到Mask R-CNN

3) 也可以看一篇知乎上面的这一篇介绍Faster R-CNN的文章，笔者认为不错。

一文读懂Faster R-CNN

3. (非常重要)，解析的Faster R-CNN代码是tensorflow版本的，链接地址https://github.com/kevinjliang/tf-Faster-RCNN，但是有非常多的接口还是沿用的Girshick的py-faster-rcnn版本，况且对于主要模块的实现都一样。所以，请大家还是先下载对应的代码并对整个代码结构有相应了解，才能看懂整篇博客。

下面开始干货：

首先，在faster_rcnn_resnet50ish.py文件中，我们看一下训练时数据层输出的是：

# Train data
self.x['TRAIN'] = tf.placeholder(tf.float32, [1, None, None, 3]) #图片
self.im_dims['TRAIN'] = tf.placeholder(tf.int32, [None, 2]) #图像尺度 [height, width]
self.gt_boxes['TRAIN'] = tf.placeholder(tf.int32, [None, 5]) #目标框

   可以看到，输入网络的首先是图片。然后图像的宽高，因为对于不同尺寸的图像生成的anchor坐标也是不同的。最后是目标框信息，目标框信息的第二维包含五元，前四元是目标的坐标，最后一元是目标的类别。

然后，我们进入faster_rcnn_networks.py文件，可以看到rpn类，按照笔者的风格我们还是先贴出注释的源码：

# -*- coding: utf-8 -*-

"""

Created on Fri Dec 30 16:14:48 2016


@author: Kevin Liang


Faster R-CNN detection and classification networks.


Contains the Region Proposal Network (RPN), ROI proposal layer, and the RCNN.


TODO: -Split off these three networks into their own files OR add to Layers

"""


import sys


sys.path.append('../')


from Lib.TensorBase.tensorbase.base import Layers


from Lib.faster_rcnn_config import cfg

from Lib.loss_functions import rpn_cls_loss, rpn_bbox_loss, fast_rcnn_cls_loss, fast_rcnn_bbox_loss

from Lib.roi_pool import roi_pool

from Lib.rpn_softmax import rpn_softmax

from Networks.anchor_target_layer import anchor_target_layer

from Networks.proposal_layer import proposal_layer

from Networks.proposal_target_layer import proposal_target_layer


import tensorflow as tf



class rpn:

'''

Region Proposal Network (RPN): From the convolutional feature maps

(TensorBase Layers object) of the last layer, generate bounding boxes

relative to anchor boxes and give an "objectness" score to each


In evaluation mode (eval_mode==True), gt_boxes should be None.

'''


def __init__(self, featureMaps, gt_boxes, im_dims, _feat_stride, eval_mode):

self.featureMaps = featureMaps #得到共享特征

self.gt_boxes = gt_boxes #得到标签 shape: [None, 5]，记录左上角和右下角的坐标以及类别

self.im_dims = im_dims #图像尺度 shape: [None ,2]，记录图像的宽度与高度

self._feat_stride = _feat_stride #记录图像经过特征图缩小的尺度

self.anchor_scales = cfg.RPN_ANCHOR_SCALES #记录anchor的尺度 [8, 16, 32]

self.eval_mode = eval_mode #记录是训练还是测试


self._network() #执行_network函数


def _network(self):

# There shouldn't be any gt_boxes if in evaluation mode

if self.eval_mode is True: #如果是测试的话，那么就没有ground truth

assert self.gt_boxes is None, \

'Evaluation mode should not have ground truth boxes (or else what are you detecting for?)'


_num_anchors = len(self.anchor_scales)*3 #_num_anchors为9(3×3)，指一次滑动对应9个anchor


rpn_layers = Layers(self.featureMaps) #将共享特征赋给rpn_layers


with tf.variable_scope('rpn'):

# Spatial windowing

for i in range(len(cfg.RPN_OUTPUT_CHANNELS)):# 在这里先用3×3的核输出512个通道

rpn_layers.conv2d(filter_size=cfg.RPN_FILTER_SIZES[i], output_channels=cfg.RPN_OUTPUT_CHANNELS[i])


features = rpn_layers.get_output()


with tf.variable_scope('cls'):

# Box-classification layer (objectness)

self.rpn_bbox_cls_layers = Layers(features) #在这里使用1×1的核输出18(9×2)个通道

self.rpn_bbox_cls_layers.conv2d(filter_size=1, output_channels=_num_anchors*2, activation_fn=None)


with tf.variable_scope('target'): #在这里得到每个anchor对应的target

# Only calculate targets in train mode. No ground truth boxes in evaluation mode

if self.eval_mode is False:

# Anchor Target Layer (anchors and deltas)

rpn_cls_score = self.rpn_bbox_cls_layers.get_output()

self.rpn_labels, self.rpn_bbox_targets, self.rpn_bbox_inside_weights, self.rpn_bbox_outside_weights = \

anchor_target_layer(rpn_cls_score=rpn_cls_score, gt_boxes=self.gt_boxes, im_dims=self.im_dims,

_feat_stride=self._feat_stride, anchor_scales=self.anchor_scales)


with tf.variable_scope('bbox'): #在这里使用1×1的核输出36(9×4)个通道

# Bounding-Box regression layer (bounding box predictions)

self.rpn_bbox_pred_layers = Layers(features)

self.rpn_bbox_pred_layers.conv2d(filter_size=1, output_channels=_num_anchors*4, activation_fn=None)


# Get functions

def get_rpn_cls_score(self): #返回rpn网络判断的anchor前后景分数

return self.rpn_bbox_cls_layers.get_output()


def get_rpn_labels(self): #返回每个anchor属于前景还是后景的ground truth

assert self.eval_mode is False, 'No RPN labels without ground truth boxes'

return self.rpn_labels


def get_rpn_bbox_pred(self): #返回rpn判断的anchor的四个偏移值

return self.rpn_bbox_pred_layers.get_output()


def get_rpn_bbox_targets(self): #返回每个anchor对应的事实的四个偏移值

assert self.eval_mode is False, 'No RPN bounding box targets without ground truth boxes'

return self.rpn_bbox_targets


def get_rpn_bbox_inside_weights(self): #在训练计算边框误差时有用，仅对未超出图像边界的anchor有用

assert self.eval_mode is False, 'No RPN inside weights without ground truth boxes'

return self.rpn_bbox_inside_weights


def get_rpn_bbox_outside_weights(self): #在训练计算边框误差时有用，仅对未超出图像边界的anchor有用

assert self.eval_mode is False, 'No RPN outside weights without ground truth boxes'

return self.rpn_bbox_outside_weights


# Loss functions

def get_rpn_cls_loss(self): #计算rpn的分类loss

assert self.eval_mode is False, 'No RPN cls loss without ground truth boxes'

rpn_cls_score = self.get_rpn_cls_score()

rpn_labels = self.get_rpn_labels()

return rpn_cls_loss(rpn_cls_score, rpn_labels)


def get_rpn_bbox_loss(self): #计算rpn的边界损失loss，请注意在这里用到了inside和outside_weights

assert self.eval_mode is False, 'No RPN bbox loss without ground truth boxes'

rpn_bbox_pred = self.get_rpn_bbox_pred()

rpn_bbox_targets = self.get_rpn_bbox_targets()

rpn_bbox_inside_weights = self.get_rpn_bbox_inside_weights()

rpn_bbox_outside_weights = self.get_rpn_bbox_outside_weights()

return rpn_bbox_loss(rpn_bbox_pred, rpn_bbox_targets, rpn_bbox_inside_weights, rpn_bbox_outside_weights)

我们可以看一下，rpn类在训练的时候主要有两个功能，第一个是get_rpn_cls_loss计算的rpn网络分类loss，第二个是get_rpn_bbox_loss计算的rpn网络的anchor边界回归loss。那么，要计算两个loss，最难的地方是如何去获得ground truth。这个ground truth的获得是通过anchor_target_layer函数实现的，那么，我们首先来进入这个函数，按照惯例先放出源码：

# -*- coding: utf-8 -*-

"""

Created on Sun Jan 1 16:11:17 2017


@author: Kevin Liang (modifications)


Anchor Target Layer: Creates all the anchors in the final convolutional feature

map, assigns anchors to ground truth boxes, and applies labels of "objectness"


Adapted from the official Faster R-CNN repo:

https://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/rpn/anchor_target_layer.py

"""


# --------------------------------------------------------

# Faster R-CNN

# Copyright (c) 2015 Microsoft

# Licensed under The MIT License [see LICENSE for details]

# Written by Ross Girshick and Sean Bell

# --------------------------------------------------------


import sys

sys.path.append('../')


import numpy as np

import numpy.random as npr

import tensorflow as tf


from Lib.bbox_overlaps import bbox_overlaps

from Lib.bbox_transform import bbox_transform

from Lib.faster_rcnn_config import cfg

from Lib.generate_anchors import generate_anchors


#该函数计算每个anchor对应的ground truth(前景/背景，坐标偏移值)

def anchor_target_layer(rpn_cls_score, gt_boxes, im_dims, _feat_stride, anchor_scales):

'''

Make Python version of _anchor_target_layer_py below Tensorflow compatible

'''

#执行_anchor_target_layer_py函数，传参有网络预测的rpn分类分数，ground_truth_box，图像的尺寸，与原图相比特征图缩小的比例和anchor的尺度

rpn_labels,rpn_bbox_targets,rpn_bbox_inside_weights,rpn_bbox_outside_weights = \

tf.py_func(_anchor_target_layer_py, [rpn_cls_score, gt_boxes, im_dims, _feat_stride, anchor_scales],

[tf.float32, tf.float32, tf.float32, tf.float32])


#转化成tensor

rpn_labels = tf.convert_to_tensor(tf.cast(rpn_labels,tf.int32), name = 'rpn_labels')

rpn_bbox_targets = tf.convert_to_tensor(rpn_bbox_targets, name = 'rpn_bbox_targets')

rpn_bbox_inside_weights = tf.convert_to_tensor(rpn_bbox_inside_weights , name = 'rpn_bbox_inside_weights')

rpn_bbox_outside_weights = tf.convert_to_tensor(rpn_bbox_outside_weights , name = 'rpn_bbox_outside_weights')


return rpn_labels, rpn_bbox_targets, rpn_bbox_inside_weights, rpn_bbox_outside_weights



def _anchor_target_layer_py(rpn_cls_score, gt_boxes, im_dims, _feat_stride, anchor_scales):

"""

Python version


Assign anchors to ground-truth targets. Produces anchor classification

labels and bounding-box regression targets.


# Algorithm:

#

# for each (H, W) location i

# generate 9 anchor boxes centered on cell i

# apply predicted bbox deltas at cell i to each of the 9 anchors

# filter out-of-image anchors

# measure GT overlap

"""

im_dims = im_dims[0] #获得原图的尺度[height, width]

_anchors = generate_anchors(scales=np.array(anchor_scales))# 生成9个锚点，shape: [9,4]

_num_anchors = _anchors.shape[0] #_num_anchors值为9


# allow boxes to sit over the edge by a small amount

_allowed_border = 0 #将anchor超出边界的限度设置为0


# Only minibatch of 1 supported 在这里核验batch_size是否为1

assert rpn_cls_score.shape[0] == 1, \

'Only single item batches are supported'


# map of shape (..., H, W)

height, width = rpn_cls_score.shape[1:3] #在这里得到了rpn输出的H和W，总的anchor数目应该是H×W×9


# 1. Generate proposals from bbox deltas and shifted anchors

#下面是在原图上生成anchor

shift_x = np.arange(0, width) * _feat_stride #shape: [width,]

shift_y = np.arange(0, height) * _feat_stride #shape: [height,]

shift_x, shift_y = np.meshgrid(shift_x, shift_y) #生成网格 shift_x shape: [height, width], shift_y shape: [height, width]

shifts = np.vstack((shift_x.ravel(), shift_y.ravel(),

shift_x.ravel(), shift_y.ravel())).transpose() # shape[height*width, 4]


# add A anchors (1, A, 4) to

# cell K shifts (K, 1, 4) to get

# shift anchors (K, A, 4)

# reshape to (K*A, 4) shifted anchors

A = _num_anchors # A = 9

K = shifts.shape[0] # K=height*width(特征图上的)

all_anchors = (_anchors.reshape((1, A, 4)) +

shifts.reshape((1, K, 4)).transpose((1, 0, 2))) #shape[K,A,4] 得到所有的anchor

all_anchors = all_anchors.reshape((K * A, 4))

total_anchors = int(K * A) #total_anchors记录anchor的数目


# anchors inside the image inds_inside所有的anchor中没有超过图像边界的

inds_inside = np.where(

(all_anchors[:, 0] >= -_allowed_border) &

(all_anchors[:, 1] >= -_allowed_border) &

(all_anchors[:, 2] < im_dims[1] + _allowed_border) & # width

(all_anchors[:, 3] < im_dims[0] + _allowed_border) # height

)[0]


# keep only inside anchors

anchors = all_anchors[inds_inside, :]#在这里选出合理的anchors，指的是没超出边界的


# label: 1 is positive, 0 is negative, -1 is dont care

labels = np.empty((len(inds_inside), ), dtype=np.float32)#labels的长度就是合法的anchor的个数

labels.fill(-1) #先用-1填充labels


# overlaps between the anchors and the gt boxes

# overlaps (ex, gt)

#对所有的没超过图像边界的anchor计算overlap，得到的shape: [len(anchors), len(gt_boxes)]

overlaps = bbox_overlaps(

np.ascontiguousarray(anchors, dtype=np.float),

np.ascontiguousarray(gt_boxes, dtype=np.float))

argmax_overlaps = overlaps.argmax(axis=1) #对于每个anchor，找到对应的gt_box坐标。shape: [len(anchors),]

max_overlaps = overlaps[np.arange(len(inds_inside)), argmax_overlaps] #对于每个anchor，找到最大的overlap的gt_box shape: [len(anchors)]

gt_argmax_overlaps = overlaps.argmax(axis=0) #对于每个gt_box，找到对应的最大overlap的anchor。shape[len(gt_boxes),]

gt_max_overlaps = overlaps[gt_argmax_overlaps,

np.arange(overlaps.shape[1])]#对于每个gt_box，找到与anchor的最大IoU值。shape[len(gt_boxes),]

gt_argmax_overlaps = np.where(overlaps == gt_max_overlaps)[0]#再次对于每个gt_box，找到对应的最大overlap的anchor。shape[len(gt_boxes),]


if not cfg.TRAIN.RPN_CLOBBER_POSITIVES: #如果不需要抑制positive的anchor，就先给背景anchor赋值，这样在赋前景值的时候可以覆盖。

# assign bg labels first so that positive labels can clobber them

labels[max_overlaps < cfg.TRAIN.RPN_NEGATIVE_OVERLAP] = 0 #在这里将最大IoU仍然小于阈值(0.3)的某些anchor置0


# fg label: for each gt, anchor with highest overlap

labels[gt_argmax_overlaps] = 1 #在这里将每个gt_box对应IoU最大的anchor置1


# fg label: above threshold IOU

labels[max_overlaps >= cfg.TRAIN.RPN_POSITIVE_OVERLAP] = 1 #在这里将最大IoU大于阈值(0.7)的某些anchor置1


if cfg.TRAIN.RPN_CLOBBER_POSITIVES: #如果需要抑制positive的anchor，就将背景anchor后赋值

# assign bg labels last so that negative labels can clobber positives

labels[max_overlaps < cfg.TRAIN.RPN_NEGATIVE_OVERLAP] = 0 #在这里将最大IoU仍然小于阈值(0.3)的某些anchor置0


# subsample positive labels if we have too many

num_fg = int(cfg.TRAIN.RPN_FG_FRACTION * cfg.TRAIN.RPN_BATCHSIZE)#计算出一个训练batch中需要的前景的数量

fg_inds = np.where(labels == 1)[0] #找出被置为前景的anchors

if len(fg_inds) > num_fg:

disable_inds = npr.choice(

fg_inds, size=(len(fg_inds) - num_fg), replace=False)

labels[disable_inds] = -1 #如果事实存在的前景anchor大于了所需值，就随机抛弃一些前景anchor


# subsample negative labels if we have too many

num_bg = cfg.TRAIN.RPN_BATCHSIZE - np.sum(labels == 1) ##计算出一个训练batch中需要的背景的数量

bg_inds = np.where(labels == 0)[0] #找出被置为背景的anchors

if len(bg_inds) > num_bg:

disable_inds = npr.choice(

bg_inds, size=(len(bg_inds) - num_bg), replace=False)

labels[disable_inds] = -1 #如果事实存在的背景anchor大于了所需值，就随机抛弃一些背景anchor


# bbox_targets: The deltas (relative to anchors) that Faster R-CNN should

# try to predict at each anchor

# TODO: This "weights" business might be deprecated. Requires investigation

#返回的是，对于每个anchor，得到四个坐标变换值(tx,ty,th,tw)。

bbox_targets = np.zeros((len(inds_inside), 4), dtype=np.float32) #对每个在原图内部的anchor,用全0初始化坐标变换值

bbox_targets = _compute_targets(anchors, gt_boxes[argmax_overlaps, :]) #对于每个anchor，找到变换到对应的最大的overlap的gt_box的四个值


bbox_inside_weights = np.zeros((len(inds_inside), 4), dtype=np.float32) #使用全0初始化inside_weights

bbox_inside_weights[labels == 1, :] = np.array(cfg.TRAIN.RPN_BBOX_INSIDE_WEIGHTS) #在前景anchor处赋权重


bbox_outside_weights = np.zeros((len(inds_inside), 4), dtype=np.float32) #使用全0初始化outside_weights

if cfg.TRAIN.RPN_POSITIVE_WEIGHT < 0: #如果RPN_POSITIVE_WEIGHT小于0的话，

# uniform weighting of examples (given non-uniform sampling)

num_examples = np.sum(labels >= 0)

positive_weights = np.ones((1, 4)) * 1.0 / num_examples #则positive_weights和negative_weights都一样

negative_weights = np.ones((1, 4)) * 1.0 / num_examples

else:

assert ((cfg.TRAIN.RPN_POSITIVE_WEIGHT > 0) &

(cfg.TRAIN.RPN_POSITIVE_WEIGHT < 1)) #如果RPN_POSITIVE_WEIGHT位于0和1之间的话，

positive_weights = (cfg.TRAIN.RPN_POSITIVE_WEIGHT /

np.sum(labels == 1))

negative_weights = ((1.0 - cfg.TRAIN.RPN_POSITIVE_WEIGHT) /

np.sum(labels == 0)) #则positive_weights和negative_weights分别赋值

bbox_outside_weights[labels == 1, :] = positive_weights

bbox_outside_weights[labels == 0, :] = negative_weights #将positive_weights和negative_weights赋给bbox_outside_weights


# map up to original set of anchors

labels = _unmap(labels, total_anchors, inds_inside, fill=-1)#把图像内部的anchor对应的label映射回总的anchor(加上了那些超出边界的anchor，类别填充-1)

bbox_targets = _unmap(bbox_targets, total_anchors, inds_inside, fill=0)#把图像内部的anchor对应的bbox_target映射回所有的anchor(加上了那些超出边界的anchor，填充0)

bbox_inside_weights = _unmap(bbox_inside_weights, total_anchors, inds_inside, fill=0) #把图像内部的anchor对应的inside_weights映射回总的anchor(加上了那些超出边界的anchor，填充0)

bbox_outside_weights = _unmap(bbox_outside_weights, total_anchors, inds_inside, fill=0) #把图像内部的anchor对应的outside_weights映射回总的anchor(加上了那些超出边界的anchor，填充0)


# labels

labels = labels.reshape((1, height, width, A)).transpose(0, 3, 1, 2)

labels = labels.reshape((1, 1, A * height, width)) #将anchor的类别label数组形状置为[1,1,9*height,width]

rpn_labels = labels


# bbox_targets

rpn_bbox_targets = bbox_targets.reshape((1, height, width, A * 4)).transpose(0, 3, 1, 2) #将anchor的位置映射数组的形状置为[1,9*4,height,width]


# bbox_inside_weights

rpn_bbox_inside_weights = bbox_inside_weights.reshape((1, height, width, A * 4)).transpose(0, 3, 1, 2) #将anchor的inside_weights数组的形状置为[1,9*4,height,width]


# bbox_outside_weights

rpn_bbox_outside_weights = bbox_outside_weights.reshape((1, height, width, A * 4)).transpose(0, 3, 1, 2) #将anchor的outside_weights数组的形状置为[1,9*4,height,width]


return rpn_labels,rpn_bbox_targets,rpn_bbox_inside_weights,rpn_bbox_outside_weights #返回所有的ground truth值



def _unmap(data, count, inds, fill=0): #_unmap函数将图像内部的anchor映射回到生成的所有的anchor

""" Unmap a subset of item (data) back to the original set of items (of

size count) """

if len(data.shape) == 1:

ret = np.empty((count, ), dtype=np.float32)

ret.fill(fill)

ret[inds] = data

else:

ret = np.empty((count, ) + data.shape[1:], dtype=np.float32)

ret.fill(fill)

ret[inds, :] = data

return ret


def _compute_targets(ex_rois, gt_rois): #_compute_targets函数计算anchor和对应的gt_box的位置映射

"""Compute bounding-box regression targets for an image."""


assert ex_rois.shape[0] == gt_rois.shape[0]

assert ex_rois.shape[1] == 4

assert gt_rois.shape[1] == 5


return bbox_transform(ex_rois, gt_rois[:, :4]).astype(np.float32, copy=False)

anchor_target_layer函数主要还是调用了_anchor_target_layer_py函数，然后将输出转化为tensor。下面，我们就来仔细分析一下_anchor_target_layer_py函数。在该函数中，首先通过generate_anchors函数生成了9个候选框，然后按照在共享特征上每滑动一次对应到原图的位置生成候选框，即all_anchors。紧接着，排除了全部边框超过图像边界的候选框，得到anchors，之后的操作都是针对图像内部的anchors。然后，通过bbox_overlaps函数计算了所有边界内anchor与包围框之间的IoU值。接着，排除了IoU在0.3到0.7之间的anchor(通过将labels对应的值置为-1)，并且为训练安排了合适数量的前景anchor和背景anchor。然后，通过_compute_targets函数计算出了每个anchor对应的坐标变换值(tx,ty,th,tw)，存在bbox_targets数组里面。再计算了bbox_inside_weights和bbox_outside_weights，这两个数组在训练anchor边框修正时有重大作用。最后，通过_unmap函数将所有图像边框内部的anchor映射回所有的anchor。

笔者朋友们初看上面的解析可能觉得有些混乱，请不要着急。anchor_target_layer主要就是为了得到两个东西，第一个东西是对应的一张图像生成的anchor的类别，在训练时需要赋予一定数量的正样本(前景)和一定数量的负样本(背景)，其余的需要全部置成-1，表示训练的时候会忽略掉。第二个东西是对于每一个anchor的边框修正，在进行边框修正loss的计算时，只有前景anchor会起作用，可以看到这是bbox_inside_weights和bbox_outside_weights在实现。非前景和背景anchor对应的bbox_inside_weights和bbox_outside_weights都为0。

在anchor_target_layer函数中，有几个比较重要的函数，第一个函数就是generate_anchors，这个函数的主要作用是生成9个anchor，包含3种长宽比和3种面积。源代码及注释如下：

# -*- coding: utf-8 -*-

"""

Created on Sun Jan 1 16:11:17 2017


@author: Kevin Liang (modifications)


generate_anchors and supporting functions: generate reference windows (anchors)

for Faster R-CNN. Specifically, it creates a set of k (default of 9) relative

coordinates. These references will be added on to all positions of the final

convolutional feature maps.


Adapted from the official Faster R-CNN repo:

https://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/rpn/generate_anchors.py


Note: the produced anchors have indices off by 1 of what the comments claim.

Probably due to MATLAB being 1-indexed, while Python is 0-indexed.

"""


# --------------------------------------------------------

# Faster R-CNN

# Copyright (c) 2015 Microsoft

# Licensed under The MIT License [see LICENSE for details]

# Written by Ross Girshick and Sean Bell

# --------------------------------------------------------


import numpy as np


# Verify that we compute the same anchors as Shaoqing's matlab implementation:

#

# >> load output/rpn_cachedir/faster_rcnn_VOC2007_ZF_stage1_rpn/anchors.mat

# >> anchors

#

# anchors =

#

# -83 -39 100 56

# -175 -87 192 104

# -359 -183 376 200

# -55 -55 72 72

# -119 -119 136 136

# -247 -247 264 264

# -35 -79 52 96

# -79 -167 96 184

# -167 -343 184 360


#array([[ -83., -39., 100., 56.],

# [-175., -87., 192., 104.],

# [-359., -183., 376., 200.],

# [ -55., -55., 72., 72.],

# [-119., -119., 136., 136.],

# [-247., -247., 264., 264.],

# [ -35., -79., 52., 96.],

# [ -79., -167., 96., 184.],

# [-167., -343., 184., 360.]])


def generate_anchors(base_size=16, ratios=[0.5, 1, 2],

scales=2**np.arange(3, 6)):

"""

Generate anchor (reference) windows by enumerating aspect ratios X

scales wrt a reference (0, 0, 15, 15) window.

"""

#请注意anchor的表示形式有两种，一种是记录左上角和右下角的坐标，一种是记录中心坐标和宽高

#这里生成一个基准anchor，采用左上角和右下角的坐标表示[0,0,15,15]

base_anchor = np.array([1, 1, base_size, base_size]) - 1 #[0,0,15,15]

ratio_anchors = _ratio_enum(base_anchor, ratios) #shape: [3,4]，返回的是不同长宽比的anchor

anchors = np.vstack([_scale_enum(ratio_anchors[i, :], scales)

for i in range(ratio_anchors.shape[0])])#生成九个候选框 shape: [9,4]

return anchors


def _whctrs(anchor):#传入anchor的左上角和右下角的坐标，返回anchor的中心坐标和长宽

"""

Return width, height, x center, and y center for an anchor (window).

"""


w = anchor[2] - anchor[0] + 1

h = anchor[3] - anchor[1] + 1

x_ctr = anchor[0] + 0.5 * (w - 1)

y_ctr = anchor[1] + 0.5 * (h - 1)

return w, h, x_ctr, y_ctr


def _mkanchors(ws, hs, x_ctr, y_ctr):#由anchor中心和长宽坐标返回window，记录左上角和右下角的坐标

"""

Given a vector of widths (ws) and heights (hs) around a center

(x_ctr, y_ctr), output a set of anchors (windows).

"""


ws = ws[:, np.newaxis] #shape: [3,1]

hs = hs[:, np.newaxis] #shape: [3,1]

anchors = np.hstack((x_ctr - 0.5 * (ws - 1),

y_ctr - 0.5 * (hs - 1),

x_ctr + 0.5 * (ws - 1),

y_ctr + 0.5 * (hs - 1)))

return anchors #shape [3,4]，对于每个anchor，返回了左上角和右下角的坐标值


def _ratio_enum(anchor, ratios): #这个函数计算不同长宽尺度下的anchor的坐标

"""

Enumerate a set of anchors for each aspect ratio wrt an anchor.

"""


w, h, x_ctr, y_ctr = _whctrs(anchor) #找到anchor的中心点和长宽

size = w * h #返回anchor的面积

size_ratios = size / ratios #为了计算anchor的长宽尺度设置的数组：array([512.,256.,128.])

ws = np.round(np.sqrt(size_ratios)) #计算不同长宽比下的anchor的宽：array([23.,16.,11.])

hs = np.round(ws * ratios) #计算不同长宽比下的anchor的长 array([12.,16.,22.])

#请大家注意，对应位置上ws和hs相乘，面积都为256左右

anchors = _mkanchors(ws, hs, x_ctr, y_ctr)#返回新的不同长宽比的anchor 返回的数组shape:[3,4]，请注意anchor记录的是左上角和右下角的坐标

return anchors


def _scale_enum(anchor, scales): #这个函数对于每一种长宽比的anchor，计算不同面积尺度的anchor坐标

"""

Enumerate a set of anchors for each scale wrt an anchor.

"""


w, h, x_ctr, y_ctr = _whctrs(anchor) #找到anchor的中心坐标

ws = w * scales #shape [3,] 得到不同尺度的新的宽

hs = h * scales #shape [3,] 得到不同尺度的新的高

anchors = _mkanchors(ws, hs, x_ctr, y_ctr) #得到不同面积尺度的anchor信息，对应的是左上角和右下角的坐标

return anchors


if __name__ == '__main__':

import time

t = time.time()

a = generate_anchors()

print(time.time() - t)

print(a)

from IPython import embed; embed()

在上面的代码中，主要的原理就是最开始生成一个基准anchor。然后，通过这个基准anchor生成三个不同长宽比，面积一样的anchor。最后，对每个长宽比anchor生成三个不同面积尺度的anchor，最终生成9个anchor，详情请见代码注释。

第二个重要的函数，是bbox_overlaps函数，这个函数对于每一个anchor，和所有的ground truth box计算IoU值，代码如下：

# -*- coding: utf-8 -*-

"""

Created on Sun Jan 1 20:25:19 2017


@author: Kevin Liang (modification)


Calculates bounding box overlaps between N bounding boxes, and K query boxes

(anchors) and return a matrix of overlap proportions


Written in Cython for optimization.

"""

# --------------------------------------------------------

# Fast R-CNN

# Copyright (c) 2015 Microsoft

# Licensed under The MIT License [see LICENSE for details]

# Written by Sergey Karayev

# --------------------------------------------------------


cimport cython

import numpy as np

cimport numpy as np


DTYPE = np.float

ctypedef np.float_t DTYPE_t


def bbox_overlaps(#计算重合程度，两个框之间的重合区域的面积 / 两个区域一共加起来的面积

np.ndarray[DTYPE_t, ndim=2] boxes,

np.ndarray[DTYPE_t, ndim=2] query_boxes):

"""

Parameters

----------

boxes: (N, 4) ndarray of float

query_boxes: (K, 4) ndarray of float

Returns

-------

overlaps: (N, K) ndarray of overlap between boxes and query_boxes

"""

cdef unsigned int N = boxes.shape[0]

cdef unsigned int K = query_boxes.shape[0]

cdef np.ndarray[DTYPE_t, ndim=2] overlaps = np.zeros((N, K), dtype=DTYPE)

cdef DTYPE_t iw, ih, box_area

cdef DTYPE_t ua

cdef unsigned int k, n

for k in range(K):

box_area = (

(query_boxes[k, 2] - query_boxes[k, 0] + 1) *

(query_boxes[k, 3] - query_boxes[k, 1] + 1)

)

for n in range(N):

iw = (

min(boxes[n, 2], query_boxes[k, 2]) -

max(boxes[n, 0], query_boxes[k, 0]) + 1

)

if iw > 0:

ih = (

min(boxes[n, 3], query_boxes[k, 3]) -

max(boxes[n, 1], query_boxes[k, 1]) + 1

)

if ih > 0:

ua = float(

(boxes[n, 2] - boxes[n, 0] + 1) *

(boxes[n, 3] - boxes[n, 1] + 1) +

box_area - iw * ih

)

overlaps[n, k] = iw * ih / ua

return overlaps

第三个重要的部分是，在计算anchor的坐标变换值的时候，使用到了bbox_transform函数，请注意在计算坐标变换的时候是将anchor的表示形式变成中心坐标与长宽。该函数代码及注释如下所示：

# -*- coding: utf-8 -*-

"""

Created on Sun Jan 1 21:18:58 2017


@author: Kevin Liang (modifications)


bbox_transform and its inverse operation

"""


# --------------------------------------------------------

# Fast R-CNN

# Copyright (c) 2015 Microsoft

# Licensed under The MIT License [see LICENSE for details]

# Written by Ross Girshick

# --------------------------------------------------------


import numpy as np


def bbox_transform(ex_rois, gt_rois):

'''

Receives two sets of bounding boxes, denoted by two opposite corners

(x1,y1,x2,y2), and returns the target deltas that Faster R-CNN should aim

for.

'''

ex_widths = ex_rois[:, 2] - ex_rois[:, 0] + 1.0

ex_heights = ex_rois[:, 3] - ex_rois[:, 1] + 1.0

ex_ctr_x = ex_rois[:, 0] + 0.5 * ex_widths

ex_ctr_y = ex_rois[:, 1] + 0.5 * ex_heights #计算得到每个anchor的中心坐标和长宽


gt_widths = gt_rois[:, 2] - gt_rois[:, 0] + 1.0

gt_heights = gt_rois[:, 3] - gt_rois[:, 1] + 1.0

gt_ctr_x = gt_rois[:, 0] + 0.5 * gt_widths

gt_ctr_y = gt_rois[:, 1] + 0.5 * gt_heights #计算每个anchor对应的ground truth box对应的中心坐标和长宽


targets_dx = (gt_ctr_x - ex_ctr_x) / ex_widths #计算四个坐标变换值

targets_dy = (gt_ctr_y - ex_ctr_y) / ex_heights

targets_dw = np.log(gt_widths / ex_widths)

targets_dh = np.log(gt_heights / ex_heights)


targets = np.vstack(

(targets_dx, targets_dy, targets_dw, targets_dh)).transpose()#对于每一个anchor，得到四个关系值 shape: [4, num_anchor]

return targets

到这里，anchor_target_layers解析就完成了。这是rpn源码中最重要的函数之一，因为会返回所有anchor对应的类别和对应的边框修正值，方便在计算loss时计算。顺便提供一下计算rpn的loss的函数，代码及注释如下所示：

#!/usr/bin/env python3

# -*- coding: utf-8 -*-

"""

Created on Tue Jan 17 15:05:05 2017


@author: Kevin Liang


Loss functions

"""


from .faster_rcnn_config import cfg


import tensorflow as tf



def rpn_cls_loss(rpn_cls_score,rpn_labels):

'''

Calculate the Region Proposal Network classifier loss. Measures how well

the RPN is able to propose regions by the performance of its "objectness"

classifier.


Standard cross-entropy loss on logits

'''

with tf.variable_scope('rpn_cls_loss'):

# input shape dimensions

shape = tf.shape(rpn_cls_score)


# Stack all classification scores into 2D matrix

rpn_cls_score = tf.transpose(rpn_cls_score,[0,3,1,2])

rpn_cls_score = tf.reshape(rpn_cls_score,[shape[0],2,shape[3]//2*shape[1],shape[2]])

rpn_cls_score = tf.transpose(rpn_cls_score,[0,2,3,1])

rpn_cls_score = tf.reshape(rpn_cls_score,[-1,2])


# Stack labels

rpn_labels = tf.reshape(rpn_labels,[-1]) #在这里先讲label展开成one_hot向量


# Ignore label=-1 (Neither object nor background: IoU between 0.3 and 0.7)

#在这里对应label中为-1值的位置排除掉score中的值，并且变成[-1,2]的形状方便计算交叉熵loss

rpn_cls_score = tf.reshape(tf.gather(rpn_cls_score,tf.where(tf.not_equal(rpn_labels,-1))),[-1,2])

#在这里留下label中的非-1的值，表示对应的anchor与gt的IoU在0.7以上

rpn_labels = tf.reshape(tf.gather(rpn_labels,tf.where(tf.not_equal(rpn_labels,-1))),[-1])


# Cross entropy error 在这里计算交叉熵loss

rpn_cross_entropy = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=rpn_cls_score, labels=rpn_labels))


return rpn_cross_entropy



def rpn_bbox_loss(rpn_bbox_pred, rpn_bbox_targets, rpn_inside_weights, rpn_outside_weights):

'''

Calculate the Region Proposal Network bounding box loss. Measures how well

the RPN is able to propose regions by the performance of its localization.


lam/N_reg * sum_i(p_i^* * L_reg(t_i,t_i^*))


lam: classification vs bbox loss balance parameter

N_reg: Number of anchor locations (~2500)

p_i^*: ground truth label for anchor (loss only for positive anchors)

L_reg: smoothL1 loss

t_i: Parameterized prediction of bounding box

t_i^*: Parameterized ground truth of closest bounding box

'''

with tf.variable_scope('rpn_bbox_loss'):

# Transposing

rpn_bbox_targets = tf.transpose(rpn_bbox_targets, [0,2,3,1])

rpn_inside_weights = tf.transpose(rpn_inside_weights, [0,2,3,1])

rpn_outside_weights = tf.transpose(rpn_outside_weights, [0,2,3,1])


# How far off was the prediction?

#在这里将预测的tx,ty,th,tw和标签做减法，并乘以rpn_inside_weights，意思是只对positive anchor计算bbox loss

diff = tf.multiply(rpn_inside_weights, rpn_bbox_pred - rpn_bbox_targets)

#在这里计算smooth_L1结果

diff_sL1 = smoothL1(diff, 3.0)


# Only count loss for positive anchors. Make sure it's a sum.

#在这里将上面的运算结果乘以rpn_outside_weights并且求和，同样是只对positive anchor计算bbox loss


rpn_bbox_reg = tf.reduce_sum(tf.multiply(rpn_outside_weights, diff_sL1))


# Constant for weighting bounding box loss with classification loss

#在这里将边框误差再乘以一个lambda参数，作为最终的边框误差

rpn_bbox_reg = cfg.TRAIN.RPN_BBOX_LAMBDA * rpn_bbox_reg


return rpn_bbox_reg #返回最终的误差

如上函数所示，在计算rpn_cls_loss的时候，排除掉了label中对应值为-1的值，也就是说，只保留了图像边界内的与ground truth box最大IoU在0.7以上或者0.3以下的anchor。在计算rpn_bbox_loss的时候，从最开始乘以rpn_inside_weights来看，只计算了前景anchor的bbox loss，因为其余非前景anchor对应的rpn_inside_weights都为0。

到此为止，Faster R-CNN的RPN代码就接近尾声了。RPN代码中比较巧妙的部分笔者认为有如下两个：

1) 如何生成H×W×9个anchor：做法是先生成9个不同长宽比不同面积anchor，然后在图上各个滑动区域上都生成这9个anchor。

2) 如何计算每个anchor的类别(前景背景)和边框变换值。做法是首先为每个anchor计算与ground truth box对应的IoU值，排除IoU为0.3~0.7的anchor。0.3以下的为背景anchor，0.7以上的为前景anchor。对于边框变化值，是计算的anchor与IoU重合最大的ground truth box对应的tx,ty,th,tw四个值。

参考：https://blog.csdn.net/jiongnima/article/details/79781792

你可能感兴趣的:(DL)

协程举例学习小李飞飞砖学习
在Android开发中，协程（Coroutines）是处理异步操作的一种强大工具。它们可以帮助你以一种更简洁、更易于维护的方式编写异步代码。从AndroidKotlin协程的稳定版本开始，你可以通过kotlinx.coroutines库来使用协程。下面是一些使用协程的基本示例。添加依赖首先，确保你的build.gradle文件中已经添加了kotlinx.coroutines的依赖：dependen
React-forwardRef-useImperativeHandle 前端小趴菜05 react.js vue.js 前端
forwardRef暴露dom节点作用：使用ref暴露DOM节点给父组件案例例如在父组件中想要获取子组件input的输入值，和让input获取焦点父组件import{Button}from'antd-mobile'importSonfrom"./components/son";import{useState,useRef}from"react";constYear=()=>{constinputR
【LeetCode 热题 100】21. 合并两个有序链表——（解法一）迭代法 xumistore LeetCode leetcode 链表算法 java
Problem:21.合并两个有序链表题目：将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。文章目录整体思路完整代码时空复杂度时间复杂度：O(M+N)空间复杂度：O(1)整体思路这段代码旨在解决一个基础且经典的链表问题：合并两个有序链表(MergeTwoSortedLists)。问题要求将两个已按升序排列的链表合并为一个新的、仍然保持升序的链表。该算法采
使用 Docker 部署 Spring Boot 项目流程 hoho不爱喝酒随便写写 docker spring boot 容器运维 linux
文章目录使用Docker部署SpringBoot项目流程1.构建SpringBoot项目使用Maven构建项目：使用Gradle构建项目：2.创建Dockerfile示例Dockerfile：解释：3.构建Docker镜像4.运行Docker容器5.查看容器日志6.管理Docker容器查看正在运行的容器：停止容器：删除容器：删除镜像：7.访问SpringBoot应用总结使用Docker部署Spri
Linux部署MinIO与Spring Boot整合实战指南 luoqinqin linux spring boot 运维
一、MinIO简介与核心概念MinIO是一款高性能的分布式对象存储服务，兼容AmazonS3API，适用于存储图片、文档等非结构化数据。核心术语：Bucket：存储对象的容器（类似文件夹）Object：存储的基本单元（文件+元数据）AccessKey/SecretKey：身份验证凭证二、Linux环境MinIO部署1.单节点安装#下载二进制文件wgethttps://dl.min.io/serve
【LeetCode 热题 100】142. 环形链表 II——快慢指针 xumistore LeetCode leetcode 链表算法 java
Problem:142.环形链表II题目：给定一个链表的头节点head，返回链表开始入环的第一个节点。如果链表无环，则返回null。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个比“判断环形链表”更进阶的问题：环形链表II(LinkedListCycleII)。问题不仅要求判断链表中是否存在环，还要求找到环的入口节点。如果不存在环，则返回nu
21.合并两个有序链表太白IT记算法题链表数据结构
将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。思路：这里使用的主要数据结构是单链表。该算法采用经典的双指针技术来合并列表。Adummynodeiscreated;thisnodedoesnotholdanymeaningfulvaluebutservesasthestartingpointofthemergedlinkedlist.将创建一个虚拟节点;
Android逆向工具简单介绍 @ZhangJun Android 进阶 Android逆向反编译反汇编 Hook
目录一、Android逆向概述1、什么是Android逆向2、逆向过程3、逆向用途1）APP自动化执行程序脚本2）修改APP的功能3）APP安全二、常用逆向工具介绍1、APP抓包工具1）Fiddler2）Wireshark2、jadx反编译工具3、APKDB4、Frida之Hook工具5、IDA反汇编工具1）为何反汇编2）如何反汇编3）IDAPro的基本功能：4）IDA目录结构5）常用快捷键6）常
接口服务类安全测试（WSDL） @Camelus 渗透与攻防安全 java web安全
目录前言：（一）API接口WSDL判断方法漏洞关键字端口号端口说明攻击技巧总结：前言：根据前期信息收集针对目标端口服务类探针后进行的安全测试，主要涉及攻击方法：口令安全，WEB类漏洞，版本漏洞等，其中产生的危害可大可小，属于端口服务/第三方服务类安全测试。一般在已知应用无思路的情况下选用的安全测试方案。（一）API接口webserviceRESfulAPThttps://xz.aliyun.com
「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践 cooldream2009 大模型基础 AI技术文心大模型 FastDeploy
目录前言1环境准备与依赖安装1.1硬件要求1.2Python环境与pip升级2下载ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU版本3.2安装FastDeploy-GPU4启动ERNIE-4.5本地服务4.1启动OpenAI兼容API服务4
《解决 Idea Gradle Build 中 Build Tools 相关问题》只因在人海中多看了你一眼摸索学习心得 ide android studio
在使用IntelliJIDEA进行Android项目开发时，最近在执行Gradlebuild过程中遇到了一个棘手的问题：问题现象在运行Gradlebuild时，出现了这样的错误提示：Couldnotdeterminethedependenciesoftask‘:app:compileReleaseJavaWithJavac’.InstalledBuildToolsrevision35.0.0isc
Unity UGUI GraphicRaycaster.Raycast详解上班摸鱼君 unity 游戏引擎
一、源码//////对当前Canvas上的所有可交互UI图形执行射线检测，判断是否被点击或触碰。//////指针事件的数据（包含鼠标位置、触摸点等）///用于存储命中的UI元素结果列表publicoverridevoidRaycast(PointerEventDataeventData,ListresultAppendList){//如果Canvas不存在，则无法进行任何UI检测，直接返回if(c
面试题 02.06 回文链表 qxwithlsy leetcode
1.普通版把链表的每个值存储在数组中，然后从链表两端向中间挨个对比，如果有不等的，就返回false。/***Definitionforsingly-linkedlist.*structListNode{*intval;*structListNode*next;*};*/boolisPalindrome(structListNode*head){//快慢指针？先找到中间位置，然后一个从中间开始，新建
Ubuntu 20.04安装FlClash 墨玦子 ubuntu linux 运维
1、下载好安装包使用sudodpkg-ixxx.deb安装好flclash2、终端输入FlClash，会遇到如下的问题，并附上解决方法（1）FlClash:errorwhileloadingsharedlibraries:libkeybinder-3.0.so.0:cannotopensharedobjectfile:Nosuchfileordirectory解决方法：sudoapt-getins
Wordless: 一个周末打造的小爆游戏 node.jsreact
这个项目是什么Wordless就是个类似Wordle的猜单词游戏，用Next.js搭建的。玩家有6次机会猜出单词，支持3到8个字母的单词。说实话，开始只是想做点跟wordle不一样东西，没想到做着做着就越来越有意思了。点击这里可以体验：https://wordless.online/我用了一个周末把代码撸完以后，直接发布上线，也没怎么关注，没想到几个月过去了，这个小游戏的流量一直很稳定，有50%的
RocketMQ-on-DLedge自动容灾切换集群搭建学亮编程手记后台编程 rocketmq
DledgerDledger快速搭建前言DLedger是一套基于Raft协议的分布式日志存储组件，部署RocketMQ时可以根据需要选择使用DLeger来替换原生的副本存储机制。本文档主要介绍如何快速构建和部署基于DLedger的可以自动容灾切换的RocketMQ集群。1.源码构建构建分为两个部分，需要先构建DLedger，然后构建RocketMQ。1.1构建DLedger$gitclonehtt
游戏引擎开发与实战案例喜欢编程就关注我游戏引擎开发实战实战案例代码
游戏引擎开发与实战案例摘要本文聚焦游戏引擎开发，涵盖核心架构、关键技术及实战案例。通过剖析引擎架构、物理引擎、图形渲染、资源管理等，结合C++与SDL、LibGDX等框架的代码示例，助力开发者掌握引擎开发精髓，提升实战能力。关键词：游戏引擎开发；物理引擎；图形渲染；资源管理一、引言游戏引擎作为游戏开发的核心工具，对游戏性能、画面表现及开发效率起着决定性作用。掌握游戏引擎开发技术，能使开发者更自由地
关于 JNI 函数逆向（从 Java 到 native） shenyan~ java 开发语言
一、JNI基础概念JNI（JavaNativeInterface）是Java调用native层C/C++函数的桥梁。在Android中，Java使用System.loadLibrary("xxx")加载so文件，然后通过native方法声明调用底层函数。publicclassTest{static{System.loadLibrary("native-lib");//加载native-lib.so
C++goto；与break；continue区别
goto就是跳过，一般是FLAGgoto；......(这部分就不执行)goto:#includeusingnamespacestd;intmain(){cout<<"a1"<
美团Android开发200道面试题及参考答案（下）大模型大数据攻城狮 android java jvm内存 jvm调优安卓面经安卓面试信号量
单例模式中的双锁机制，分别起到了什么作用在单例模式的双重检查锁定（DCL，DoubleCheckedLocking）机制中，涉及到两重“锁”相关的操作，各自有着重要作用。首先是外层的同步锁，也就是synchronized关键字修饰的代码块部分。它的主要作用是控制在多线程环境下，同一时刻只有一个线程能够进入到创建单例对象实例的关键代码区域。当多个线程同时调用getInstance方法尝试获取单例对象
【PaddleOCR】快速集成 PP-OCRv5 的 Python 实战秘籍--- 实例化 OCR 对象的 predict() 方法介绍
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
Redis面试通关秘籍：从缓存穿透到分布式锁的深度剖析码海漫游者8 缓存 redis 面试
文章目录前言：为什么Redis总是面试必考题？（灵魂拷问）一、Redis持久化：RDB和AOF的相爱相杀1.1RDB快照原理（画重点）1.2AOF日志的生存之道二、缓存三大杀手：穿透/击穿/雪崩（死亡三连问）2.1缓存穿透攻防战2.2缓存击穿应急预案2.3雪崩灾难现场还原三、Redis分布式锁的六大陷阱（血泪教训）3.1经典错误示范3.2正确姿势（Redlock算法）3.3时钟漂移的致命影响四、高
PaddleOCR 3.0全面解析：五大核心能力与实战应用指南经优英
PaddleOCR3.0全面解析：五大核心能力与实战应用指南PaddleOCRAwesomemultilingualOCRtoolkitsbasedonPaddlePaddle(practicalultralightweightOCRsystem,support80+languagesrecognition,providedataannotationandsynthesistools,suppor
Gradle 与 Maven 的深度对比分析
一、核心架构与设计哲学对比1.依赖管理机制维度GradleMaven声明语法Groovy/KotlinDSL（类型安全）XML（结构严谨，可读性低）动态版本支持2.5.+动态匹配仅支持固定版本（需-U强制更新）依赖作用域implementation/api精细控制compile/provided/test标准隔离冲突解决自动选择最高版本（可覆写）最短路径优先（需手动排除）Gradle优势：避免传递
恶搞锁屏软件
这是一个打包好的锁屏程序适用于恶搞同学老师密码在软件里使用此软件使电脑发生任何问题与作者无关！！！！！下载链接-迅雷编辑https://pan.xunlei.com/s/VOUZN96XqftxLLdlNjbtnmX-A1?pwd=fm4ahttps://pan.xunlei.com/s/VOUZN96XqftxLLdlNjbtnmX-A1?pwd=fm4a下载链接-百度编辑https://pan
容器基础镜像ubuntu:22.04 安装python3.12 星星法术嗲人 Linux系统 python基础 ubuntu linux 运维
以下是在已经进入ubuntu:22.04容器内部后手动安装python3.12的步骤：1、安装编译依赖aptupdate&&aptinstall-y\build-essential\zlib1g-dev\libncurses5-dev\libgdbm-dev\libnss3-dev\libssl-dev\libreadline-dev\libffi-dev\libbz2-dev\libncurse
【Python】文件应用：在with外部使用读取到的文件莫斯利安有点甜 python python 开发语言服务器
在Python中，使用withopen打开文件是一种常用的方式，它可以自动管理文件的打开和关闭。但是，文件只能在with内部使用，若要在withopen之外使用文件对象，可以通过以下几种方式实现：使用readlines()方法创建一个包含各行内容的列表使用readlines()方法可以一次性读取文件的所有行，并将它们存储在一个列表中。这种方式非常适合在withopen块中读取文件内容，然后在块之外
接口漏洞怎么抓？Fiddler 中文版 + Postman + Wireshark 实战指南 2501_91591841 http udp https websocket 网络安全网络协议 tcp/ip
接口安全是现代应用开发中的高危环节：一旦API存在未授权访问、参数篡改、权限绕过等漏洞，可能直接导致用户信息泄露、资金损失甚至整个平台瘫痪。对于开发和安全人员来说，光依赖后端日志排查远远不够，需要对接口进行主动安全性验证。而Fiddler抓包工具提供了灵活的请求拦截、修改、重放功能，是在API安全防护与漏洞复现中必不可少的工具。再结合Postman、Wireshark等工具，可以从接口到网络层做全
uni-app中，如果您需要在Android和iOS平台上进行基座操作和联调调试
在uni-app中，如果您需要在Android和iOS平台上进行基座操作和联调调试，以下是详细步骤和案例代码：安卓基座操作创建自定义基座：在AndroidStudio中，打开项目的"build.gradle"文件，找到android节点，添加以下代码来配置uni-appAndroid基座。java复制dependencies{implementationproject(':uniapp')//添加
AI人工智能助力联邦学习通信效率优化的解决方案 AI智能应用人工智能 ai
AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案元数据框架标题AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案关键词联邦学习（FederatedLearning）、通信优化（CommunicationEfficiency）、AI赋能（AI-Enabled）、参数压缩（ParameterCompression）、客户端选择（ClientSelection）、联邦蒸馏（Federa
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不