业余狙击手19

MaskRCNN源码解析3：RPN、ProposalLayer、DetectionTargetLayer

MaskRCNN源码解析1：整体结构概述

MaskRCNN源码解析2：特征图与anchors生成

MaskRCNN源码解析3：RPN、ProposalLayer、DetectionTargetLayer

MaskRCNN源码解析4-0：ROI Pooling 与 ROI Align理论

MaskRCNN源码解析4：头网络(Networks Heads)解析

MaskRCNN源码解析5：损失部分解析

目录

MaskRCNN概述：

B)，RPN与anchors筛选

1，RPN

2，ProposalLayer

3，DetectionTargetLayer

MaskRCNN概述：

Mask R-CNN是一个小巧、灵活的通用对象实例分割框架（object instance segmentation）。它不仅可对图像中的目标进行检测，还可以对每一个目标给出一个高质量的分割结果。它在Faster R-CNN[1]基础之上进行扩展，并行地在bounding box recognition分支上添加一个用于预测目标掩模（object mask）的新分支。该网络还很容易扩展到其他任务中，比如估计人的姿势，也就是关键点识别（person keypoint detection）。该框架在COCO的一些列挑战任务重都取得了最好的结果，包括实例分割（instance segmentation）、候选框目标检测（bounding-box object detection）和人关键点检测（person keypoint detection）。

参考文章：

Mask RCNN 学习笔记

MaskRCNN源码解读

令人拍案称奇的Mask RCNN

论文笔记：Mask R-CNN

Mask R-CNN个人理解

解析源码地址：

https://github.com/matterport/Mask_RCNN

B)，RPN与anchors筛选

1，RPN

RPN网络在代码中是先通过建立rpn_model，然后再遍历特征图，得到以下变量：

# rpn_class_logits：[batch_size，H * W * anchors_per_location，2] anchors分类器logits（在softmax之前）
# rpn_probs：[batch_size，H * W * anchors_per_location，2] anchors分类器概率。
# rpn_bbox：[batch_size，H * W * anchors_per_location，（dy，dx，log（dh），log（dw））]  anchors的坐标偏移量

整体RPN代码如下：

       # *************************4，生成RPN网络数据集*********************************************************************
        # 循环遍历2得到的特征图，通过rpn([p])生成以下数据：
        # rpn_class_logits：[batch_size，H * W * anchors_per_location，2] anchors分类器logits（在softmax之前）
        # rpn_probs：[batch_size，H * W * anchors_per_location，2] anchors分类器概率。
        # rpn_bbox：[batch_size，H * W * anchors_per_location，（dy，dx，log（dh），log（dw））]  anchors的坐标偏移量

        # RPN Model  建立RPN模型，下面传参数（特征图）
        rpn = build_rpn_model(config.RPN_ANCHOR_STRIDE,   # RPN_ANCHOR_STRIDE = 1
                              len(config.RPN_ANCHOR_RATIOS), config.TOP_DOWN_PYRAMID_SIZE) # TOP_DOWN_PYRAMID_SIZE = 256

        # 循环遍历2得到的特征图，通过rpn([p])生成以下数据：
        # rpn_class_logits：[batch_size，H * W * anchors_per_location，2] anchors分类器logits（在softmax之前）
        # rpn_probs：[batch_size，H * W * anchors_per_location，2] anchors分类器概率。
        # rpn_bbox：[batch_size，H * W * anchors_per_location，（dy，dx，log（dh），log（dw））]  anchors的坐标偏移量
        layer_outputs = []  # list of lists
        for p in rpn_feature_maps:    # rpn_feature_maps = [P2,P3,P4,P5,P6].
            layer_outputs.append(rpn([p]))

        # Concatenate layer outputs将各个特征图的输出合并
        # Convert from list of lists of level outputs to list of lists of outputs across levels.
        # e.g. [[a1, b1, c1], [a2, b2, c2]] => [[a1, a2], [b1, b2], [c1, c2]]
        output_names = ["rpn_class_logits", "rpn_class", "rpn_bbox"]
        outputs = list(zip(*layer_outputs))   # zip() 函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表。
        outputs = [KL.Concatenate(axis=1, name=n)(list(o))
                   for o, n in zip(outputs, output_names)]

        rpn_class_logits, rpn_class, rpn_bbox = outputs    # 几个特征图对应信息合在一起

建立RPN网络的Keras模型的代码如下，这里并没有执行操作，而是调用rpn_graph()函数执行具体操作。

"""
建立RPN网络的Keras模型。
它包含了RPN graph，因此共享权重可以被多次使用

anchor_stride：控制锚点的密度。 通常为1（要素图中的每个像素）或2（每个其他像素）。
anchors_per_location：特征图中每个像素的锚点数量  3
depth（深度）：骨干特征图的深度。256

返回Keras Model对象。 调用时，模型输出为：
rpn_class_logits：[batch_size，H * W * anchors_per_location，2] anchors分类器logits（在softmax之前）
rpn_probs：[batch_size，H * W * anchors_per_location，2] anchors分类器概率。
rpn_bbox：[batch_size，H * W * anchors_per_location，（dy，dx，log（dh），log（dw））]  anchors的坐标偏移量
"""
def build_rpn_model(anchor_stride, anchors_per_location, depth):

    input_feature_map = KL.Input(shape=[None, None, depth], name="input_rpn_feature_map")

    # 返回KerasModel对象。 调用时，模型输出为：
    # rpn_class_logits：[batch_size，H * W * anchors_per_location，2] anchors分类器logits（在softmax之前）
    # rpn_probs：[batch_size，H * W * anchors_per_location，2] anchors分类器概率。
    # rpn_bbox：[batch_size，H * W * anchors_per_location，（dy，dx，log（dh），log（dw））]  anchors的坐标偏移量
    outputs = rpn_graph(input_feature_map, anchors_per_location, anchor_stride)   # ***
    return KM.Model([input_feature_map], outputs, name="rpn_model")

rpn_graph()函数，对传进来的特征图先统一做3*3的卷积，将通道数转换为512维。然后分别进入分类和回归操作，

在分类操作中，先用1*1的卷积核对上一步的结果进行卷积，得到2*3维数据，再reshape成[N,w*h*3,2]，N表示batch_size大小，w*h*3表示该特征图共生成多少个anchors，2表示正样本和负样本相应数据的两个维度。rpn_class_logits用于后面计算rpn分类损失，rpn_probs表示正样本和负样本的置信度。
在回归操作中，先用1*1的卷积核对上一步的结果进行卷积，得到4*3维数据，再reshape成[N,w*h*3,4]，N表示batch_size大小，w*h*3表示该特征图共生成多少个anchors，4表示预测框的四个坐标。rpn_bbox用于后面计算rpn回归损失。

rpn_graph()函数处理数据结构图如下：

rpn_graph()函数源代码如下：

"""
建立RPN的计算图。
feature_map：特征图[batch, height, width, depth]
anchors_per_location：特征图中每个像素的锚点数量 3
anchor_stride：控制锚点的密度。 通常为1（要素图中的每个像素）或2（每个其他像素）。

返回值：
    rpn_class_logits：[batch_size，H * W * anchors_per_location，2] anchors分类器logits（在softmax之前）
    rpn_probs：[batch_size，H * W * anchors_per_location，2] anchors分类器概率。
    rpn_bbox：[batch_size，H * W * anchors_per_location，（dy，dx，log（dh），log（dw））]  anchors的坐标偏移量             
              
"""
def rpn_graph(feature_map, anchors_per_location, anchor_stride):

    # TODO: check if stride of 2 causes alignment issues if the feature map is not even.
    # Shared convolutional base of the RPN  先3*3卷积
    shared = KL.Conv2D(512, (3, 3), padding='same', activation='relu',
                       strides=anchor_stride,
                       name='rpn_conv_shared')(feature_map)

    # 1）**********分类操作***********************************************
    # Anchor Score. [batch, height, width, anchors per location * 2].
    x = KL.Conv2D(2 * anchors_per_location, (1, 1), padding='valid',
                  activation='linear', name='rpn_class_raw')(shared)

    # Reshape to [batch, anchors, 2]
    rpn_class_logits = KL.Lambda(
        lambda t: tf.reshape(t, [tf.shape(t)[0], -1, 2]))(x)

    # Softmax on last dimension of BG/FG.   前景背景概率
    rpn_probs = KL.Activation(
        "softmax", name="rpn_class_xxx")(rpn_class_logits)

    # 2）**********回归操作***********************************************
    # Bounding box refinement. [batch, H, W, anchors per location * depth]
    # where depth is [x, y, log(w), log(h)]
    x = KL.Conv2D(anchors_per_location * 4, (1, 1), padding="valid",
                  activation='linear', name='rpn_bbox_pred')(shared)

    # Reshape to [batch, anchors, 4]
    rpn_bbox = KL.Lambda(lambda t: tf.reshape(t, [tf.shape(t)[0], -1, 4]))(x)

    return [rpn_class_logits, rpn_probs, rpn_bbox]

2，ProposalLayer

ProposalLayer的作用主要：
1. 将rpn网路的输出应用到得到的anchors，首先对输出的概率进行排序（概率就是上一步得到的rpn_probs表示正样本和负样本的置信度），获取score靠前的前6000个anchor
2. 利用rpn_bbox对anchors进行修正
3. 舍弃掉修正后边框超过图片大小的anchor，由于我们的anchor的坐标的大小是归一化的，只要坐标不超过0 1区间即可
4. 利用非极大抑制的方法获得最后的2000个anchor

整体调用ProposalLayer部分的代码如下：

        # *************************5，anchors第一次筛选****************************************************************
        # 将第4步rpn网路的输出应用到第2步得到的anchors，首先对输出的概率进行排序，
        # 保留其中预测为前景色概率大的一部分（具体值可以在配置文件中进行配置），
        # 然后选取对应的anchor，利用rpn的输出回归值对anchor进行第一次修正。
        # 修正完利用NMS方法，删除其中的一部分anchor。获的最后的anchor。

        # 在标准化坐标中为[batch，N，（y1，x1，y2，x2）]，并填充了零。
        proposal_count = config.POST_NMS_ROIS_TRAINING if mode == "training"\
            else config.POST_NMS_ROIS_INFERENCE    # #  POST_NMS_ROIS_TRAINING = 2000   POST_NMS_ROIS_INFERENCE = 1000

        # ProposalLayer的作用主要
        # 1. 根据rpn网络，获取score靠前的前6000个anchor
        # 2. 利用rpn_bbox对anchors进行修正
        # 3. 舍弃掉修正后边框超过图片大小的anchor，由于我们的anchor的坐标的大小是归一化的，只要坐标不超过0 1区间即可
        # 4. 利用非极大抑制的方法获得最后的2000个anchor
        rpn_rois = ProposalLayer(    # *****
            proposal_count=proposal_count,           # 从生成的261888个anchors中选择预选框的数量（2000）
            nms_threshold=config.RPN_NMS_THRESHOLD,  # RPN_NMS_THRESHOLD = 0.7
            name="ROI",
            config=config)([rpn_class, rpn_bbox, anchors])

        if mode == "training":
            # Class ID mask to mark class IDs supported by the dataset the image came from.
            active_class_ids = KL.Lambda(
                lambda x: parse_image_meta_graph(x)["active_class_ids"]   # 解析包含其组件的图像属性的张量。
                )(input_image_meta)   # # 81+12=93

            if not config.USE_RPN_ROIS:   # USE_RPN_ROIS = True
                # Ignore predicted ROIs and use ROIs provided as an input.
                input_rois = KL.Input(shape=[config.POST_NMS_ROIS_TRAINING, 4],
                                      name="input_roi", dtype=np.int32)
                # Normalize coordinates
                target_rois = KL.Lambda(lambda x: norm_boxes_graph(
                    x, K.shape(input_image)[1:3]))(input_rois)
            else:
                target_rois = rpn_rois    #  筛选后的预选框 2000个

ProposalLayer类的定义，主要数据操作在call中实现。这部分逻辑不是太复杂，代码中都有注释，这里就不多说了。

# ProposalLayer的作用主要
# 1. 根据rpn网络，获取score靠前的前6000个anchors
# 2. 利用rpn_bbox对anchors进行修正
# 3. 舍弃掉修正后边框超过图片大小的anchor，由于我们的anchor的坐标的大小是归一化的，只要坐标不超过0 1区间即可
# 4. 利用非极大抑制的方法获得2000个anchors
class ProposalLayer(KE.Layer):

    def __init__(self, proposal_count, nms_threshold, config=None, **kwargs):
        super(ProposalLayer, self).__init__(**kwargs)  # super() 函数是用于调用父类(超类)的一个方法。
        self.config = config
        self.proposal_count = proposal_count     # 2000
        self.nms_threshold = nms_threshold       # 0.7

    # call() 用来执行 ProposalLayer 的职能, 即当前 Layer 所有的计算过程均在该函数中完成
    def call(self, inputs):
        # Box Scores. Use the foreground class confidence. [Batch, num_rois, 1]
        # Box 分数，使用前景类置信度，[Batch, num_rois, 1]
        scores = inputs[0][:, :, 1]    # inputs传入的参数     rpn_probs 前景背景概率
        # Box deltas [batch, num_rois, 4]
        # Box偏移量 [batch, num_rois, 4]
        deltas = inputs[1]    # rpn_bbox 偏移量
        # RPN和最终检测的边界框优化标准偏差。 RPN_BBOX_STD_DEV = np.array([0.1, 0.1, 0.2, 0.2])
        deltas = deltas * np.reshape(self.config.RPN_BBOX_STD_DEV, [1, 1, 4])
        # Anchors
        anchors = inputs[2]    # anchors 特征图生成的所有anchors

        # Improve performance by trimming to top anchors by score
        # and doing the rest on the smaller subset.
        # 根据anchors的得分（使用前景类置信度）选择top_k个anchors，并在这top_k 个anchors上操作以提高性能
        pre_nms_limit = tf.minimum(self.config.PRE_NMS_LIMIT, tf.shape(anchors)[1])  # 保持ROI的数量 PRE_NMS_LIMIT = 6000  num(anchors)=261888

        # 获取top_k anchors的索引 此时k=pre_nms_limit=6000
        ix = tf.nn.top_k(scores, pre_nms_limit, sorted=True, name="top_anchors").indices

        # 根据top_k的索引获取相应的scores、偏移量deltas、anchors
        scores = utils.batch_slice([scores, ix], lambda x, y: tf.gather(x, y),  # tf.gather根据索引，从输入张量中依次取元素，构成一个新的张量。
                                   self.config.IMAGES_PER_GPU)  # IMAGES_PER_GPU = 1
        deltas = utils.batch_slice([deltas, ix], lambda x, y: tf.gather(x, y),
                                   self.config.IMAGES_PER_GPU)
        pre_nms_anchors = utils.batch_slice([anchors, ix], lambda a, x: tf.gather(a, x),
                                    self.config.IMAGES_PER_GPU, names=["pre_nms_anchors"])

        # 对anchors应用偏移量，以获取更加精确的anchors。Apply deltas to anchors to get refined anchors.
        # [batch, N, (y1, x1, y2, x2)]
        boxes = utils.batch_slice([pre_nms_anchors, deltas],
                                  lambda x, y: apply_box_deltas_graph(x, y),  # 转换公式见**
                                  self.config.IMAGES_PER_GPU,
                                  names=["refined_anchors"])

        # 裁剪到图像边界。 由于我们在归一化坐标下，Clip to image boundaries. Since we're in normalized coordinates,
        # clip to 0..1 range. [batch, N, (y1, x1, y2, x2)]
        window = np.array([0, 0, 1, 1], dtype=np.float32)
        boxes = utils.batch_slice(boxes,
                                  lambda x: clip_boxes_graph(x, window),  # 确保每个框坐标范围为0-1
                                  self.config.IMAGES_PER_GPU,
                                  names=["refined_anchors_clipped"])

        # Filter out small boxes
        # According to Xinlei Chen's paper, this reduces detection accuracy
        # for small objects, so we're skipping it.
        # 过滤小box 根据ChenxiniChen的论文，这降低了对小物体的检测精度，因此我们跳过了它。

        # Non-max suppression  此处从6000个中根据nms再选择出2000个
        def nms(boxes, scores):
            indices = tf.image.non_max_suppression(
                boxes, scores, self.proposal_count,
                self.nms_threshold, name="rpn_non_max_suppression")
            proposals = tf.gather(boxes, indices)
            # Pad if needed
            padding = tf.maximum(self.proposal_count - tf.shape(proposals)[0], 0)
            proposals = tf.pad(proposals, [(0, padding), (0, 0)])
            return proposals
        proposals = utils.batch_slice([boxes, scores], nms,
                                      self.config.IMAGES_PER_GPU)
        return proposals

    def compute_output_shape(self, input_shape):   # 用来计算输出张量的 shape
        return (None, self.proposal_count, 4)

3，DetectionTargetLayer

DetectionTargetLayer层主要是对上一步 ProposalLayer层选出的2000个rois做进一步筛选，得到最终用于训练的200个（当前代码里设置的值是200）正负样本。

DetectionTargetLayer的输入包含了：target_rois, input_gt_class_ids, gt_boxes, input_gt_masks。
其中target_rois是第5步ProposalLayer输出的结果。

首先，计算target_rois中的每一个rois和哪一个真实的框gt_boxes iou值，
如果最大的iou大于0.5，则被认为是正样本，负样本是iou小于0.5并且和crowd box相交不大的anchor，选择出了正负样本，还要保证样本的均衡性，具体可以在配置文件中进行配置。
最后计算了正样本中的anchor和哪一个真实的框最接近，用真实的框和anchor计算出偏移值，
并且将mask的大小resize成28 * 28 的（我猜测利用的是双线性差值的方式，因为mask的值不是0就是1，0是背景，1是前景）这些都是后面的分类和mask网络要用到的真实的值

整体调用DetectionTargetLayer部分的代码如下：

            # *************************6，生成检测目标，anchors第二次筛选**********************************************************
            # DetectionTargetLayer的输入包含了：target_rois, input_gt_class_ids, gt_boxes, input_gt_masks。
            # 其中target_rois是第5步ProposalLayer输出的结果。
            # 首先，计算target_rois中的每一个rois和哪一个真实的框gt_boxes iou值，
            # 如果最大的iou大于0.5，则被认为是正样本，负样本是iou小于0.5并且和crowd box相交不大的anchor，
            # 选择出了正负样本，还要保证样本的均衡性，具体可以在配置文件中进行配置。
            # 最后计算了正样本中的anchor和哪一个真实的框最接近，用真实的框和anchor计算出偏移值，
            # 并且将mask的大小resize成28 * 28 的（我猜测利用的是双线性差值的方式，因为mask的值不是0就是1，0是背景，一是前景）
            # 这些都是后面的分类和mask网络要用到的真实的值
            rois, target_class_ids, target_bbox, target_mask =\
                DetectionTargetLayer(config, name="proposal_targets")([  # 从2000个rooposals中选择200个正负样本用于最终的优化训练
                    target_rois, input_gt_class_ids, gt_boxes, input_gt_masks])

其中的DetectionTargetLayer类定义如下，该类的call函数中又调用了detection_targets_graph()函数进行了实际的数据操作，完成的功能是从2000个rooposals中选择200个正负样本用于最终的优化训练。

# DetectionTargetLayer的输入包含了：target_rois, input_gt_class_ids, gt_boxes, input_gt_masks。
# 其中target_rois是第5步ProposalLayer输出的结果。
# 首先，计算target_rois中的每一个rois和哪一个真实的框gt_boxes iou值，
# 如果最大的iou大于0.5，则被认为是正样本，负样本是iou小于0.5并且和crowd box相交不大的anchor，
# 选择出了正负样本，还要保证样本的均衡性，具体可以在配置文件中进行配置。
# 最后计算了正样本中的anchor和哪一个真实的框最接近，用真实的框和anchor计算出偏移值，
# 并且将mask的大小resize成28 * 28 的（我猜测利用的是双线性差值的方式，因为mask的值不是0就是1，0是背景，一是前景）
# 这些都是后面的分类和mask网络要用到的真实的值
class DetectionTargetLayer(KE.Layer):

    def __init__(self, config, **kwargs):
        super(DetectionTargetLayer, self).__init__(**kwargs)
        self.config = config

    def call(self, inputs):
        proposals = inputs[0]     # 预选框
        gt_class_ids = inputs[1]  # 类别序号
        gt_boxes = inputs[2]      # GT框
        gt_masks = inputs[3]      # GT mask

        # Slice the batch and run a graph for each slice 对批次进行切片并为每个切片运行图
        # TODO: Rename target_bbox to target_deltas for clarity
        # 待办事项：为清楚起见，将target_bbox重命名为target_deltas
        names = ["rois", "target_class_ids", "target_bbox", "target_mask"]
        outputs = utils.batch_slice(
            [proposals, gt_class_ids, gt_boxes, gt_masks],
            lambda w, x, y, z: detection_targets_graph(   # ***  # 从2000个rooposals中选择200个正负样本用于最终的优化训练
                w, x, y, z, self.config),
            self.config.IMAGES_PER_GPU, names=names)
        return outputs

detection_targets_graph()函数的对数据的具体操作如下，对关键部分代码添加了注释，这里同样不用文字描述了。

"""
Generates detection targets for one image. Subsamples proposals and
generates target class IDs, bounding box deltas, and masks for each.
为一张图像生成检测目标。 对proposals进行二次筛选，并为每个proposals生成目标类ID，边界框偏移量和掩码。

Inputs:
proposals: [POST_NMS_ROIS_TRAINING, (y1, x1, y2, x2)] in normalized coordinates. Might
           be zero padded if there are not enough proposals.
gt_class_ids: [MAX_GT_INSTANCES] int class IDs
gt_boxes: [MAX_GT_INSTANCES, (y1, x1, y2, x2)] in normalized coordinates.
gt_masks: [height, width, MAX_GT_INSTANCES] of boolean type.

Returns: Target ROIs and corresponding class IDs, bounding box shifts,
and masks.
rois: [TRAIN_ROIS_PER_IMAGE, (y1, x1, y2, x2)] in normalized coordinates
class_ids: [TRAIN_ROIS_PER_IMAGE]. Integer class IDs. Zero padded.
deltas: [TRAIN_ROIS_PER_IMAGE, (dy, dx, log(dh), log(dw))]
masks: [TRAIN_ROIS_PER_IMAGE, height, width]. Masks cropped to bbox
       boundaries and resized to neural network output size.

Note: Returned arrays might be zero padded if not enough target ROIs.
注意：如果目标ROI不够，返回的数组可能会补零。
"""
# 从2000个rooposals中选择200个正负样本用于最终的优化训练
def detection_targets_graph(proposals, gt_class_ids, gt_boxes, gt_masks, config):

    # Assertions
    asserts = [   # tf.greater(a,b) 通过比较a、b两个值的大小来输出对错。
        tf.Assert(tf.greater(tf.shape(proposals)[0], 0), [proposals],
                  name="roi_assertion"),
    ]
    # tf.identity是返回一个一模一样新的tensor的op，这会增加一个新节点到gragh中，这时control_dependencies就会生效
    with tf.control_dependencies(asserts):
        proposals = tf.identity(proposals)

    # Remove zero padding   删除零填充
    proposals, _ = trim_zeros_graph(proposals, name="trim_proposals")
    gt_boxes, non_zeros = trim_zeros_graph(gt_boxes, name="trim_gt_boxes")
    gt_class_ids = tf.boolean_mask(gt_class_ids, non_zeros, name="trim_gt_class_ids")
    gt_masks = tf.gather(gt_masks, tf.where(non_zeros)[:, 0], axis=2, name="trim_gt_masks")

    # Handle COCO crowds(人群)
    # A crowd box in COCO is a bounding box around several instances. Exclude
    # them from training. A crowd box is given a negative class ID.
    # 在coco数据集中，有的框会标注很多的物体，在训练中，去掉这些框
    crowd_ix = tf.where(gt_class_ids < 0)[:, 0]
    non_crowd_ix = tf.where(gt_class_ids > 0)[:, 0]
    crowd_boxes = tf.gather(gt_boxes, crowd_ix)
    gt_class_ids = tf.gather(gt_class_ids, non_crowd_ix)
    gt_boxes = tf.gather(gt_boxes, non_crowd_ix)
    gt_masks = tf.gather(gt_masks, non_crowd_ix, axis=2)

    # Compute overlaps matrix [proposals, gt_boxes]
    # 计算[proposals，gt_boxes]的IOU
    overlaps = overlaps_graph(proposals, gt_boxes)

    # Compute overlaps with crowd boxes [proposals, crowd_boxes]
    crowd_overlaps = overlaps_graph(proposals, crowd_boxes)
    crowd_iou_max = tf.reduce_max(crowd_overlaps, axis=1)
    no_crowd_bool = (crowd_iou_max < 0.001)

    # Determine positive and negative ROIs
    # 确定 正样本和负样本
    roi_iou_max = tf.reduce_max(overlaps, axis=1)   # 按列求最大值
    # 1. Positive ROIs are those with >= 0.5 IoU with a GT box
    # 1. 和真实的框的iou值大于0.5时，被认为是正样本
    positive_roi_bool = (roi_iou_max >= 0.5)
    positive_indices = tf.where(positive_roi_bool)[:, 0]   # 获取正样本索引
    # 2. Negative ROIs are those with < 0.5 with every GT box. Skip crowds.
    # 2. 负样本是iou小于0.5并且和crowd box相交不大的anchor
    negative_indices = tf.where(tf.logical_and(roi_iou_max < 0.5, no_crowd_bool))[:, 0]  # 获取负样本索引

    # Subsample ROIs. Aim for 33% positive   争取正样本占比33%
    # Positive ROIs  正样本
    positive_count = int(config.TRAIN_ROIS_PER_IMAGE *config.ROI_POSITIVE_RATIO)  # 200 *0.33
    positive_indices = tf.random_shuffle(positive_indices)[:positive_count]
    positive_count = tf.shape(positive_indices)[0]
    # Negative ROIs. Add enough to maintain positive:negative ratio.
    # 负ROI。 添加足够的量以维持正负比率。
    r = 1.0 / config.ROI_POSITIVE_RATIO   # ROI_POSITIVE_RATIO = 0.33
    negative_count = tf.cast(r * tf.cast(positive_count, tf.float32), tf.int32) - positive_count   # 根据正样本数量计算负样本数量
    negative_indices = tf.random_shuffle(negative_indices)[:negative_count]
    # Gather selected ROIs 根据正负样本索引选择正负样本ROIs
    positive_rois = tf.gather(proposals, positive_indices)
    negative_rois = tf.gather(proposals, negative_indices)

    # 计算正样本和哪个真实的框最接近。 Assign positive ROIs to GT boxes.
    positive_overlaps = tf.gather(overlaps, positive_indices)  # 根据正样本索引，选择与GT的IOU值
    roi_gt_box_assignment = tf.cond(     # tf.cond()类似于c语言中的if...else...，用来控制数据流向，但是仅仅类似而已
        tf.greater(tf.shape(positive_overlaps)[1], 0),
        true_fn = lambda: tf.argmax(positive_overlaps, axis=1),   # 找与GT IOU最大的值
        false_fn = lambda: tf.cast(tf.constant([]),tf.int64)
    )
    roi_gt_boxes = tf.gather(gt_boxes, roi_gt_box_assignment)   # IOU最大的ROI匹配的GT框
    roi_gt_class_ids = tf.gather(gt_class_ids, roi_gt_box_assignment)   # IOU最大的ROI匹配的GT类别序号

    # Compute bbox refinement for positive ROIs
    # 用最接近的真实框修正rpn网络预测的框
    deltas = utils.box_refinement_graph(positive_rois, roi_gt_boxes)   # 将GT框转换成偏移量
    deltas /= config.BBOX_STD_DEV   # BBOX_STD_DEV = np.array([0.1, 0.1, 0.2, 0.2])  RPN和最终检测的边界框优化标准偏差。

    # Assign positive ROIs to GT masks
    # Permute masks to [N, height, width, 1]
    # 为GT masks分配正的ROI
    # 将masks置换为[N，高度，宽度，1]
    transposed_masks = tf.expand_dims(tf.transpose(gt_masks, [2, 0, 1]), -1)
    # Pick the right mask for each ROI
    roi_masks = tf.gather(transposed_masks, roi_gt_box_assignment)  # IOU最大的ROI匹配的 GT mask

    # 计算目标mask Compute mask targets
    boxes = positive_rois
    if config.USE_MINI_MASK:   # USE_MINI_MASK = True
        # Transform ROI coordinates from normalized image space to normalized mini-mask space.
        # 将ROI坐标从归一化的图像空间转换为归一化的小型mask空间。
        y1, x1, y2, x2 = tf.split(positive_rois, 4, axis=1)
        gt_y1, gt_x1, gt_y2, gt_x2 = tf.split(roi_gt_boxes, 4, axis=1)
        gt_h = gt_y2 - gt_y1
        gt_w = gt_x2 - gt_x1
        y1 = (y1 - gt_y1) / gt_h
        x1 = (x1 - gt_x1) / gt_w
        y2 = (y2 - gt_y1) / gt_h
        x2 = (x2 - gt_x1) / gt_w
        boxes = tf.concat([y1, x1, y2, x2], 1)
    box_ids = tf.range(0, tf.shape(roi_masks)[0])
    # crop_and_resize相当于roipolling的操作
    masks = tf.image.crop_and_resize(tf.cast(roi_masks, tf.float32), boxes,
                                     box_ids,
                                     config.MASK_SHAPE)
    # 去除mask多余的尺寸。Remove the extra dimension from masks.
    masks = tf.squeeze(masks, axis=3)

    # Threshold mask pixels at 0.5 to have GT masks be 0 or 1 to use with binary cross entropy loss.
    masks = tf.round(masks)  # tf.round()四舍五入函数

    # Append negative ROIs and pad bbox deltas and masks that are not used for negative ROIs with zeros.
    rois = tf.concat([positive_rois, negative_rois], axis=0)   # 正负样本合并
    N = tf.shape(negative_rois)[0]   # 负样本数量
    # 每幅图像中要输入到分类器的ROI数量 TRAIN_ROIS_PER_IMAGE = 200，正负样本 1:3
    P = tf.maximum(config.TRAIN_ROIS_PER_IMAGE - tf.shape(rois)[0], 0)  # 正负样本和200还差多少个
    rois = tf.pad(rois, [(0, P), (0, 0)])  # tf.pad：填充函数  差的样本用0填充，  rois是最终待训练的正负样本
    roi_gt_boxes = tf.pad(roi_gt_boxes, [(0, N + P), (0, 0)])
    roi_gt_class_ids = tf.pad(roi_gt_class_ids, [(0, N + P)])
    deltas = tf.pad(deltas, [(0, N + P), (0, 0)])  # 偏移量填充
    masks = tf.pad(masks, [[0, N + P], (0, 0), (0, 0)])  # masks填充

    return rois, roi_gt_class_ids, deltas, masks

你可能感兴趣的:(#,目标检测算法)

Yolo系列之Yolo的基本理解是十一月末 YOLO python 开发语言 yolo
YOLO的基本理解目录YOLO的基本理解1YOLO1.1概念1.2算法2单、多阶段对比2.1FLOPs和FPS2.2one-stage单阶段2.3two-stage两阶段1YOLO1.1概念YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
基于YOLOv5的车牌识别系统：从数据集到UI界面的实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言随着智能交通系统的发展，车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来，随着深度学习技术的飞速发展，基于卷积神经网络（CNN）的目标检测算法，如YOLO（YouOn
点云从入门到精通技术详解100篇-基于激光雷达点云的三维目标检测格图素书目标检测人工智能计算机视觉
目录前言图像目标检测算法研究现状点云目标检测算法研究现状基于投影图的方法基于体素的方法基于点云的多模态融合方法2地面点云滤波及神经网络2.1目标检测数据集及采集设备2.1.1KITTI数据集2.1.2车载激光雷达2.2地面点云滤波算法2.2.1RANSAC算法2.2.2CSF算法本文篇幅较长，分为上下两篇，下篇详见基于激光雷达点云的三维目标检测（续）前言近几年来，在计算机视觉领域，利用深度学习卷积
YOLOv5改进：在C3块不同位置添加EMA注意力机制，有效提升计算机视觉性能 UksApps YOLO 计算机视觉深度学习
计算机视觉中的目标检测是一个重要的任务，而YOLOv5是目前广泛应用的一种高效目标检测算法。为了进一步提升YOLOv5的性能，我们在C3块的不同位置添加了EMA（ExponentialMovingAverage）注意力机制。EMA注意力机制是一种用于提升模型的感知能力和特征表达能力的技术。在YOLOv5中，我们将EMA注意力机制嵌入到C3块中，以增强这一块的特征表示能力。下面是我们改进的YOLOv
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
基于YOLOv5的烟雾检测系统：从数据集准备到UI界面实现深度学习&目标检测实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言烟雾是火灾发生的一个重要早期信号。烟雾检测能够在火灾初期及时识别并报警，为火灾的扑灭争取宝贵的时间。因此，烟雾检测的研究一直是计算机视觉领域中的一个热点问题。近年来，随着深度学习技术的发展，目标检测算法被广泛应用于烟雾检测，尤其是基于YOLOv5的目标检测模型，由于其较高的精度和较低的计算开销，已经成为许多实时检测系统的首选模型。在这篇博客中，我们将介绍如何使用YOLOv5模型进行烟雾检测
【目标检测论文解读复现NO.38】基于改进YOLOv8模型的轻量化板栗果实识别方法人工智能算法研究院中文核心论文解读复现目标检测 YOLO 目标跟踪
前言此前出了目标改进算法专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章，为解决大家的困惑，此系列文章旨在给大家解读最新目标检测算法论文，帮助大家解答疑惑。解读的系列文章，本人已进行创新点代码复现，有需要的朋友可关注私信我。本文仅对论文代码实现，如果原文章的作者觉得不方便，请联系删除，尊重每一位论文作者。一、摘要为实现自然环境下的板栗果实目
YOLO 银行柜员业务助手鱼弦人工智能时代 YOLO
YOLO银行柜员业务助手介绍YOLO（YouOnlyLookOnce）是一种实时目标检测算法，因其快速、准确的特点，被广泛应用于各种领域。在银行环境中，YOLO可以帮助自动识别和处理柜台上出现的文档、货币等物品，从而支持柜员进行高效、安全的操作。这类系统能够减少人为错误，提高客户服务质量。应用使用场景文件和票据识别：自动检测和分类客户提供的文件和票据。货币识别与计数：自动识别并记录不同面额的钞票，
YOLO在PiscTrace上检测到数据分析那雨倾城 PiscTrace YOLO 计算机视觉视觉检测数据分析信息可视化
在现代计算机视觉领域，实时视频数据的检测与分析对于安全监控、交通管理以及智能制造等领域具有重要意义。YOLO（YouOnlyLookOnce）作为一种高效的目标检测算法，能够在保持高精度的同时实现实时检测。而PiscTrace作为一款集成了OpenCV、MiDaS和YOLO技术的桌面应用，为用户提供了全面的图像与视频流处理解决方案。本文将探讨如何利用YOLO进行实时视频数据检测，并结合PiscTr
基于YOLOv5的无人超市商品检测：食品、饮料、零食与家居用品深度学习&目标检测实战项目 YOLO 目标跟踪深度学习人工智能 ui
引言随着人工智能技术的快速发展，尤其是计算机视觉的提升，无人超市的概念逐渐成为现实。在无人超市中，商品的智能化管理和检测是其顺利运行的关键。商品检测不仅要实现高效、准确的物品识别，还要支持多种商品类别的实时检测，以保证购物体验的顺畅与安全。在此背景下，深度学习与目标检测算法，如YOLOv5，成为了实现这一目标的重要工具。YOLOv5作为目前最先进且高效的目标检测算法之一，其应用范围广泛，包括人脸检
基于YOLOv5的野生动物检测与监控系统：猫、狗、鸟、猴子、狮子、老虎、象的实时识别与分析深度学习&目标检测实战项目 YOLO 目标跟踪人工智能深度学习 ui 目标检测机器学习
1.引言随着人工智能技术的飞速发展，尤其是深度学习在计算机视觉领域的突破，目标检测技术已广泛应用于各类场景。从城市交通监控到安防系统，再到野生动物保护和生态监测，目标检测技术为我们提供了实时、精确的解决方案。在众多目标检测算法中，YOLO（YouOnlyLookOnce）系列因其高效性和实时性，已成为解决多类别目标检测任务的首选方法。本文将介绍如何使用YOLOv5进行野生动物检测与监控，包括猫、狗
使用YOLOv8训练自己的数据集：详细教程 zru_9602 人工智能 YOLO
使用YOLOv8训练自己的数据集：详细教程引言YOLOv8是Ultralytics团队开发的新一代目标检测算法，以其高效的性能和简洁的API而闻名。本文将详细介绍如何使用YOLOv8训练自己的数据集，包括数据准备、模型配置、训练过程以及结果分析。1.环境搭建在开始训练之前，请确保已经安装了必要的依赖项：#安装ultralytics和其他依赖pipinstallultralytics==8.0.25
基于 YOLO 进行车道线检测与目标检测算法研究及开发的一般步骤 pk_xz123456 python 算法深度学习 YOLO 目标检测算法
基于深度学习的车道线检测与目标检测在自动驾驶等领域有着重要应用，使用YOLO（YouOnlyLookOnce）进行开发是一种常见且高效的方式。以下是关于基于YOLO进行车道线检测与目标检测算法研究及开发的一般步骤和相关内容：1.环境搭建首先确保你的开发环境安装了必要的软件和库，推荐使用Python语言，以下是一些关键库：PyTorch：YOLO通常基于PyTorch实现，安装适合你系统的PyTor
目标检测进化史：从R-CNN到YOLOv11，技术的狂飙之路紫雾凌寒 AI 炼金厂 #机器学习算法 #深度学习深度学习计算机视觉 python 目标检测 YOLO cnn 人工智能
一、引言在计算机视觉领域中，目标检测是一项至关重要的任务，它旨在识别图像或视频中感兴趣的目标物体，并确定它们的位置。目标检测技术的应用广泛，涵盖了自动驾驶、安防监控、智能机器人、图像编辑等多个领域。随着深度学习技术的飞速发展，目标检测算法也取得了巨大的突破，从最初的R-CNN到如今的YOLOv11，每一次的技术演进都为该领域带来了新的活力和可能性。回顾目标检测的发展历程，R-CNN作为第一个将深度
改进YOLO系列 | YOLOv5/v7 引入 Dynamic Snake Convolution | 动态蛇形卷积 wei子 YOLO 目标跟踪人工智能
改进YOLO系列：动态蛇形卷积（DynamicSnakeConvolution，DSC）简介YOLO系列目标检测算法以其速度和精度著称，但对于细长目标例如血管、道路等，其性能仍有提升空间。动态蛇形卷积（DSC）是YOLOv5/v7中引入的一种改进，旨在更好地处理细长目标。DSC原理DSC的核心思想是使用类似蛇形运动的卷积核来提取细长目标的特征。具体来说，DSC卷积核沿着一系列控制点移动，并根据每个
yolov8人脸识别与脸部关键点检测（代码+原理） QQ_1309399183 计算机视觉实战项目集锦 YOLO 人工智能人脸识别 yolo人脸检测
YOLOv8脸部识别是一个基于YOLOv8算法的人脸检测项目，旨在实现快速、准确地检测图像和视频中的人脸。该项目是对YOLOv8算法的扩展和优化，专门用于人脸检测任务。YOLOv8是一种基于深度学习的目标检测算法，通过将目标检测问题转化为一个回归问题，可以实现实时的目标检测。YOLOv8Face项目在YOLOv8的基础上进行了改进，使其更加适用于人脸检测。以下是YOLOv8Face项目的一些特点和
【深度学习】计算机视觉（CV）-目标检测-DETR（DEtection TRansformer）—— 基于 Transformer 的端到端目标检测 IT古董深度学习人工智能深度学习计算机视觉目标检测
1.什么是DETR？DETR（DEtectionTRansformer）是FacebookAI（FAIR）于2020年提出的端到端目标检测算法，它基于Transformer架构，消除了FasterR-CNN、YOLO等方法中的候选框（AnchorBoxes）和非极大值抑制（NMS）机制，使目标检测变得更简单、高效。论文：End-to-EndObjectDetectionwithTransforme
【YOLO模型】（1）--YOLO是什么方世恩 YOLO YOLO 人工智能目标检测
一、什么是YOLOYOLO（YouOnlyLookOnce）是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。1.核心思想它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位置。2.原理YOLO算法将输入图像分成SxS个网格，每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外，YOLO算法还采用了多尺度特征融合的技术
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进金外飞176 技术前沿目标跟踪人工智能计算机视觉
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进YOLO（YouOnlyLookOnce）系列目标检测算法自2016年首次发布以来，凭借其高效的实时检测能力，迅速成为计算机视觉领域的热门研究方向之一。本文将详细回顾YOLO系列从v1到v11的版本迭代过程，分析每个版本的技术改进、性能提升以及应用场景。1.YOLOv1：开创性的单阶段检测算法YOLOv1是目标检测领域的一个重要里程碑，
目标检测代码示例（基于Python和OpenCV） matlab_python22 计算机视觉
引言目标检测是计算机视觉领域中的一个核心任务，其目标是在图像或视频中定位和识别特定对象。随着技术的发展，目标检测算法不断演进，从传统的基于手工特征的方法到现代的深度学习方法，再到基于Transformer的架构，目标检测技术已经取得了显著的进步。本文将总结和对比几种主要的目标检测算法，探讨它们的优势、劣势和适用场景。1.目标检测算法分类1.1单阶段检测（One-Stage）与双阶段检测（Two-S
YOLO各版本原理和优缺点解析 Ash Butterfield 计算机视觉
YOLO（YouOnlyLookOnce）是一种实时目标检测算法，以其高速度和较高精度著称。以下是各版本的详细介绍及优缺点分析：1.YOLOv1（2016年）原理：将输入图像划分为S×SS\timesSS×S的网格，每个网格预测多个边界框和类别置信度。使用单个神经网络直接对图像进行前向传播预测边界框和类别标签。优点：速度快，适合实时应用。模型结构简单，易于实现和训练。缺点：对小目标检测效果差，容易
图像分类与目标检测算法 BugNest AI 算法分类目标检测 ai 人工智能图像处理
在计算机视觉领域，图像分类与目标检测是两项至关重要的技术。它们通过对图像进行深入解析和理解，为各种应用场景提供了强大的支持。本文将详细介绍这两项技术的算法原理、技术进展以及当前的落地应用。一、图像分类算法图像分类是指将输入的图像划分为预定义的类别之一。这一过程的核心在于特征提取和分类器的设计。1.特征提取特征提取是图像分类的第一步，其目标是从图像中提取出能够区分不同类别的关键信息。传统的特征提取方
基于深度学习YOLOv5的海洋动物检测系统深度学习&目标检测实战项目深度学习 YOLO 目标跟踪人工智能目标检测计算机视觉
1.引言随着人工智能技术的快速发展，深度学习在图像处理领域的应用逐渐展现出强大的能力，尤其是在目标检测任务上。YOLO（YouOnlyLookOnce）系列模型作为一种高效的目标检测算法，以其实时性和高精度在许多领域得到了广泛应用。海洋动物的检测任务也因此受益，借助深度学习模型，我们可以实时、自动地检测海洋中的动物，有助于海洋生态研究、环境保护以及水下监测等多个领域。本文将详细介绍如何基于YOLO
运用Faster RCNN、YOLO经典目标检测算法对滑坡图像进行检测 AngeliaZ Faster RCNN YOLO
本次实验采用的操作系统为Ubuntu16.04平台，编程环境基于Python，GPU为NVIDIAGeForce740m，在基于深度学习框架CAFFE下进行实验。实验输出结果
毕业设计：基于卷积神经网络的鲜花花卉种类检测算法研究 HaiLang_IT 深度学习毕业设计机器学习毕业设计目标检测
目录前言课题背景和意义实现技术思路一、算法理论基础1.1卷积神经网络1.2目标检测算法二、数据集2.1数据集2.2数据扩充三、实验及结果分析3.1实验环境搭建3.2模型训练最后前言大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利
目标检测的超级英雄：YOLO带你识别世界星际编程喵 Python探索之旅目标检测 YOLO 目标跟踪人工智能计算机视觉 python
前言YOLO（YouOnlyLookOnce）是计算机视觉领域一颗璀璨的明星，它以高效、快速著称，成为目标检测算法的代表。今天，我们一起走进YOLO的世界，看看它如何神奇地识别图像中的物体。当然，不用担心，这篇文章会让你轻松理解，并且我会用幽默、通俗的语言给大家展示这项技术。相信我，看完之后，你会觉得YOLO不仅是个算法，更像是个看得懂、说得清的技术伙伴。简介YOLO不仅是一个简单的目标检测模型，
【3D目标检测】YOLO3D 基于图像的3D目标检测算法 BILLY BILLY YOLOv8系列 3d 目标检测 YOLO
参考文档：https://ruhyadi.github.io/project/computer-vision/yolo3d/代码：https://github.com/ruhyadi/yolo3d-lightning本次分享将会从以下四个方面展开：物体检测模型中的算法选择单目摄像头下的物体检测神经网络训练预测参数的设计模型训练与距离测算1.物体检测模型中的算法选择物体检测（ObjectDetect
毕业设计项目深度学习人体目标检测 bee_dc 毕业设计毕设大数据
1简介今天学长向大家介绍一个机器视觉的毕设项目，基于深度学习的人体目标检测算法研究与实现项目运行效果：毕业设计深度学习行人目标检测系统项目分享:见文末!2目标检测概念普通的深度学习监督算法主要是用来做分类，如图1所示，分类的目标是要识别出图中所示是一只猫。在ILSVRC（ImageNetLargeScaleVisualRecognitionChallenge)竞赛以及实际的应用中，还包括目标定位和
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1