业余狙击手19

Faster RCNN源码解读3.1-_region_proposal() 筛选anchors-_proposal_layer()（核心和关键2）

Faster RCNN复现

Faster RCNN源码解读1-整体流程和各个子流程梳理

Faster RCNN源码解读2-_anchor_component()为图像建立anchors（核心和关键1）

Faster RCNN源码解读3.1-_region_proposal() 筛选anchors-_proposal_layer()（核心和关键2）

Faster RCNN源码解读3.2-_region_proposal()筛选anchors-_anchor_target_layer()（核心和关键2）

Faster RCNN源码解读3.3-_region_proposal() 筛选anchors-_proposal_target_layer()（核心和关键2）

Faster RCNN源码解读4-其他收尾工作：ROI_pooling、分类、回归等

Faster RCNN源码解读5-损失函数

理论介绍：有关Faster RCNN理论介绍的文章，可以自行搜索，这里就不多说理论部分了。

复现过程：代码配置过程没有记录，具体怎么把源码跑起来需要自己搜索一下。

faster rcnn源码确实挺复杂的，虽然一步步解析了，但是觉得还是没有领会其中的精髓，只能算是略知皮毛。在这里将代码解析的过程给大家分享一下，希望对大家有帮助。先是解析了代码的整体结构，然后对各个子结构进行了分析。代码中的注释，有的是原来就有的注释，有的是参考网上别人的，有的是自己理解的，里面或多或少会有些错误，如果发现，欢迎指正！

本文解析的源码地址：https://github.com/lijianaiml/tf-faster-rcnn-windows

RPN处的处理流程：

_region_proposal()函数依赖关系：

_region_proposal()

  '''
  _region_proposal用于将vgg16的conv5的特征通过3*3的滑动窗得到rpn特征，进行两条并行的线路，
  分别送入cls和reg网络。cls网络判断通过1*1的卷积得到anchors是正样本还是负样本（由于anchors
  过多，还有可能有不关心的anchors，使用时只使用正样本和负样本），用于二分类rpn_cls_score；
  reg网络对通过1*1的卷积回归出anchors的坐标偏移rpn_bbox_pred。这两个网络共用3*3 conv（rpn）。
  由于每个位置有k个anchor，因而每个位置均有2k个scores和4k个coordinates。
  cls（将输入的512维降低到2k维）：3*3 conv + 1*1 conv（2k个scores，k为每个位置archors个数，如9）
  
  在第一次使用_reshape_layer时，由于输入bottom为1*？*？*2k，先得到caffe中的数据顺序
  （tf为batchsize*height*width*channels，caffe中为batchsize*channels*height*width）to_caffe：1*2k*？*？，
  而后reshape后得到reshaped为1*2*？*？，最后在转回tf的顺序to_tf为1*？*？*2，得到rpn_cls_score_reshape。
  之后通过rpn_cls_prob_reshape（softmax的值，只针对最后一维，即2计算softmax），得到概率rpn_cls_prob_reshape
  （其最大值，即为预测值rpn_cls_pred），再次_reshape_layer，得到1*？*？*2k的rpn_cls_prob，为原始的概率。

  reg（将输入的512维降低到4k维）：3*3 conv + 1*1 conv（4k个coordinates，k为每个位置archors个数，如9）。
  '''
  def _region_proposal(self, net_conv, is_training, initializer):
    # vgg16提取后的特征图，先进行3*3卷积
    # 3*3的conv,作为rpn网络 cfg.RPN_CHANNELS=512是卷积后的通道数
    rpn = slim.conv2d(net_conv, cfg.RPN_CHANNELS, [3, 3], trainable=is_training, weights_initializer=initializer,
                        scope="rpn_conv/3x3")
    self._act_summaries.append(rpn)
    # 每个框进行2分类，判断前景还是背景
    # 1*1的conv,得到每个位置的9个anchors分类特征[1,?,?,9*2],
    #每个位置的9个anchors是正样本还是负样本
    rpn_cls_score = slim.conv2d(rpn, self._num_anchors * 2, [1, 1], trainable=is_training,
                                weights_initializer=initializer,
                                padding='VALID', activation_fn=None, scope='rpn_cls_score')

    # change it so that the score has 2 as its channel size
    # reshape成标准形式
    # [1,?,?,9*2]-->[1,?*9.?,2]  分类得分，每个点有9个anchors，每个anchors有2个得分
    #每个anchors是正样本还是负样本
    rpn_cls_score_reshape = self._reshape_layer(rpn_cls_score, 2, 'rpn_cls_score_reshape')

    # 每个anchors是正样本还是负样本。 以最后一维为特征长度，得到所有特征的概率[1,?*9.?,2]
    rpn_cls_prob_reshape = self._softmax_layer(rpn_cls_score_reshape, "rpn_cls_prob_reshape")

    # 每个位置的9个anchors预测的类别。得到每个位置的9个anchors预测的类别，[1,?,9,?]的列向量
    #每个位置的9个anchors预测的类别，[1,?,9,?]的列向量
    rpn_cls_pred = tf.argmax(tf.reshape(rpn_cls_score_reshape, [-1, 2]), axis=1, name="rpn_cls_pred")

    # 变换回原始纬度，[1,?*9.?,2]-->[1,?,?,9*2]
    #每个位置的9个anchors是正样本和负样本的概率
    rpn_cls_prob = self._reshape_layer(rpn_cls_prob_reshape, self._num_anchors * 2, "rpn_cls_prob")

    # 1*1的conv,每个位置的9个anchors回归位置偏移[1,?,?,9*4]
    # 每个位置的9个anchors回归位置偏移
    rpn_bbox_pred = slim.conv2d(rpn, self._num_anchors * 4, [1, 1], trainable=is_training,
                                weights_initializer=initializer,
                                padding='VALID', activation_fn=None, scope='rpn_bbox_pred')
    if is_training:
      # 1.使用经过rpn网络层后生成的rpn_cls_prob把anchor位置进行第一次修正
      # 2.按照得分排序，取前12000个anchor,再nms,取前面2000个（在test的时候就变成了6000和300）
      rois, roi_scores = self._proposal_layer(rpn_cls_prob, rpn_bbox_pred, "rois") # 256个anchors的类别(第一维)及位置(后四维)

      # 获取属于rpn网络的label:通过对所有的anchor与所有的GT计算IOU，通过消除再图像外部的anchor,计算IOU>=0.7为正样本，IOU<0.3为负样本，
      # 得到再理想情况下各自一半的256个正负样本(实际上正样本大多只有10-100个之间，相对负样本偏少)
      rpn_labels = self._anchor_target_layer(rpn_cls_score, "anchor") #rpn_labels:特征图中每个位置对应的正样本、负样本还是不关注
      # Try to have a deterministic order for the computing graph, for reproducibility
      with tf.control_dependencies([rpn_labels]):
        # 获得属于最后的分类网络的label
        # 因为之前的anchor位置已经修正过了，所以这里又计算了一次经过proposal_layer修正后的box与GT的IOU来得到label
        # 但是阈值不一样了，变成了大于等于0.5为1，小于为0，并且这里得到的正样本很少，通常只有2-20个，甚至有0个，
        # 并且正样本最多为64个，负样本则有比较多个，相应的也重新计算了一次bbox_targets
        # 另外，从RPN网络出来的2000余个rois中挑选256个
        rois, _ = self._proposal_target_layer(rois, roi_scores, "rpn_rois") #通过post_nms_topN个anchors的位置及为1（正样本）的概率得到256个rois及对应信息
    else:
      if cfg.TEST.MODE == 'nms':
        rois, _ = self._proposal_layer(rpn_cls_prob, rpn_bbox_pred, "rois")
      elif cfg.TEST.MODE == 'top':
        rois, _ = self._proposal_top_layer(rpn_cls_prob, rpn_bbox_pred, "rois")
      else:
        raise NotImplementedError

    self._predictions["rpn_cls_score"] = rpn_cls_score  # 每个位置的9个anchors是正样本还是负样本
    self._predictions["rpn_cls_score_reshape"] = rpn_cls_score_reshape  # 每个anchors是正样本还是负样本
    self._predictions["rpn_cls_prob"] = rpn_cls_prob  # 每个位置的9个anchors是正样本和负样本的概率
    self._predictions["rpn_cls_pred"] = rpn_cls_pred  # 每个位置的9个anchors预测的类别，[1,?,9,?]的列向量
    self._predictions["rpn_bbox_pred"] = rpn_bbox_pred  # 每个位置的9个anchors回归位置偏移
    self._predictions["rois"] = rois  # 256个anchors的类别(第一维)及位置(后四维)

    return rois  # 返回256个anchors的类别(第一维，训练时为每个anchors的类别，测试时全0)及位置(后四维)

函数拆解：

先完成下图功能：

对应的代码：

    # vgg16提取后的特征图，先进行3*3卷积
    # 3*3的conv,作为rpn网络 cfg.RPN_CHANNELS=512是卷积后的通道数
    rpn = slim.conv2d(net_conv, cfg.RPN_CHANNELS, [3, 3], trainable=is_training, weights_initializer=initializer,
                        scope="rpn_conv/3x3")

    # 每个框进行2分类，判断前景还是背景
    # 1*1的conv,得到每个位置的9个anchors分类特征[1,?,?,9*2],
    rpn_cls_score = slim.conv2d(rpn, self._num_anchors * 2, [1, 1], trainable=is_training,
                                weights_initializer=initializer,
                                padding='VALID', activation_fn=None, scope='rpn_cls_score')

然后进行reshape，拿一张图片举个例子，图片的shape是（W，H，D=18），然后我们会把他reshape以进行softmax（进行softmax的matrix的一边需要等于num of class，在这里是一个二分类，即是否含有物体，所以是2）。所以我们会把（W，H，D）reshape成（2，9*W*H）。这里很重要！！！！对应的代码：

    # change it so that the score has 2 as its channel size
    # reshape成标准形式
    # [1,?,?,9*2]-->[1,?*9.?,2]  分类得分，每个点有9个anchors，每个anchors有2个得分
    rpn_cls_score_reshape = self._reshape_layer(rpn_cls_score, 2, 'rpn_cls_score_reshape')

然后我们进行softmax，得出对这9*W*H每一个的两个score，一个是有物体，一个是没有物体。对应的代码：

 # 每个anchors是正样本还是负样本。 以最后一维为特征长度，得到所有特征的概率[1,?*9.?,2]
    rpn_cls_prob_reshape = self._softmax_layer(rpn_cls_score_reshape, "rpn_cls_prob_reshape")

其他的语句：

    # 每个位置的9个anchors预测的类别。得到每个位置的9个anchors预测的类别，[1,?,9,?]的列向量
    rpn_cls_pred = tf.argmax(tf.reshape(rpn_cls_score_reshape, [-1, 2]), axis=1, name="rpn_cls_pred")

    # 变换回原始纬度，[1,?*9.?,2]-->[1,?,?,9*2]
    rpn_cls_prob = self._reshape_layer(rpn_cls_prob_reshape, self._num_anchors * 2, "rpn_cls_prob")

    # 1*1的conv,每个位置的9个anchors回归位置偏移[1,?,?,9*4]
    rpn_bbox_pred = slim.conv2d(rpn, self._num_anchors * 4, [1, 1], trainable=is_training,
                                weights_initializer=initializer,
                                padding='VALID', activation_fn=None, scope='rpn_bbox_pred')

最后一句完成下图的功能，rpn_bbox_pred对应下图红色圈出的部分：

以下至1.1.2主要是此部分代码，解析了以下4个函数。

完成从w*h*9个anchors中取2000个anchors，并第一次box regression操作。

1,_proposal_layer()

接下来调用_proposal_layer()函数，该函数主要是传入相关参数，并没有进行相关的数据操作，然后调用proposal_layer_tf()函数完成数据操作，最后返回rois, rpn_scores。

rois是筛选后的候选区域的个数（训练时为m=2000，测试时为m=300），rois为m*5维；

rpn_scores是rois为正样本的概率,rpn_scores为m*1维。

  '''
  _proposal_layer调用proposal_layer_tf，通过(w*h*9)*4个anchors，计算估计后的坐标
  （bbox_transform_inv_tf），并对坐标进行裁剪（clip_boxes_tf）及非极大值抑制
  （tf.image.non_max_suppression，可得到符合条件的索引indices）的anchors：rois
  及这些anchors为正样本的概率：rpn_scores。rois为m*5维，rpn_scores为m*1维，
  其中m为经过非极大值抑制后得到的候选区域个数（训练时2000个，测试时300个）。
  m*5的第一列为全为0的batch_inds，后4列为坐标（坐上+右下）
  '''
  # rpn_cls_prob  每个位置的9个anchors是正样本和负样本的概率
  # rpn_bbox_pred  每个位置的9个anchors回归位置偏移
  def _proposal_layer(self, rpn_cls_prob, rpn_bbox_pred, name):
    with tf.variable_scope(name) as scope:
      if cfg.USE_E2E_TF:
        #proposal_layer_tf()在lib/layer_utils/proposal_layer.py中定义
        rois, rpn_scores = proposal_layer_tf(
          rpn_cls_prob,      # rpn_cls_prob  每个位置的9个anchors是正样本和负样本的概率
          rpn_bbox_pred,     # rpn_bbox_pred  每个位置的9个anchors回归位置偏移
          self._im_info,     #图像信息
          self._mode,        # 'train'或者 'test'
          self._feat_stride, #原始图到特征图的缩放比例，此处为16
          self._anchors,     #此处传入生成的w*h*9个anchors
          self._num_anchors  #9
        )
      else:
        rois, rpn_scores = tf.py_func(proposal_layer,
                              [rpn_cls_prob,     #同上
                               rpn_bbox_pred,
                               self._im_info,
                               self._mode,
                               self._feat_stride,
                               self._anchors,
                               self._num_anchors],
                              [tf.float32, tf.float32], name="proposal")

      rois.set_shape([None, 5])
      rpn_scores.set_shape([None, 1])
    return rois, rpn_scores

1.1,proposal_layer_tf()

此函数主要功能是从w*h*9个anchors中筛选出2000个anchors及其为正样本的概率。 by：sxl --个人理解，如有错误，欢迎指正。该函数里面调用了bbox_transform_inv_tf()和clip_boxes_tf()完成相应功能，这两个函数会在下面解析。

'''
rpn_cls_prob,      # rpn_cls_prob  每个位置的9个anchors是正样本和负样本的概率 [1,?,?,18]
rpn_bbox_pred,     # rpn_bbox_pred  每个位置的9个anchors回归位置偏移 [1,?,?,36] 
_im_info,          #图像信息
cfg_key(_mode),    # 'TRAIN'或者 'test'
_feat_stride,      #原始图到特征图的缩放比例，此处为16
_anchors,          #此处传入生成的w*h*9个anchors
_num_anchors       #9

此函数主要功能是从w*h*9个anchors中筛选出2000个anchors及其为正样本的概率。 by：sxl   --个人理解
'''
def proposal_layer_tf(rpn_cls_prob, rpn_bbox_pred, im_info, cfg_key, _feat_stride, anchors, num_anchors):
  if type(cfg_key) == bytes:
    cfg_key = cfg_key.decode('utf-8')
  pre_nms_topN = cfg[cfg_key].RPN_PRE_NMS_TOP_N    #12000
  post_nms_topN = cfg[cfg_key].RPN_POST_NMS_TOP_N  #训练时为2000，测试时为300
  nms_thresh = cfg[cfg_key].RPN_NMS_THRESH #nms的阈值，为0.7

  # Get the scores and bounding boxes  获取分数和边界框
  scores = rpn_cls_prob[:, :, :, num_anchors:] #[1,?,?,9]
  scores = tf.reshape(scores, shape=(-1,)) #[?,]
  rpn_bbox_pred = tf.reshape(rpn_bbox_pred, shape=(-1, 4)) #所有的anchors的四个坐标,[1,?,?,36]->[?,4]

  #bbox_transform_inv_tf()在lib/model/bbox_transform.py中定义  proposals[w*h*9,4]
  proposals = bbox_transform_inv_tf(anchors, rpn_bbox_pred) #已知anchors和偏移求预测的坐标 anchors[w*h*9,4]  rpn_bbox_pred[?,4]
  proposals = clip_boxes_tf(proposals, im_info[:2]) #限制预测坐标在原始图像上  proposals[w*h*9,4]

  # Non-maximal suppression
  # 通过nms得到分支最大的post_num_topN(训练时为2000，测试时为300)个坐标的索引 .执行完indices [?,]
  indices = tf.image.non_max_suppression(proposals, scores, max_output_size=post_nms_topN, iou_threshold=nms_thresh)

  boxes = tf.gather(proposals, indices) #根据索引得到post_nms_topN个对应的坐标  boxes [?,4]
  boxes = tf.to_float(boxes)  #将张量强制转换为float32类型。 boxes [?,4]
  scores = tf.gather(scores, indices) #得到post_nms_topN个对应的为1的概率，从'scores'中根据'indices'的参数值获取切片。
  scores = tf.reshape(scores, shape=(-1, 1)) #scores [?,]-》[?,1]

  # Only support single image as input  只支持单张图片的输入
  batch_inds = tf.zeros((tf.shape(indices)[0], 1), dtype=tf.float32) #按切片维度初始化一个全0列表
  blob = tf.concat([batch_inds, boxes], 1)  #post_nms_topN*1个batch_inds和post_nms_topN*4个坐标concat,得到post_nms_topN*5的blob

  return blob, scores

1.1.1，bbox_transform_inv_tf()

先了解一下边框回归，这里贴一下此篇文章的手抄版，为加深理解，自己手动抄了一个简化版（字太丑[手动捂脸]）

'''
已知anchors和偏移求预测的坐标 boxes[w*h*9,4]  deltas[?,4]=deltas[w*h*9,4] 就是特征图有512维经过1*1降维到36维，然后reshape[?,4]
'''
def bbox_transform_inv_tf(boxes, deltas):
  boxes = tf.cast(boxes, deltas.dtype) #tf.cast()函数的作用是将boxes数据类型转换为deltas的数据类型
  widths = tf.subtract(boxes[:, 2], boxes[:, 0]) + 1.0 #宽
  heights = tf.subtract(boxes[:, 3], boxes[:, 1]) + 1.0 #高
  ctr_x = tf.add(boxes[:, 0], widths * 0.5) #中心x
  ctr_y = tf.add(boxes[:, 1], heights * 0.5) #中心x

  dx = deltas[:, 0] #预测的tx，初始值是特征图的值
  dy = deltas[:, 1] #预测的ty
  dw = deltas[:, 2] #预测的tw
  dh = deltas[:, 3] #预测的th

  # 平移变换
  pred_ctr_x = tf.add(tf.multiply(dx, widths), ctr_x) #自己抄的那张图里的公式1，已知xa,wa,tx反过来求预测的x中心坐标
  pred_ctr_y = tf.add(tf.multiply(dy, heights), ctr_y) #自己抄的那张图里的公式2，已知ya,ha,ty反过来求预测的y中心坐标

  #尺度缩放变换
  pred_w = tf.multiply(tf.exp(dw), widths)  #自己抄的那张图里的公式3，已知wa,tw反过来秋预测的w
  pred_h = tf.multiply(tf.exp(dh), heights) #自己抄的那张图里的公式4，已知ha,th反过来秋预测的h

  #目标输出，通过预测的中心点(pred_ctr_x，pred_ctr_y)和宽高pred_w及pred_h计算(x1,y1,x2,y2)
  pred_boxes0 = tf.subtract(pred_ctr_x, pred_w * 0.5) #预测框的起始和终点四个坐标
  pred_boxes1 = tf.subtract(pred_ctr_y, pred_h * 0.5)
  pred_boxes2 = tf.add(pred_ctr_x, pred_w * 0.5)
  pred_boxes3 = tf.add(pred_ctr_y, pred_h * 0.5)

  return tf.stack([pred_boxes0, pred_boxes1, pred_boxes2, pred_boxes3], axis=1)

1.1.2，clip_boxes_tf()

函数主要作用是：限制预测坐标在原始图像上，

tf.minimum(boxes[:, 0], im_info[1] - 1 保证预测的宽高不超出真实图片的宽高范围

tf.maximum（x,0) 保证预测宽高的值大于等于0

#限制预测坐标在原始图像上  proposals[w*h*9,4]
def clip_boxes_tf(boxes, im_info):
  '''
  tf.minimum(boxes[:, 0], im_info[1] - 1  保证预测的宽高不超出真实图片的宽高范围
  tf.maximum（x,0)  保证预测宽高的值大于等于0
  :param boxes:    预测边框信息
  :param im_info:  图像信息
  :return: 限制预测坐标在原始图像上的预测信息
  '''
  b0 = tf.maximum(tf.minimum(boxes[:, 0], im_info[1] - 1), 0)
  b1 = tf.maximum(tf.minimum(boxes[:, 1], im_info[0] - 1), 0)
  b2 = tf.maximum(tf.minimum(boxes[:, 2], im_info[1] - 1), 0)
  b3 = tf.maximum(tf.minimum(boxes[:, 3], im_info[0] - 1), 0)
  return tf.stack([b0, b1, b2, b3], axis=1)

下面重新开一篇文章解析下面这个模块

目标检测YOLO实战应用案例100讲-基于深度学习的无人机目标检测算法轻量化研究（中）林聪木目标检测 YOLO 深度学习
目录基于改进YOLOv5的无人机图像实时目标检测4.1引言4.2基于改进YOLOv5的目标检测模型结构4.3消融实验及结果分析4.4算法迁移验证实验基于Jetson-Xavier的模型优化部署5.1引言5.2基于人在回路的目标检测模型裁剪5.3嵌入式实时目标检测交互软件基于深度学习的无人机目标检测算法轻量化研究知识拓展基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的无人机目标检测1.数
Yolo系列之Yolo的基本理解是十一月末 YOLO python 开发语言 yolo
YOLO的基本理解目录YOLO的基本理解1YOLO1.1概念1.2算法2单、多阶段对比2.1FLOPs和FPS2.2one-stage单阶段2.3two-stage两阶段1YOLO1.1概念YOLO(YouOnlyLookOnce)是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
基于YOLOv5的车牌识别系统：从数据集到UI界面的实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言随着智能交通系统的发展，车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统（LicensePlateRecognition,LPR）主要用于识别车辆的车牌号码，并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来，随着深度学习技术的飞速发展，基于卷积神经网络（CNN）的目标检测算法，如YOLO（YouOn
点云从入门到精通技术详解100篇-基于激光雷达点云的三维目标检测格图素书目标检测人工智能计算机视觉
目录前言图像目标检测算法研究现状点云目标检测算法研究现状基于投影图的方法基于体素的方法基于点云的多模态融合方法2地面点云滤波及神经网络2.1目标检测数据集及采集设备2.1.1KITTI数据集2.1.2车载激光雷达2.2地面点云滤波算法2.2.1RANSAC算法2.2.2CSF算法本文篇幅较长，分为上下两篇，下篇详见基于激光雷达点云的三维目标检测（续）前言近几年来，在计算机视觉领域，利用深度学习卷积
YOLOv5改进：在C3块不同位置添加EMA注意力机制，有效提升计算机视觉性能 UksApps YOLO 计算机视觉深度学习
计算机视觉中的目标检测是一个重要的任务，而YOLOv5是目前广泛应用的一种高效目标检测算法。为了进一步提升YOLOv5的性能，我们在C3块的不同位置添加了EMA（ExponentialMovingAverage）注意力机制。EMA注意力机制是一种用于提升模型的感知能力和特征表达能力的技术。在YOLOv5中，我们将EMA注意力机制嵌入到C3块中，以增强这一块的特征表示能力。下面是我们改进的YOLOv
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
基于YOLOv5的烟雾检测系统：从数据集准备到UI界面实现深度学习&目标检测实战项目 YOLO ui 分类数据挖掘目标跟踪
1.引言烟雾是火灾发生的一个重要早期信号。烟雾检测能够在火灾初期及时识别并报警，为火灾的扑灭争取宝贵的时间。因此，烟雾检测的研究一直是计算机视觉领域中的一个热点问题。近年来，随着深度学习技术的发展，目标检测算法被广泛应用于烟雾检测，尤其是基于YOLOv5的目标检测模型，由于其较高的精度和较低的计算开销，已经成为许多实时检测系统的首选模型。在这篇博客中，我们将介绍如何使用YOLOv5模型进行烟雾检测
【目标检测论文解读复现NO.38】基于改进YOLOv8模型的轻量化板栗果实识别方法人工智能算法研究院中文核心论文解读复现目标检测 YOLO 目标跟踪
前言此前出了目标改进算法专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章，为解决大家的困惑，此系列文章旨在给大家解读最新目标检测算法论文，帮助大家解答疑惑。解读的系列文章，本人已进行创新点代码复现，有需要的朋友可关注私信我。本文仅对论文代码实现，如果原文章的作者觉得不方便，请联系删除，尊重每一位论文作者。一、摘要为实现自然环境下的板栗果实目
YOLO 银行柜员业务助手鱼弦人工智能时代 YOLO
YOLO银行柜员业务助手介绍YOLO（YouOnlyLookOnce）是一种实时目标检测算法，因其快速、准确的特点，被广泛应用于各种领域。在银行环境中，YOLO可以帮助自动识别和处理柜台上出现的文档、货币等物品，从而支持柜员进行高效、安全的操作。这类系统能够减少人为错误，提高客户服务质量。应用使用场景文件和票据识别：自动检测和分类客户提供的文件和票据。货币识别与计数：自动识别并记录不同面额的钞票，
YOLO在PiscTrace上检测到数据分析那雨倾城 PiscTrace YOLO 计算机视觉视觉检测数据分析信息可视化
在现代计算机视觉领域，实时视频数据的检测与分析对于安全监控、交通管理以及智能制造等领域具有重要意义。YOLO（YouOnlyLookOnce）作为一种高效的目标检测算法，能够在保持高精度的同时实现实时检测。而PiscTrace作为一款集成了OpenCV、MiDaS和YOLO技术的桌面应用，为用户提供了全面的图像与视频流处理解决方案。本文将探讨如何利用YOLO进行实时视频数据检测，并结合PiscTr
基于YOLOv5的无人超市商品检测：食品、饮料、零食与家居用品深度学习&目标检测实战项目 YOLO 目标跟踪深度学习人工智能 ui
引言随着人工智能技术的快速发展，尤其是计算机视觉的提升，无人超市的概念逐渐成为现实。在无人超市中，商品的智能化管理和检测是其顺利运行的关键。商品检测不仅要实现高效、准确的物品识别，还要支持多种商品类别的实时检测，以保证购物体验的顺畅与安全。在此背景下，深度学习与目标检测算法，如YOLOv5，成为了实现这一目标的重要工具。YOLOv5作为目前最先进且高效的目标检测算法之一，其应用范围广泛，包括人脸检
基于YOLOv5的野生动物检测与监控系统：猫、狗、鸟、猴子、狮子、老虎、象的实时识别与分析深度学习&目标检测实战项目 YOLO 目标跟踪人工智能深度学习 ui 目标检测机器学习
1.引言随着人工智能技术的飞速发展，尤其是深度学习在计算机视觉领域的突破，目标检测技术已广泛应用于各类场景。从城市交通监控到安防系统，再到野生动物保护和生态监测，目标检测技术为我们提供了实时、精确的解决方案。在众多目标检测算法中，YOLO（YouOnlyLookOnce）系列因其高效性和实时性，已成为解决多类别目标检测任务的首选方法。本文将介绍如何使用YOLOv5进行野生动物检测与监控，包括猫、狗
使用YOLOv8训练自己的数据集：详细教程 zru_9602 人工智能 YOLO
使用YOLOv8训练自己的数据集：详细教程引言YOLOv8是Ultralytics团队开发的新一代目标检测算法，以其高效的性能和简洁的API而闻名。本文将详细介绍如何使用YOLOv8训练自己的数据集，包括数据准备、模型配置、训练过程以及结果分析。1.环境搭建在开始训练之前，请确保已经安装了必要的依赖项：#安装ultralytics和其他依赖pipinstallultralytics==8.0.25
基于 YOLO 进行车道线检测与目标检测算法研究及开发的一般步骤 pk_xz123456 python 算法深度学习 YOLO 目标检测算法
基于深度学习的车道线检测与目标检测在自动驾驶等领域有着重要应用，使用YOLO（YouOnlyLookOnce）进行开发是一种常见且高效的方式。以下是关于基于YOLO进行车道线检测与目标检测算法研究及开发的一般步骤和相关内容：1.环境搭建首先确保你的开发环境安装了必要的软件和库，推荐使用Python语言，以下是一些关键库：PyTorch：YOLO通常基于PyTorch实现，安装适合你系统的PyTor
目标检测进化史：从R-CNN到YOLOv11，技术的狂飙之路紫雾凌寒 AI 炼金厂 #机器学习算法 #深度学习深度学习计算机视觉 python 目标检测 YOLO cnn 人工智能
一、引言在计算机视觉领域中，目标检测是一项至关重要的任务，它旨在识别图像或视频中感兴趣的目标物体，并确定它们的位置。目标检测技术的应用广泛，涵盖了自动驾驶、安防监控、智能机器人、图像编辑等多个领域。随着深度学习技术的飞速发展，目标检测算法也取得了巨大的突破，从最初的R-CNN到如今的YOLOv11，每一次的技术演进都为该领域带来了新的活力和可能性。回顾目标检测的发展历程，R-CNN作为第一个将深度
改进YOLO系列 | YOLOv5/v7 引入 Dynamic Snake Convolution | 动态蛇形卷积 wei子 YOLO 目标跟踪人工智能
改进YOLO系列：动态蛇形卷积（DynamicSnakeConvolution，DSC）简介YOLO系列目标检测算法以其速度和精度著称，但对于细长目标例如血管、道路等，其性能仍有提升空间。动态蛇形卷积（DSC）是YOLOv5/v7中引入的一种改进，旨在更好地处理细长目标。DSC原理DSC的核心思想是使用类似蛇形运动的卷积核来提取细长目标的特征。具体来说，DSC卷积核沿着一系列控制点移动，并根据每个
yolov8人脸识别与脸部关键点检测（代码+原理） QQ_1309399183 计算机视觉实战项目集锦 YOLO 人工智能人脸识别 yolo人脸检测
YOLOv8脸部识别是一个基于YOLOv8算法的人脸检测项目，旨在实现快速、准确地检测图像和视频中的人脸。该项目是对YOLOv8算法的扩展和优化，专门用于人脸检测任务。YOLOv8是一种基于深度学习的目标检测算法，通过将目标检测问题转化为一个回归问题，可以实现实时的目标检测。YOLOv8Face项目在YOLOv8的基础上进行了改进，使其更加适用于人脸检测。以下是YOLOv8Face项目的一些特点和
【深度学习】计算机视觉（CV）-目标检测-DETR（DEtection TRansformer）—— 基于 Transformer 的端到端目标检测 IT古董深度学习人工智能深度学习计算机视觉目标检测
1.什么是DETR？DETR（DEtectionTRansformer）是FacebookAI（FAIR）于2020年提出的端到端目标检测算法，它基于Transformer架构，消除了FasterR-CNN、YOLO等方法中的候选框（AnchorBoxes）和非极大值抑制（NMS）机制，使目标检测变得更简单、高效。论文：End-to-EndObjectDetectionwithTransforme
【YOLO模型】（1）--YOLO是什么方世恩 YOLO YOLO 人工智能目标检测
一、什么是YOLOYOLO（YouOnlyLookOnce）是一种基于深度学习的目标检测算法，由JosephRedmon等人于2016年提出。1.核心思想它的核心思想是将目标检测问题转化为一个回归问题，通过一个神经网络直接预测目标的类别和位置。2.原理YOLO算法将输入图像分成SxS个网格，每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外，YOLO算法还采用了多尺度特征融合的技术
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进金外飞176 技术前沿目标跟踪人工智能计算机视觉
YOLO系列版本迭代：从YOLOv1到YOLOv11的技术演进YOLO（YouOnlyLookOnce）系列目标检测算法自2016年首次发布以来，凭借其高效的实时检测能力，迅速成为计算机视觉领域的热门研究方向之一。本文将详细回顾YOLO系列从v1到v11的版本迭代过程，分析每个版本的技术改进、性能提升以及应用场景。1.YOLOv1：开创性的单阶段检测算法YOLOv1是目标检测领域的一个重要里程碑，
目标检测代码示例（基于Python和OpenCV） matlab_python22 计算机视觉
引言目标检测是计算机视觉领域中的一个核心任务，其目标是在图像或视频中定位和识别特定对象。随着技术的发展，目标检测算法不断演进，从传统的基于手工特征的方法到现代的深度学习方法，再到基于Transformer的架构，目标检测技术已经取得了显著的进步。本文将总结和对比几种主要的目标检测算法，探讨它们的优势、劣势和适用场景。1.目标检测算法分类1.1单阶段检测（One-Stage）与双阶段检测（Two-S
YOLO各版本原理和优缺点解析 Ash Butterfield 计算机视觉
YOLO（YouOnlyLookOnce）是一种实时目标检测算法，以其高速度和较高精度著称。以下是各版本的详细介绍及优缺点分析：1.YOLOv1（2016年）原理：将输入图像划分为S×SS\timesSS×S的网格，每个网格预测多个边界框和类别置信度。使用单个神经网络直接对图像进行前向传播预测边界框和类别标签。优点：速度快，适合实时应用。模型结构简单，易于实现和训练。缺点：对小目标检测效果差，容易
图像分类与目标检测算法 BugNest AI 算法分类目标检测 ai 人工智能图像处理
在计算机视觉领域，图像分类与目标检测是两项至关重要的技术。它们通过对图像进行深入解析和理解，为各种应用场景提供了强大的支持。本文将详细介绍这两项技术的算法原理、技术进展以及当前的落地应用。一、图像分类算法图像分类是指将输入的图像划分为预定义的类别之一。这一过程的核心在于特征提取和分类器的设计。1.特征提取特征提取是图像分类的第一步，其目标是从图像中提取出能够区分不同类别的关键信息。传统的特征提取方
基于深度学习YOLOv5的海洋动物检测系统深度学习&目标检测实战项目深度学习 YOLO 目标跟踪人工智能目标检测计算机视觉
1.引言随着人工智能技术的快速发展，深度学习在图像处理领域的应用逐渐展现出强大的能力，尤其是在目标检测任务上。YOLO（YouOnlyLookOnce）系列模型作为一种高效的目标检测算法，以其实时性和高精度在许多领域得到了广泛应用。海洋动物的检测任务也因此受益，借助深度学习模型，我们可以实时、自动地检测海洋中的动物，有助于海洋生态研究、环境保护以及水下监测等多个领域。本文将详细介绍如何基于YOLO
运用Faster RCNN、YOLO经典目标检测算法对滑坡图像进行检测 AngeliaZ Faster RCNN YOLO
本次实验采用的操作系统为Ubuntu16.04平台，编程环境基于Python，GPU为NVIDIAGeForce740m，在基于深度学习框架CAFFE下进行实验。实验输出结果
毕业设计：基于卷积神经网络的鲜花花卉种类检测算法研究 HaiLang_IT 深度学习毕业设计机器学习毕业设计目标检测
目录前言课题背景和意义实现技术思路一、算法理论基础1.1卷积神经网络1.2目标检测算法二、数据集2.1数据集2.2数据扩充三、实验及结果分析3.1实验环境搭建3.2模型训练最后前言大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利
目标检测的超级英雄：YOLO带你识别世界星际编程喵 Python探索之旅目标检测 YOLO 目标跟踪人工智能计算机视觉 python
前言YOLO（YouOnlyLookOnce）是计算机视觉领域一颗璀璨的明星，它以高效、快速著称，成为目标检测算法的代表。今天，我们一起走进YOLO的世界，看看它如何神奇地识别图像中的物体。当然，不用担心，这篇文章会让你轻松理解，并且我会用幽默、通俗的语言给大家展示这项技术。相信我，看完之后，你会觉得YOLO不仅是个算法，更像是个看得懂、说得清的技术伙伴。简介YOLO不仅是一个简单的目标检测模型，
【3D目标检测】YOLO3D 基于图像的3D目标检测算法 BILLY BILLY YOLOv8系列 3d 目标检测 YOLO
参考文档：https://ruhyadi.github.io/project/computer-vision/yolo3d/代码：https://github.com/ruhyadi/yolo3d-lightning本次分享将会从以下四个方面展开：物体检测模型中的算法选择单目摄像头下的物体检测神经网络训练预测参数的设计模型训练与距离测算1.物体检测模型中的算法选择物体检测（ObjectDetect
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo

Faster RCNN源码解读3.1-_region_proposal() 筛选anchors-_proposal_layer()（核心和关键2）

Faster RCNN复现

Faster RCNN源码解读1-整体流程和各个子流程梳理

Faster RCNN源码解读2-_anchor_component()为图像建立anchors（核心和关键1）

Faster RCNN源码解读3.1-_region_proposal() 筛选anchors-_proposal_layer()（核心和关键2）

Faster RCNN源码解读3.2-_region_proposal()筛选anchors-_anchor_target_layer()（核心和关键2）

Faster RCNN源码解读3.3-_region_proposal() 筛选anchors-_proposal_target_layer()（核心和关键2）

Faster RCNN源码解读4-其他收尾工作：ROI_pooling、分类、回归等

Faster RCNN源码解读5-损失函数

RPN处的处理流程：

_region_proposal()函数依赖关系：

_region_proposal()

函数拆解：

以下至1.1.2主要是此部分代码 ，解析了以下4个函数。

1,_proposal_layer()

1.1,proposal_layer_tf()

1.1.1，bbox_transform_inv_tf()

1.1.2，clip_boxes_tf()

你可能感兴趣的:(#,目标检测算法)

以下至1.1.2主要是此部分代码，解析了以下4个函数。