唐天洛不会写代码

特征金字塔网络代码详解——FPN的Tensorflow版本

FPN的代码详解——特征提取

特征提取原理
对应代码分析

特征金字塔网络最早于2017年发表于CVPR，与Faster RCNN相比其在多池度特征预测的方式使得其在小目标预测上取得了较好的效果。FPN也作为mmdeteciton的Neck模块，成为常用的目标检测策略之一。分别提供论文地址特征金字塔论文地址以及代码链接 Github链接。
本文以介绍论文中的原理以及其具体的实现方式为主，代码的环境配置和以及各个脚本文件的内容会根据需要补充。按照数据读入到输出的过程带大家走一遍流程。

特征提取原理

FPN与传统Faster RCNN框架相比，其最大的创新点就是自底向上又自顶向下的金字塔结构。图中A对应的特征图金字塔，直接利用不同大小的图像进行预测推理，图中B是传统的单池度预测，选择网络输出的最后一层的结果进行预测，图中C的层次金字塔则是在不同池度的特征图上进行预测。到FPN则是在层次金字塔的基础上，将相邻层的特征进行融合得到新的特征图，作为特征信息进行预测。

自底向上：自底向上即对应着CNN网络的特征提取的过程，以VGG16为例。VGG16由13个卷积层、3个全连接层以及5个池化层组成。那么在特征提取的过程中，每经过一层Max-pooling层，特征图大小就会缩放为原来的1/4。将卷积到每个池化操作合并为一次特征提取过程，记作CONV。那么VGG16可以视为由5个CONV层+3个FC层组成。

图中是VGG16的网络示意图，每个CONV块由2个3x3的卷积以及一个步长为2的最大池化构成，实现了对特征图在HxW上的信息变为原来的1/4，而通道信息变为原来的2倍。那么把这样的一系列操作记作CONV，特征图宽高的缩放通过POOL实现，而通道的升维通过3x3的卷积实现。（选择不同的backbone的CONV的实现方式不同，但结果一致），那么通过5个CONV操作得到的特征图C5即是单特征图预测的输入。而层次金字塔则通过不同CONV层输出的特征图C_list={C1,C2,C3,C4,C5}中选择后三层作为RPN的输入进行预测。
那么我们可以将通过不同的CONV模块获得C_list的一系列操作的过程称为自底向上。也就是传统CNN中的特征提取阶段。
自顶向下：与传统CNN不同，FPN在得到C_list之后没有直接选择其作为RPN的输入进行目标预测，而是将不同层的特征相融合来获得更加充分的信息。这一操作的思想是基于浅层的卷积层往往包含更多纹理、形状等特征，而高层的卷积层则包含更多的语义信息。将二者有效结合起来则能更好的提升网络的表达能力。

可以看到，随着网络层数的加深，提取到的特征可视化后就越抽象。如果仅仅选用C_list中的某一层进行预测，则无法利用到其他层的语义信息。特征利用不充分。

为了充分利用不同层的语义信息，FPN将最高层C5的通道数通过1x1的卷积固定到256得到融合层特征P5。而P4则是通过将P5层通过双线性插值的方式上采样到14x14x256大小，再与C4层通过1x1卷积固定通道得到的结果相加，实现相邻层之间的特征融合。以此类推即可相应的得到P3和P2层特征。而P6层特征则是通过对P5层用max-pooling的方式下采样得到的，注意有些博客写的是通过C6层得到的，是不对的。那么我们将通过特征融合的方式将高层语义传播到低层卷积得到P_list的过程叫做自顶向下。

对应代码分析

在掌握原理的前提下就比较好对代码进行消化吸收了。在讲代码的时候我会从/FPN_Tensorflow_master/libs/networks/build_whole_network.py开始讲起。这一部分对应着网络的搭建，也就是Tensorflow构建图的过程。根据讲解的需要会调到具体的函数仔细分析，类似于你在Debug的过程。主要带大家体会一下Tensor在图中流动的感觉。
那么我们要看的第一个函数就是build_whole_detection_network这个函数，在这里我们搭建了整个FPN框架。我会依次的讲解FPN的每个部件是如何实现的。

def build_whole_detection_network(self, input_img_batch, gtboxes_batch):

    if self.is_training:
        # ensure shape is [M, 5]
        gtboxes_batch = tf.reshape(gtboxes_batch, [-1, 5])
        gtboxes_batch = tf.cast(gtboxes_batch, tf.float32)

    img_shape = tf.shape(input_img_batch)

    # 1. build base network
    P_list = self.build_base_network(input_img_batch)  # [P2, P3, P4, P5, P6]

这里我们可以看到，函数的输入由两部分构成：图片Batch以及标签Batch。在训练时将gtboxes_batch变形为（N,5)的tensor，其中N为批次大小。img_shape这里存储了图片形状以便后面使用。
而FPN用来预测的特征图则是通过build_base_network函数实现的。

def build_base_network(self, input_img_batch):

    if self.base_network_name.startswith('resnet_v1'):
        return resnet.resnet_base(input_img_batch, scope_name=self.base_network_name, is_training=self.is_training)

    elif self.base_network_name.startswith('MobilenetV2'):
        return mobilenet_v2.mobilenetv2_base(input_img_batch, is_training=self.is_training)

    else:
        raise ValueError('Sry, we only support resnet or mobilenet_v2')

这里根据全局变量cfgs文件中的输入选择不同的Backbone来得到P_list。这个版本的代码只支持ResNet和MobileNet两个网络，本文仅以ResNet为例。根据调用我们接着看resnet_base这个函数（这里我不全粘贴，根据需求只粘贴部分代码片。）

def resnet_base(img_batch, scope_name, is_training=True):
    '''
    this code is derived from light-head rcnn.
    https://github.com/zengarden/light_head_rcnn

    It is convenient to freeze blocks. So we adapt this mode.
    '''
    if scope_name == 'resnet_v1_50':
        middle_num_units = 6
    elif scope_name == 'resnet_v1_101':
        middle_num_units = 23
    else:
        raise NotImplementedError('We only support resnet_v1_50 or resnet_v1_101. Check your network name....yjr')

    blocks = [resnet_v1_block('block1', base_depth=64, num_units=3, stride=2),
              resnet_v1_block('block2', base_depth=128, num_units=4, stride=2),
              resnet_v1_block('block3', base_depth=256, num_units=middle_num_units, stride=2),
              resnet_v1_block('block4', base_depth=512, num_units=3, stride=1)]

函数输入为图像Batch、变量名称以及是否为训练。变量名用来判断选择ResNet50还是ResNet101，其主要改变的是CONV4中残差单元的个数。这里采用的是瓶颈残差单元，用Conv1x1、Conv3x3、Conv1x1来代替Conv3x3的卷积操作。这样可以在低纬度上进行3x3运算，减少了计算代价。

其在实现的过程也是如图所示，因此每个Bottleneck包含3个卷积层。ResNet101的卷积层数=(3+4+23+3)x3=99,如果加上后续的两个FC层即101层。

def bottleneck(inputs,
               depth,
               depth_bottleneck,
               stride,
               rate=1,
               outputs_collections=None,
               scope=None):
  """Bottleneck residual unit variant with BN after convolutions.

  This is the original residual unit proposed in [1]. See Fig. 1(a) of [2] for
  its definition. Note that we use here the bottleneck variant which has an
  extra bottleneck layer.

  When putting together two consecutive ResNet blocks that use this unit, one
  should use stride = 2 in the last unit of the first block.

  Args:
    inputs: A tensor of size [batch, height, width, channels].
    depth: The depth of the ResNet unit output.
    depth_bottleneck: The depth of the bottleneck layers.
    stride: The ResNet unit's stride. Determines the amount of downsampling of
      the units output compared to its input.
    rate: An integer, rate for atrous convolution.
    outputs_collections: Collection to add the ResNet unit output.
    scope: Optional variable_scope.

  Returns:
    The ResNet unit's output.
  """
  with variable_scope.variable_scope(scope, 'bottleneck_v1', [inputs]) as sc:
    depth_in = utils.last_dimension(inputs.get_shape(), min_rank=4)
    if depth == depth_in:
      shortcut = resnet_utils.subsample(inputs, stride, 'shortcut')
    else:
      shortcut = layers.conv2d(
          inputs,
          depth, [1, 1],
          stride=stride,
          activation_fn=None,
          scope='shortcut')

    residual = layers.conv2d(
        inputs, depth_bottleneck, [1, 1], stride=1, scope='conv1')
    residual = resnet_utils.conv2d_same(
        residual, depth_bottleneck, 3, stride, rate=rate, scope='conv2')
    residual = layers.conv2d(
        residual, depth, [1, 1], stride=1, activation_fn=None, scope='conv3')

    output = nn_ops.relu(shortcut + residual)

    return utils.collect_named_outputs(outputs_collections, sc.name, output)

这里解释了ResNet50和101参数选择的影响。接着往下看：

with slim.arg_scope(resnet_arg_scope(is_training=False)):
    with tf.variable_scope(scope_name, scope_name):
        # Do the first few layers manually, because 'SAME' padding can behave inconsistently
        # for images of different sizes: sometimes 0, sometimes 1
        net = resnet_utils.conv2d_same(
            img_batch, 64, 7, stride=2, scope='conv1')
        net = tf.pad(net, [[0, 0], [1, 1], [1, 1], [0, 0]])
        net = slim.max_pool2d(
            net, [3, 3], stride=2, padding='VALID', scope='pool1')

not_freezed = [False] * cfgs.FIXED_BLOCKS + (4-cfgs.FIXED_BLOCKS)*[True]
# Fixed_Blocks can be 1~3

由于SAME padding在不同大小特征图上的不稳定性，选择手动的方式搭建C1层。首先通过一个卷积核7x7、步长为2、通道数64的卷积。再对其HW维度上下左右补一圈0，通过Max_pooling下采样得到C1层。
not_freezed控制是否冻结权重，在fine-tuning的时候可以微调网络参数。

with slim.arg_scope(resnet_arg_scope(is_training=(is_training and not_freezed[0]))):
    C2, end_points_C2 = resnet_v1.resnet_v1(net,
                                            blocks[0:1],
                                            global_pool=False,
                                            include_root_block=False,
                                            scope=scope_name)

# C2 = tf.Print(C2, [tf.shape(C2)], summarize=10, message='C2_shape')
add_heatmap(C2, name='Layer2/C2_heat')

这里按照blocks给出的参数搭建CONV块，实现比较复杂，有兴趣可以自己去看一下。将C1层的结果输入得到C2层，以及C2的节点字典。add_heatmap用于绘制热力图。后续C3-C5层类似。

def add_heatmap(feature_maps, name):
    '''

    :param feature_maps:[B, H, W, C]
    :return:
    '''

    def figure_attention(activation):
        fig, ax = tfp.subplots()
        im = ax.imshow(activation, cmap='jet')
        fig.colorbar(im)
        return fig

    heatmap = tf.reduce_sum(feature_maps, axis=-1)
    heatmap = tf.squeeze(heatmap, axis=0)
    tfp.summary.plot(name, figure_attention, [heatmap])

将NHWC的tensor的通道维度求和压缩，squee去除B和C维度得到HW的热力图绘制到Tensorboard中。

feature_dict = {'C2': end_points_C2['{}/block1/unit_2/bottleneck_v1'.format(scope_name)],
                'C3': end_points_C3['{}/block2/unit_3/bottleneck_v1'.format(scope_name)],
                'C4': end_points_C4['{}/block3/unit_{}/bottleneck_v1'.format(scope_name, middle_num_units - 1)],
                'C5': end_points_C5['{}/block4/unit_3/bottleneck_v1'.format(scope_name)],
                # 'C5': end_points_C5['{}/block4'.format(scope_name)],
                }

将C2到C5层的结果保存到C_list完成自下到上过程。

pyramid_dict = {}
with tf.variable_scope('build_pyramid'):
    with slim.arg_scope([slim.conv2d], weights_regularizer=slim.l2_regularizer(cfgs.WEIGHT_DECAY),
                        activation_fn=None, normalizer_fn=None):

        P5 = slim.conv2d(C5,
                         num_outputs=256,
                         kernel_size=[1, 1],
                         stride=1, scope='build_P5')
        if "P6" in cfgs.LEVLES:
            P6 = slim.max_pool2d(P5, kernel_size=[1, 1], stride=2, scope='build_P6')
            pyramid_dict['P6'] = P6

        pyramid_dict['P5'] = P5

        for level in range(4, 1, -1):  # build [P4, P3, P2]

            pyramid_dict['P%d' % level] = fusion_two_layer(C_i=feature_dict["C%d" % level],
                                                           P_j=pyramid_dict["P%d" % (level+1)],
                                                           scope='build_P%d' % level)
        for level in range(4, 1, -1):
            pyramid_dict['P%d' % level] = slim.conv2d(pyramid_dict['P%d' % level],
                                                      num_outputs=256, kernel_size=[3, 3], padding="SAME",
                                                      stride=1, scope="fuse_P%d" % level)
for level in range(5, 1, -1):
    add_heatmap(pyramid_dict['P%d' % level], name='Layer%d/P%d_heat' % (level, level))

# return [P2, P3, P4, P5, P6]
print("we are in Pyramid::-======>>>>")
print(cfgs.LEVLES)
print("base_anchor_size are: ", cfgs.BASE_ANCHOR_SIZE_LIST)
print(20 * "__")
return [pyramid_dict[level_name] for level_name in cfgs.LEVLES]

接着根据自顶到下的思想，首先计算得到P5层。后续层融合通过fusion_two_layer函数实现。再通过3x3卷积处理P4-P2,将热力图保存，返回P_list，完成特征提取过程。

def fusion_two_layer(C_i, P_j, scope):
    '''
    i = j+1
    :param C_i: shape is [1, h, w, c]
    :param P_j: shape is [1, h/2, w/2, 256]
    :return:
    P_i
    '''
    with tf.variable_scope(scope):
        level_name = scope.split('_')[1]
        h, w = tf.shape(C_i)[1], tf.shape(C_i)[2]
        upsample_p = tf.image.resize_bilinear(P_j,
                                              size=[h, w],
                                              name='up_sample_'+level_name)

        reduce_dim_c = slim.conv2d(C_i,
                                   num_outputs=256,
                                   kernel_size=[1, 1], stride=1,
                                   scope='reduce_dim_'+level_name)

        add_f = 0.5*upsample_p + 0.5*reduce_dim_c

        # P_i = slim.conv2d(add_f,
        #                   num_outputs=256, kernel_size=[3, 3], stride=1,
        #                   padding='SAME',
        #                   scope='fusion_'+level_name)
        return add_f

对于输入P进行上采样，使得于C有同样大小。对于C进行通道固定，使得其与P通道维度相同，求和实现融合。

目标检测neck经典算法之FPN的源码实现 ZzzZ31415926 目标检测算法人工智能图像处理计算机视觉深度学习 python
┌────────────────────────────────────────────────────┐│初始化构造(__init__)│└────────────────────────────────────────────────────┘↓【1】参数保存+基础配置断言↓【2】判断使用哪些backbone层（start→end）↓【3】判断是否添加额外输出（extraconv）↓【4】构
YOLOv11改进 | Neck篇 | 双向特征金字塔网络BiFPN助力YOLOv11有效涨点 wei子 YOLOv11 YOLO 人工智能
YOLOv11改进|Neck篇|双向特征金字塔网络BiFPN助力YOLOv11有效涨点引言目标检测领域的最新进展表明，特征金字塔网络（FPN）的设计对模型性能具有决定性影响。本文详细介绍如何将**双向特征金字塔网络（BiFPN）**集成到YOLOv11的Neck部分，通过改进的多尺度特征融合机制实现检测性能的显著提升。实验证明，该改进在COCO数据集上可实现2.3%~3.1%的mAP提升，同时保持
【YOLOv12多模态融合改进】| 改进双HS-FPN颈部结构：高级筛选特征融合金字塔，加强不同模态间的细微特征检测 Limiiiing YOLO多模态融合改进 YOLO 计算机视觉目标检测多模态
一、本文介绍本文改进双HS-FPN颈部结构，融合YOLOv12中的多模态特征，以优化目标检测网络模型。HS-FPN借助通道注意力机制及独特的多尺度融合策略，有效应对目标尺寸差异及特征稀缺问题。针对不同模态，其利用高级特征筛选低级特征，增强特征表达，助力模型精准定位和识别目标，减少因尺度变化及特征不足导致的检测误差，提升YOLOv12在多模态检测任务中的准确性与稳定性。专栏目录：《多模态模型改进》目
UNet 改进(26)：与FPN结合的图像分割网络点我头像干啥 Unet 模型改进 transformer 深度学习人工智能
1.介绍在计算机视觉领域，图像分割是一个核心任务，而UNet架构因其优异的性能在医学图像分割等领域广受欢迎。本文将详细解析一个结合了UNet和特征金字塔网络(FPN)的创新架构，展示如何通过融合两种经典网络的优势来提升分割性能。网络架构概述这个代码实现了一个结合UNet和FPN的混合架构，主要包含以下几个关键组件：DoubleConv模块：基础的双卷积块FPN模块：特征金字塔网络UNetWithF
ResNet改进(41)：与FPN结合的图像分类模型点我头像干啥 ResNet 改进【有效涨点！】深度学习人工智能机器学习
1.介绍概述本文将详细解析一个结合了ResNet34和特征金字塔网络(FPN)的自定义图像分类模型。该模型提供了两种工作模式：标准ResNet模式和FPN增强模式，能够灵活适应不同的图像分类需求。模型架构1.FPN(FeaturePyramidNetwork)模块FPN是一种用于构建多尺度特征表示的网络结构，特别适合处理不同尺寸的目标检测任务。在我们的实现中，FPN被用于增强图像分类任务的性能。c
`cv4` 在 `YOLO-Pose` 任务中的作用有人给我介绍对象吗 AI论文写作 YOLO
我们以一个具体的例子来分析self.cv4处理特征图时通道数和高宽的变化。假设初始输入假设ch=(256,512,1024)，表示YOLO网络输出的3个特征层，每个层的通道数分别是256、512和1024。假设输入图片大小为640×640。不同特征层的输入大小通常，YOLO采用FPN结构，多尺度特征图大致如下：特征层通道数(x)特征图大小P3(小目标)25680×80P4(中目标)51240×40
Tensorflow 2 单GPU同时训练多个模型 TTTYYZZ 笔记深度学习 tensorflow 神经网络
Tensorflow2单GPU同时训练多个模型问题有时我们需要对多个模型进行性能对比。若一次只训练一个模型，我们需要时刻关注训练进度，非常耗费精力。同时进行多个模型的训练能够降低人力成本。代码这里对三个网络进行图像的二值分割训练，它们分别是Unet,Linknet,FPN。利用for循环对整训练集进行遍历。train函数是这段代码的核心，每调用一次train就进行一次迭代。with里面是前向传播形
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？努力毕业的小土博^_^ AI算法题库人工智能算法计算机视觉深度学习神经网络
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决多尺度问题？文章目录【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决多尺度问题？前言数据级别的多尺度模型架构上的多尺度表示FPN代码示例（PyTorch）说明其他多尺度处理方法总结欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校
深度学习项目十一：mmdetection训练自己的数据集小啊磊_Vv 深度学习和视觉项目实战目标跟踪人工智能计算机视觉 python 深度学习
mmdetection训练自己的数据集这里写目录标题mmdetection训练自己的数据集一：环境搭建二：数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式yolo转coco数据集格式的代码三：训练dataset数据文件配置configs1.在configs/faster_rcnn/faster-rcnn_r101_fpn_1x_coco.py
自动驾驶之BEVDet maxruan BEV 自动驾驶自动驾驶人工智能机器学习
BEVDet主要分为4个模块：1、图像视图编码器（Image-viewEncoder）:就是一个图像特征提取的网络，由主干网络backbone+颈部网络neck构成。经典主干网络比如resnet,SwinTransformer等。neck有==FPN==,PAFPN等。例如输入环视图像，记作Tensor([bs,N,3,H,W])，提取多尺度特征；其中bs=batchsize，N=环视图像的个数，
【特征融合】卷积神经网络中的特征融合方式有哪些？？让我们一起看看！ 985小水博一枚呀深度学习学习笔记 cnn 人工智能神经网络 python numpy tensorflow 深度学习
【特征融合】卷积神经网络中的特征融合方式总结与探索…【特征融合】卷积神经网络中的特征融合方式总结与探索…文章目录【特征融合】卷积神经网络中的特征融合方式总结与探索...前言：1.串联（Concatenation）2.加法（Addition）3.乘法（Multiplication/Attention）4.全局池化（GlobalPooling）5.特征金字塔网络（FPN）6.跨模态融合（Cross-M
【语义分割专题文章】 BoostingIsm Segmentation python
本栏聚焦在语义分割的相关算法，专栏内文章的代码均已实现。一、数据篇【遥感】【道路】篇：【语义分割】【专题系列】一、MassachusettsRoadsDataset马萨诸塞州道路数据集获取二、CNN篇Unet(2015)：【语义分割】【专题系列】二、Unet语义分割代码实战PSPNet(2017)：【语义分割】【专题系列】三、PSPNet语义分割代码实战Linknet(2017)FPN(Featu
YOLOv10改进策略【Neck】| HS-FPN：高级筛选特征融合金字塔，加强细微特征的检测 Limiiiing YOLOv10改进专栏 YOLO 深度学习计算机视觉目标检测
一、本文介绍本文将HS-FPN结构融入YOLOv10以优化目标检测网络模型。HS-FPN借助通道注意力机制及独特的多尺度融合策略，有效应对目标尺寸差异及特征稀缺问题。在YOLOv10中应用HS-FPN时，其利用高级特征筛选低级特征，增强特征表达，助力模型精准定位和识别目标，减少因尺度变化及特征不足导致的检测误差，显著提升YOLOv10在各项检测任务中的准确性与稳定性。专栏目录：YOLOv10改进目
YOLOV8涨点技巧之MCA多维协作注意力模块呆头鹅AI工作室深度学习算法详解及代码复现 YOLO 深度学习人工智能计算机视觉 python conda
1.算法设计：基于MCA的YOLOv8优化1.1总体架构YOLOv8的优化算法在原有架构的基础上，引入了MCA模块，以增强特征提取能力和目标定位精度。MCA模块被嵌入到YOLOv8的主干网络（Backbone）和特征金字塔网络（FPN）中，用于捕捉多维度的上下文信息。1.2MCA模块设计MCA模块的核心思想是通过多维度的注意力机制（如通道注意力、空间注意力和尺度注意力）来增强特征表示。其结构如下：
基于yolov8的绝缘子缺陷检测系统python源码+onnx模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO
【算法介绍】基于YOLOv8的绝缘子缺陷检测系统是一种利用先进深度学习技术的高效解决方案，旨在提升电力行业中输电线路的维护和监控水平。YOLOv8作为YOLO系列算法的最新版本，具备更高的检测速度和精度，特别适用于实时物体检测任务。该系统通过深入分析并标注绝缘子数据集，训练YOLOv8模型以精确识别输电线上的绝缘子及其缺陷状态。利用多尺度检测、FPN结构以及CSPDarknet网络等技术，YOLO
《Residual Bi-Fusion Feature Pyramid Network for Accurate Single-shot Object Detection》论文笔记 m_buddy #General Object Detection Bi-Fusion
参考代码：无1.概述导读：在检测任务中一般会引入FPN增强在不同尺度下网络的检测性能，但是只通过top-down的FPN网络是很难去重建由于特征图的漂移（水平或是垂直方向运动）在经过pooling操作（pooling不具有平移不变性）带来结果相差很大的问题（特别针对小目标），而且FPN带来的性能提升会在使用较多卷积层之后逐渐被稀释（卷积的平移不变形），进而会导致一些小目标定位性能降低。对此可以通过
【初读论文】 Selvaggia 深度学习 python
这里写目录标题万字长文解析深度学习中的术语面向小白的深度学习论文术语（持续更新）deepsolo不懂的知识pipelinebaselineRoI(RegionofInterest)分类问题中的正例负例指示函数（indicatorfunction）模型性能评估指标（PRF1……）深度学习中的FPN详解CNN解码Transformer：自注意力机制与编解码器机制详述与代码实现deepsolo前言知乎深
选导师不如“管理”导师：学术沟通的5个技巧 93d3fdee4790
文章来源于：科学网原文链接：https://mp.weixin.qq.com/s/FPn8DEJnnx1OzY5j6cySuA当我们开启了博士之旅，也就拉开了与博士生导师“相爱相杀”的故事帷幕。与一个我们无比尊敬、也有可能时常令人紧张害怕的人朝夕相处，想想都很激动人心。每个导师都有自己的管理风格，但这并不意味着学生要全盘接受，如果能学会“向上管理”，或许就能拥有一位最适合自身学术成长的导师。前不久
php-fpn配置,php-fpm的配置和优化山月抚过惊蛰 php-fpn配置
php-fpm的配置和优化php我在前面几篇中，很详细的讲述了php-fpm的各种介绍，和安装。今天来看一下它的配置文件php-fpm的各种配置以及一些常见的优化。php-fpm的安装目录下面是我的平时的环境搭建php的各种安装目录，大家的基本也差不多。centos等linux平台/usr/local/php/php/usr/local/php/etc/php.ini/usr/local/php/
经典目标检测YOLO系列(三)YOLOv3的复现(2)正样本的匹配、损失函数的实现 undo_try #深度学习目标检测 YOLO
经典目标检测YOLO系列(三)YOLOv3的复现(2)正样本的匹配、损失函数的实现我们在之前实现YOLOv2的基础上，加入了多级检测及FPN，快速的实现了YOLOv3的网络架构，并且实现了前向推理过程。经典目标检测YOLO系列(三)YOLOV3的复现(1)总体网络架构及前向处理过程我们继续进行YOLOv3的复现。1正样本匹配策略1.1基于先验框的正样本匹配策略官方YOLOv2的正样本匹配思路是根据
FPN结构酸酸甜甜我最爱基础理论学习人工智能
FPN——FeaturePyramidNetworksbackbone指网络的主干结构。在FasterR-CNN中就用到FPN结构了，FPN结构对网络的好处在于：针对目标检测任务，cocoAP(IoU从0.5~0.95的均值)提升2.3个点，pascalAP提升3.8个点。图a是一个特征图像金字塔结构，在传统的图像处理中是非常常见的一个办法。针对我们要检测不同尺度的目标的时候呢，会将图片首先给缩放
Mask Scoring R-CNN,代码运行报错KeyError: ‘Non-existent config key: MODEL.PRETRAINED_MODELS‘ 骑走的小木马报错 Mask Scoring R-CNN
这几天在做MaskScoringR-CNN算法运行，可是运行命令：pythontools/train_net.py--config-fileconfigs/e2e_mask_rcnn_R_50_FPN_1x.yaml总是报错：KeyError:'Non-existentconfigkey:MODEL.PRETRAINED_MODELS'我是根据，下面几个博客进行修改config下面的e2e_mas
目标检测 - FPN结构 mango1698 AI 目标检测深度学习人工智能
论文：FeaturePyramidNetworksforObjectDetection网址：https://arxiv.org/abs/1612.03144图a为特征图像金字塔，针对我们要检测不同尺度的目标时，我们会将图片缩放到不同的尺度，针对每个尺度的图片都经过我们的模型进行预测。面临问题：生成n个不同的尺度，就要重新预测n次，这样效率是很低的。图b为Faster-CNN采用的一种方式，图片通过
特征融合篇 | YOLOv8 引入长颈特征融合网络 Giraffe FPN 迪菲赫尔曼 YOLOv8改进实战 YOLO ultralytics GFPN FPN DAMO-YOLO
在本报告中，我们介绍了一种名为DAMO-YOLO的快速而准确的目标检测方法，其性能优于现有的YOLO系列。DAMO-YOLO是在YOLO的基础上通过引入一些新技术而扩展的，这些技术包括神经架构搜索（NAS）、高效的重参数化广义FPN（RepGFPN）、带有AlignedOTA标签分配的轻量级头部以及蒸馏增强。特别地，我们使用MAE-NAS，一种受最大熵原理指导的方法，在低延迟和高性能的约束下搜索我
FCOS: Fully Convolutional One-Stage Object Detection Cat丹
关键词：一阶段物体检测，anchorfree。网络结构为backbone+fpn+head（5个）。预测结果为：类别，是否为物体中心点，该点与box四边的距离。训练时，通过(x,y)是否位于gtbox内判定改位置是否为正样本，当该点同时在几个gtbox内时，选择面积最小的box为其目标box。在这里作者采用了双阈值，该点距离四边的最大距离大于或者小于，则认为该样本为负样本。这样做的好处可以排除掉将
【学习】FPN特征金字塔超好的小白深度学习学习记录学习
论文：FeaturePyramidNetworksforObjectDetection（CVPR2016)参考blog：https://blog.csdn.net/weixin_55073640/article/details/122627966参考视频讲解：添加链接描述卷积网络中，深层网络容易响应语义特征，浅层网络容易响应图像特征。然而，在目标检测中往往因为卷积网络的这个特征带来了不少麻烦：高层
选导师不如“管理”导师：学术沟通的5个技巧 8a9157275445
文章来源于：科学网原文链接：https://mp.weixin.qq.com/s/FPn8DEJnnx1OzY5j6cySuA当我们开启了博士之旅，也就拉开了与博士生导师“相爱相杀”的故事帷幕。与一个我们无比尊敬、也有可能时常令人紧张害怕的人朝夕相处，想想都很激动人心。每个导师都有自己的管理风格，但这并不意味着学生要全盘接受，如果能学会“向上管理”，或许就能拥有一位最适合自身学术成长的导师。前不久
Mask R-CNN 学习笔记丶夜未央丶深度学习计算机视觉
MaskR-CNN学习笔记前述从VGGNet到ResNet从ROIPooling到ROIAlign量化误差是从哪来的ROIAlign的改进之处网络结构FPN网络损失函数参考博客前述从R-CNN，fastR-CNN，fasterR-CNN一直看到了现在的maskR-CNN，一步一步看着从detection到segmentation是如何一步一步走来的，人们是如何改进的。前面几篇文章作为了解，但是Ma
[DL]深度学习_Feature Pyramid Network IAz- 深度学习深度学习人工智能
FPN结构详解目录一、概念介绍二、结构详解1、对比试验2、特征图融合3、结构详解4、不同尺度预测5、Proposal映射到预测特征层一、概念介绍FeaturePyramidNetwork(FPN)是一种用于目标检测和语义分割的神经网络架构。它的目标是解决在处理不同尺度的图像时，信息丢失和语义细节模糊的问题。FPN的核心思想是通过在网络中添加一组横向连接来构建多尺度特征金字塔。这些横向连接将底层的高
YOLOv5改进之BiFPN(含代码，超详细哦) kay_545 YOLO 深度学习 yolov5
BiFPN论文论文地址：[1911.09070]EfficientDet:ScalableandEfficientObjectDetection(arxiv.org)BiFPN简介BiFPN即“双向特征金字塔网络”，是一种常用于计算机视觉任务，特别是目标检测和实例分割的神经网络架构。它扩展了特征金字塔网络（FPN），通过在金字塔级别之间引入双向连接，使信息能够在网络中同时进行自底向上和自顶向下的流
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

特征金字塔网络代码详解——FPN的Tensorflow版本

FPN的代码详解——特征提取

特征提取原理

对应代码分析

你可能感兴趣的:(FPN)