图波列夫

Faster R-CNN 与 RPN

Fast R-CNN 实现了候选框的特征图共享，大幅提高了训练及部署的效率。然而，网络输入仍然依赖 Selective Search 等方法，在整个系统中耗时占比较高且优化空间有限。

Faster R-CNN 使用 RPN 网络生成候选区域。RPN 与第2阶段的 Fast R-CNN 共享特征图，使得效率再次跃升。

Faster R-CNN 的整体框架如下图所示。

RPN 告诉检测器需要看哪里，相当于为检测器添加了注意力机制。

The RPN takes the convolutional feature map and generates proposals over the image

如果将 Faster R-CNN 中的第2阶段看作是 Fast R-CNN 在特征图上滑窗；YOLO 则以全连接层直接接入了整张图像；SSD 像是多类别多特征图的 RPN；FPN 接入金字塔融合特征。

RPN

RPN 网络结构如下图所示：

Convolutional implementation of an RPN architecture, where k is the number of anchors.

RPN 是一个全卷积网络，可同时预测每个位置的目标边界和分数，生成高质量的区域提案，供 Fast R-CNN 用于检测。RPN 可以和 Fast R-CNN 进行联合训练，实现端到端优化。

基于区域的检测器（如 Fast R-CNN ）所使用的卷积特征映射也可用于生成区域提议。在这些卷积特征之上，可以通过添加一些额外的卷积层来构建 RPN，这些卷层同时回归规则网格上每个位置处的区域边界和目标得分。RPN 将图像（任意大小）作为输入并输出一组矩形目标提议，每个提议都有一个目标分数。Faster R-CNN 在实验中研究了两种 backbone 网络——ZFNet（5个可共享的卷积层）和 VGG-16（13个可共享的卷积层）。

RPN 旨在有效地预测具有各种尺度和纵横比的区域提议。与使用图像金字塔或金字塔滤波器的流行方法(DPM、OverFeat、SPPNet、Fast R-CNN)相比，其引入了“anchor”框，作为多尺度和纵横比的参考。RPN 可以看作是回归参考的金字塔，它避免了枚举不同尺度或纵横比的图像或滤波器。该模型使用单尺度图像进行训练和测试，性能良好且有利于提升运行速度。

为了生成区域提议，文章在最后一个共享卷积层输出的卷积特征图上滑动一个小网络。这个小网络以特征图上的 $\times n$ 空间窗口作为输入。每个滑动窗口映射到一个较低维度的特征（ZFNet 为256-d，VGG-16为512-d，后面是 ReLU）。将此特征送入两个并蒂的全连接层——一个目标框回归层(reg)和一个目标框分类层(cls)。我们在本文中使用 $n = 3$ ，注意到输入图像上的有效感受野很大（ZFNet 为171个像素，VGG-16 为228像素）。这个迷你网络的单个位置如下图所示。

请注意，由于迷你网络以滑动窗口方式运行，因此全连接层在所有空间位置共享。这种架构自然地用 $\times n$ 卷积层实现，然后是两个并蒂 $\times 1$ 卷积层（分别用于 reg 和 cls）。ReLU 应用于 $\times n$ conv 层的输出。

Anchors

Anchor centers throught the original image

在每个滑动窗口位置，RPN 同时预测多个区域提案。假设每个位置的最大可能提案数量为 $k$ ，则 reg 层有 $4 k$ 输出编码 $k$ 个 box 的坐标，cls 层输出 $2 k$ 个得分，用于估算每个提案是否为目标的概率¹。 $k$ 个提议相对于 $k$ 个参考框参数化，我们称之为 锚点(anchors)。锚点位于所讨论滑动窗口的中心，并且与尺度和纵横比相关联。默认情况下，Faster R-CNN 使用3个尺度和3个宽高比，在每个滑动位置产生 $k = 9$ 个锚点。对于大小为 $\times H$ （通常 $\sim$ 2,400）的卷积特征映射，总共有 $W H k$ 个锚点。

平移不变性

锚点以及基于锚点计算提议的设计使得方法具有平移不变性。如果平移图中的对象，则提案也会平移，并且相同的函数应该能够在任一位置预测提案。作为比较，MultiBox 方法使用 k-means 生成800个锚点，这些锚点不是平移不变量。因此，如果平移对象，MultiBox 不保证生成相同的提议。

平移不变属性还会减小模型大小。MultiBox 有一个 $(4+1)\times800$ 维的全连接输出层，而 RPN 在 $k = 9$ 锚点的情况下有一个 $(4+2)\times9$ 维卷积输出层。结果，RPN 输出层有 $2.8\times10^4$ 个参数（VGG-16 为 $512\times(4+2)\times9$ ），比 MultiBox 的输出层少了两个数量级，其输出为 $6.1\times10^6$ 个参数（GoogleNet 的为 $1536\times(4+1)\times800$ ）。

如果考虑特征投影层，RPN 的提议层的参数仍然比 MultiBox 少一个数量级。RPN 的提案层的参数计数是 $3\times3\times512\times512+512\times6\times9=2.4\times10^6$ ； MultiBox 的提议层的参数计数为 $7\times7\times(64+96+64+64)\times1536+1536\times5\times800=27\times10^6$ 。所以 RPN 在 PASCAL VOC 等小数据集上的过度拟合风险较小。

锚点金字塔

目标尺度及纵横比的多样性是检测领域的一个难点。之前通行的途径是构造图像（特征）金字塔( DPM、OverFeat、SPPNet、Fast R-CNN)或滤波器金字塔(DPM)。这中间的重复计算会非常耗时。RPN 在每个位置参考多尺度和纵横比的锚框对边界框进行分类和回归，相当于在单尺度图像上建立了锚点金字塔。RPN 仅最后的 reg 和 cls 层随 $k$ 线性增长，比前两种方法更为高效。

损失函数

为了训练 RPN，我们为每个锚点分配一个二进制类标签（是否为目标）。我们为两种锚点分配一个正标签：

与真实框具有最高交并比（IoU）的锚点；
与某一真实框重叠 IoU 高于0.7的锚点。

请注意，单个真实框可以为多个锚点分配正标签。

通常第二个条件足以确定正样本；但我们仍采用第一个条件，因为在极少数情况下，第二个条件可能没有找到正样本。

如果与所有真实框的 IoU 比率低于0.3，我们会为非正锚点分配负标签。既不是正也不是负的锚点对训练目标没有贡献。

通过这些定义，我们根据 Fast R-CNN 中的多任务损失来最小化目标函数。我们对图像的损失函数定义为：

$L(\{p_i\}, \{t_i\}) = \frac{1}{N_{cls}}\sum_i L_{cls}(p_i, p^{*}_i) \\ + \lambda\frac{1}{N_{reg}}\sum_i p^{*}_i L_{reg}(t_i, t^{*}_i).$

这里， $i$ 是 mini-batch 中锚点的索引， $p_i$ 是锚点 $i$ 的目预测概率。如果锚点为正，则真实标签 $p^{\ast}_i$ 为1；如果锚点为负，则为0。 $t_i$ 是表示预测边界框的4个参数化坐标的向量， $t^{\ast}_i$ 是与正锚点相关联的真实框的向量。分类损失 $L_{cls}$ 是两个类（目标 vs 非目标）的对数损失。对于回归损失，我们使用 $L_{reg}(t_i, t^{\ast}_i)=R(t_i - t^{\ast}_i)$ 其中 $R$ 是鲁棒损失函数（smooth L $_1$ ）在 Fast R-CNN 中定义。累加项 $p^{\ast}_i L_{reg}$ 表示仅对正锚( $p^{*}_i=1$ )激活回归损失，否则禁用( $p^{*}_i=0$ )。cls 和 reg 层的输出分别由 ${p_i\}$ 和 ${t_i\}$ 组成。

公式中两项分别由 $N_{cls}$ 和 $N_{reg}$ 归一化，并由平衡参数 $\lambda$ 加权。在论文当前的实现中（如在已发布的代码中），上式中的 $c l s$ 项由 mini-batch 的大小归一化（例如， $N_{cls}=256$ ）， $r e g$ 项由锚点位置的数量归一化（即 $N_{reg}\sim2,400$ ）。默认情况下，我们设置 $\lambda=10$ ，因此 cls和 reg 两项的加权大致相等。我们通过实验证明，结果对 $\lambda$ 的值在很大范围内不敏感。我们还注意到，上述标准化不是必需的，可以简化。

对于边界框回归，Faster R-CNN 遵从 R-CNN 中的4坐标参数化方法：

$\begin{aligned} t_{\textrm{x}} &= (x - x_{\textrm{a}})/w_{\textrm{a}},\quad t_{\textrm{y}} = (y - y_{\textrm{a}})/h_{\textrm{a}},\\ t_{\textrm{w}} &= \log(w / w_{\textrm{a}}), \quad \enspace t_{\textrm{h}} = \log(h / h_{\textrm{a}}),\\ t^{*}_{\textrm{x}} &= (x^{*} - x_{\textrm{a}})/w_{\textrm{a}},\quad t^{*}_{\textrm{y}} = (y^{*} - y_{\textrm{a}})/h_{\textrm{a}},\\ t^{*}_{\textrm{w}} &= \log(w^{*} / w_{\textrm{a}}),\quad \enspace t^{*}_{\textrm{h}} = \log(h^{*} / h_{\textrm{a}}), \end{aligned}$

其中 $x$ , $y$ , $w$ 和 $h$ 表示盒子的中心坐标及其宽度和高度。变量 $x$ , $x_{\textrm{a}}$ 和 $x^{\ast}$ 分别用于预测框、锚框和真实框（同样适用于 $y, w, h$ ）。这可以被认为是从锚框到附近的真实框的边界框回归。

然而，RPN 回归边界框的方式与先前基于 RoI（感兴趣区域）方法(SPPNet，Fast R-CNN)不同。SPPNet 和 Fast R-CNN 对来自任意大小的 RoI 的特征执行边界框回归，并且不同区域大小共享回归权重。而 RPN 用于回归的特征在特征图上具有相同空间大小（ $\times 3$ ）。为了考虑不同的大小，学习 $k$ 个边界框回归器。每个回归器负责一个比例和一个纵横比，而 $k$ 个回归器不共享权重。因此，由于锚点的设计，即使特征具有固定尺寸和比例，仍然可以预测各种尺寸的盒子。

RPN 的训练

RPN 可以通过反向传播和随机梯度下降(SGD)进行端到端训练。我们遵循 Fast R-CNN“以图像为中心”的采样策略来训练这个网络。每个 mini-batch 包含来自单个图像的正负锚点样本。可以优化所有锚点的损失函数，但这将偏向负样本，因为它们占主导地位。相反，我们在图像中随机采样256个锚点来计算 mini-batch 的损失函数，其中采样的正负锚点的比率最高为 1：1。如果图像中的正样本少于128个，我们将在 mini-batch 中填充负样本。（此处为 MegDet 的一个着眼点。）

至此，论文中 RPN 描述完毕，然而还有一些事项未有涉及，比较重要的例如 NMS（on-maximum suppression，非极大抑制）。这正是检测与分类不同的地方，有很多 CNN 中的非标准化操作。由于定义的锚点框相互重叠，同一目标会产生多个提议。NMS 获取按照分数排序的建议列表并对已排序的列表进行迭代，丢弃那些 IoU 值大于某个预定义阈值的建议，最终保留分数最高的且不重叠的前 k 个提议。详细操作会结合程序进行介绍。

add_generic_rpn_outputs

在 Detectron 的 rpn_heads.py 中，add_generic_rpn_outputs 向 RPN 模型添加输出（目标分类和边界框回归）。
抽象 FPN 的使用。

Created with Raphaël 2.2.0 add_generic_rpn_outputs model FPN_ON? add_fpn_rpn_outputs CollectAndDistributeFpnRpnProposals add_fpn_rpn_losses loss_gradients End add_single_scale_rpn_outputs add_single_scale_rpn_losses yes no

如果使用 FPN，委派给 FPN 模块。

    loss_gradients = None
    if cfg.FPN.FPN_ON:
        # Delegate to the FPN module
        FPN.add_fpn_rpn_outputs(model, blob_in, dim_in, spatial_scale_in)
        if cfg.MODEL.FASTER_RCNN:
            # CollectAndDistributeFpnRpnProposals also labels proposals when in
            # training mode
            model.CollectAndDistributeFpnRpnProposals()
        if model.train:
            loss_gradients = FPN.add_fpn_rpn_losses(model)

否则，添加单尺度输出。

    else:
        # Not using FPN, add RPN to a single scale
        add_single_scale_rpn_outputs(model, blob_in, dim_in, spatial_scale_in)
        if model.train:
            loss_gradients = add_single_scale_rpn_losses(model)
    return loss_gradients

add_single_scale_rpn_outputs

generate_anchors以(x1, y1, x2, y2)格式生成锚框矩阵。锚点以 stride/2为中心，具有指定大小的（近似）开方区域及给定的宽高比。

    anchors = generate_anchors(
        stride=1. / spatial_scale,
        sizes=cfg.RPN.SIZES,
        aspect_ratios=cfg.RPN.ASPECT_RATIOS
    )
    num_anchors = anchors.shape[0]
    dim_out = dim_in

添加一个 Conv 和 Relu。

    # RPN hidden representation
    model.Conv(
        blob_in,
        'conv_rpn',
        dim_in,
        dim_out,
        kernel=3,
        pad=1,
        stride=1,
        weight_init=gauss_fill(0.01),
        bias_init=const_fill(0.0)
    )
    model.Relu('conv_rpn', 'conv_rpn')

1X1卷积对建议框分类。

    # Proposal classification scores
    model.Conv(
        'conv_rpn',
        'rpn_cls_logits',
        dim_in,
        num_anchors,
        kernel=1,
        pad=0,
        stride=1,
        weight_init=gauss_fill(0.01),
        bias_init=const_fill(0.0)
    )

1X1卷积回归建议框坐标。

    # Proposal bbox regression deltas
    model.Conv(
        'conv_rpn',
        'rpn_bbox_pred',
        dim_in,
        4 * num_anchors,
        kernel=1,
        pad=0,
        stride=1,
        weight_init=gauss_fill(0.01),
        bias_init=const_fill(0.0)
    )

在 Faster R-CNN 模式或者RPN的推理阶段需要提案，而 RPN 训练不需要。
使用 Sigmoid 函数预测分数，生成提案。

    if not model.train or cfg.MODEL.FASTER_RCNN:
        # Proposals are needed during:
        #  1) inference (== not model.train) for RPN only and Faster R-CNN
        #  OR
        #  2) training for Faster R-CNN
        # Otherwise (== training for RPN only), proposals are not needed
        model.net.Sigmoid('rpn_cls_logits', 'rpn_cls_probs')
        model.GenerateProposals(
            ['rpn_cls_probs', 'rpn_bbox_pred', 'im_info'],
            ['rpn_rois', 'rpn_roi_probs'],
            anchors=anchors,
            spatial_scale=spatial_scale
        )

如果是 Faster R-CNN 模式，训练需要生成提案的label，推理则对 blob 重命名。

    if cfg.MODEL.FASTER_RCNN:
        if model.train:
            # Add op that generates training labels for in-network RPN proposals
            model.GenerateProposalLabels(['rpn_rois', 'roidb', 'im_info'])
        else:
            # Alias rois to rpn_rois for inference
            model.net.Alias('rpn_rois', 'rois')

add_single_scale_rpn_losses

在空间上缩小全尺寸 RPN 标签阵列以匹配特征图形状。_get_rpn_blobs会对rpn_labels_int32_wide进行赋值。

    # Spatially narrow the full-sized RPN label arrays to match the feature map
    # shape
    model.net.SpatialNarrowAs(
        ['rpn_labels_int32_wide', 'rpn_cls_logits'], 'rpn_labels_int32'
    )

得到的 rpn_bbox_targets, rpn_bbox_inside_weights, rpn_bbox_outside_weights 用于 SmoothL1Loss。

    for key in ('targets', 'inside_weights', 'outside_weights'):
        model.net.SpatialNarrowAs(
            ['rpn_bbox_' + key + '_wide', 'rpn_bbox_pred'], 'rpn_bbox_' + key
        )

    loss_rpn_cls = model.net.SigmoidCrossEntropyLoss(
        ['rpn_cls_logits', 'rpn_labels_int32'],
        'loss_rpn_cls',
        scale=model.GetLossScale()
    )

    loss_rpn_bbox = model.net.SmoothL1Loss(
        [
            'rpn_bbox_pred', 'rpn_bbox_targets', 'rpn_bbox_inside_weights',
            'rpn_bbox_outside_weights'
        ],
        'loss_rpn_bbox',
        beta=1. / 9.,
        scale=model.GetLossScale()
    )

get_loss_gradients 为loss_blobs中指定的每个损失生成1的梯度。
AddLosses 添加损失到列表。

    loss_gradients = blob_utils.get_loss_gradients(
        model, [loss_rpn_cls, loss_rpn_bbox]
    )
    model.AddLosses(['loss_rpn_cls', 'loss_rpn_bbox'])
    return loss_gradients

GenerateProposals

blobs_in：

rpn_cls_probs：4D 形状张量(N, A, H, W)，其中 N 是 minibatch 图像的数量，A 是每个位置的锚点数，(H, W)是预测格的空间大小。每个值代表[0,1]之间的“目标概率”估计。
rpn_bbox_pred：预测增量的4D 张量形状(N, 4 * A, H, W)，将锚框的转换为 RPN 提议。
im_info：2D 张量形状(N, 3)，其中三列编码输入图像的[高度，宽度，比例]。高度和宽度用于输入网络而不是原始图像；比例是用于将原始图像缩放到网络输入大小的比例因子。

blobs_out：

rpn_rois：2D 张量形状(R, 5)，对于 R 个 RPN 提议，其五列编码为[batch ind，x1，y1，x2，y2]。这些盒子参照网络输入，是原始图像的缩放版本；这些建议必须按1 / scale（scale 来自im_info，见上文）进行缩放，以将其转换回原始输入图像坐标系。
rpn_roi_probs：1D 目标概率分数的张量（从rpn_cls_probs中提取，见上文）。

net.Python是什么？

        name = 'GenerateProposalsOp:' + ','.join([str(b) for b in blobs_in])
        # spatial_scale passed to the Python op is only used in convert_pkl_to_pb
        self.net.Python(
            GenerateProposalsOp(anchors, spatial_scale, self.train).forward
        )(blobs_in, blobs_out, name=name, spatial_scale=spatial_scale)
        return blobs_out

GenerateProposalsOp

通过将估计的边界框变换到一组规则盒子（称为“锚点”）来输出目标检测提议。
train应该是布尔型。

    def __init__(self, anchors, spatial_scale, train):
        self._anchors = anchors
        self._num_anchors = self._anchors.shape[0]
        self._feat_stride = 1. / spatial_scale
        self._train = train

forward

对于(H, W)网格中的每个位置i：
* 生成以单元格 i 为中心的锚点框
* 将预测的 bbox 改变量应用于单元格 i 中的每个锚点
截取出预测框中的图像；
移除高度或宽度小于阈值的预测框；
按分数从高到低顺序排列所有（提案，得分）对；
在 NMS 之前取头部的pre_nms_topN提议；
对其余提议采用宽松阈值（0.7）的 NMS；
在 NMS 之后提取 after_nms_topN 提议；
返回头部提议。

第一个输入为预测分数，第二个输入为预测的锚点变换，第三个输入为图像。

        # predicted probability of fg object for each RPN anchor
        scores = inputs[0].data
        # predicted achors transformations
        bbox_deltas = inputs[1].data
        # input image (height, width, scale), in which scale is the scale factor
        # applied to the original dataset image to get the network input image
        im_info = inputs[2].data

构造出(H, W)网格上每个点在特征图上的偏移量。numpy.arange左闭右开。

        # 1. Generate proposals from bbox deltas and shifted anchors
        height, width = scores.shape[-2:]
        # Enumerate all shifted positions on the (H, W) grid
        shift_x = np.arange(0, width) * self._feat_stride
        shift_y = np.arange(0, height) * self._feat_stride

生成网格坐标，但是shift_x和shift_y的名字没变，因为copy=False的原因？
shifts构造出不同锚点的坐标偏移。

        shift_x, shift_y = np.meshgrid(shift_x, shift_y, copy=False)
        # Convert to (K, 4), K=H*W, where the columns are (dx, dy, dx, dy)
        # shift pointing to each grid location
        shifts = np.vstack((shift_x.ravel(), shift_y.ravel(),
                            shift_x.ravel(), shift_y.ravel())).transpose()

在shifts上广播锚点，获得所有位置上的所有锚点。
在(H, W)网格中：
- 将A个形状(1, A, 4)的锚点添加到形状(K, 1, 4)的K个位移中，以获得形状为(K, A, 4)的所有移位锚，并将其重塑为(K*A, 4)。
为什么是inputs[0] 而不是inputs[2]？

        # Broacast anchors over shifts to enumerate all anchors at all positions
        # in the (H, W) grid:
        #   - add A anchors of shape (1, A, 4) to
        #   - K shifts of shape (K, 1, 4) to get
        #   - all shifted anchors of shape (K, A, 4)
        #   - reshape to (K*A, 4) shifted anchors
        num_images = inputs[0].shape[0]
        A = self._num_anchors
        K = shifts.shape[0]
        all_anchors = self._anchors[np.newaxis, :, :] + shifts[:, np.newaxis, :]
        all_anchors = all_anchors.reshape((K * A, 4))

调用proposals_for_one_image计算一张图片上的边界框和预测。

        rois = np.empty((0, 5), dtype=np.float32)
        roi_probs = np.empty((0, 1), dtype=np.float32)
        for im_i in range(num_images):
            im_i_boxes, im_i_probs = self.proposals_for_one_image(
                im_info[im_i, :], all_anchors, bbox_deltas[im_i, :, :, :],
                scores[im_i, :, :, :]
            )

索引类型为什么是np.float32？
将结果追加到rois和roi_probs。

            batch_inds = im_i * np.ones(
                (im_i_boxes.shape[0], 1), dtype=np.float32
            )
            im_i_rois = np.hstack((batch_inds, im_i_boxes))
            rois = np.append(rois, im_i_rois, axis=0)
            roi_probs = np.append(roi_probs, im_i_probs, axis=0)

第一个输出为RoI，第二个输出为roi_probs。

        outputs[0].reshape(rois.shape)
        outputs[0].data[...] = rois
        if len(outputs) > 1:
            outputs[1].reshape(roi_probs.shape)
            outputs[1].data[...] = roi_probs

proposals_for_one_image

detectron/core/config.py文件指定了Detectron的默认配置选项。我们不应该更改此文件中的值而是写一个配置文件（在yaml中），并使用merge_cfg_from_file(yaml_file)加载它并覆盖默认选项。
tools目录中的大多数工具都使用--cfg选项来指定覆盖文件和覆盖键值对的可选列表：

在tools/{train,test}_net.py中查看使用merge_cfg_from_file的代码。
配置文件的示例参见configs//.yaml。
Detectron支持许多不同的模型类型，每种模型都有很多不同的选项。结果是大量的配置选项。

    def proposals_for_one_image(
        self, im_info, all_anchors, bbox_deltas, scores
    ):
        # Get mode-dependent configuration
        cfg_key = 'TRAIN' if self._train else 'TEST'
        pre_nms_topN = cfg[cfg_key].RPN_PRE_NMS_TOP_N
        post_nms_topN = cfg[cfg_key].RPN_POST_NMS_TOP_N
        nms_thresh = cfg[cfg_key].RPN_NMS_THRESH
        min_size = cfg[cfg_key].RPN_MIN_SIZE

转置并重塑预测的bbox变换，以使它们与锚点的顺序相同：

来自conv输出的边界框变化量是(4 * A, H, W)格式
转置为(H, W, 4 * A)
重塑为(H * W * A, 4)，其中行以(H, W, A)从最慢到最快的顺序排列，以匹配枚举的锚点

        # Transpose and reshape predicted bbox transformations to get them
        # into the same order as the anchors:
        #   - bbox deltas will be (4 * A, H, W) format from conv output
        #   - transpose to (H, W, 4 * A)
        #   - reshape to (H * W * A, 4) where rows are ordered by (H, W, A)
        #     in slowest to fastest order to match the enumerated anchors
        bbox_deltas = bbox_deltas.transpose((1, 2, 0)).reshape((-1, 4))

分数相同：

来自conv输出的分数是(A, H, W)格式
转置为(H, W, A)
重塑为(H * W * A, 1)，其中行由（H，W，A）排序以匹配锚点和bbox_deltas的顺序

        # Same story for the scores:
        #   - scores are (A, H, W) format from conv output
        #   - transpose to (H, W, A)
        #   - reshape to (H * W * A, 1) where rows are ordered by (H, W, A)
        #     to match the order of anchors and bbox_deltas
        scores = scores.transpose((1, 2, 0)).reshape((-1, 1))

numpy.squeeze从数组的形状中移除一维条目。
numpy.argsort返回数组排序后的索引。
numpy.argpartition使用kind关键字指定的算法沿给定轴执行间接分区。它以分区顺序返回与给定轴上的索引数据具有相同形状的索引数组。

如果参数pre_nms_topN无效，直接排序；否则，为避免大数组排序选取前pre_nms_topN高的分数再进行排序。根据得到的索引取出bbox_deltas、all_anchors和scores。

        # 4. sort all (proposal, score) pairs by score from highest to lowest
        # 5. take top pre_nms_topN (e.g. 6000)
        if pre_nms_topN <= 0 or pre_nms_topN >= len(scores):
            order = np.argsort(-scores.squeeze())
        else:
            # Avoid sorting possibly large arrays; First partition to get top K
            # unsorted and then sort just those (~20x faster for 200k scores)
            inds = np.argpartition(
                -scores.squeeze(), pre_nms_topN
            )[:pre_nms_topN]
            order = np.argsort(-scores[inds].squeeze())
            order = inds[order]
        bbox_deltas = bbox_deltas[order, :]
        all_anchors = all_anchors[order, :]
        scores = scores[order]

bbox_transform是使用边界框回归增量将提议框映射到预测框的正向变换。有关权值参数的说明，请参阅bbox_transform_inv。

        # Transform anchors into proposals via bbox transformations
        proposals = box_utils.bbox_transform(
            all_anchors, bbox_deltas, (1.0, 1.0, 1.0, 1.0))

2.修剪预测框到图像（可能会导致提议的区域为零，将在下一步中删除）。
clip_tiled_boxes修剪框到图像边界内。

        # 2. clip proposals to image (may result in proposals with zero area
        # that will be removed in the next step)
        proposals = box_utils.clip_tiled_boxes(proposals, im_info[:2])

3.移除高度或宽度小于min_size的预测框。

        # 3. remove predicted boxes with either height or width < min_size
        keep = _filter_boxes(proposals, min_size, im_info)
        proposals = proposals[keep, :]
        scores = scores[keep]

6.应用宽松的nms（例如阈值= 0.7）
7.取NMS后的前after_nms_topN个（例如300）
8.返回最高预测（-> RoI顶部）
最终调用的是utils.cython_nms.nms

        # 6. apply loose nms (e.g. threshold = 0.7)
        # 7. take after_nms_topN (e.g. 300)
        # 8. return the top proposals (-> RoIs top)
        if nms_thresh > 0:
            keep = box_utils.nms(np.hstack((proposals, scores)), nms_thresh)
            if post_nms_topN > 0:
                keep = keep[:post_nms_topN]
            proposals = proposals[keep, :]
            scores = scores[keep]
        return proposals, scores

_filter_boxes

numpy.where根据条件返回x或y中的元素；只有一个参数时，输出arry中‘真’值的坐标。
keep记录满足条件的boxes的索引（横坐标）。
im_info的格式为(width, height, scale)。

    # Scale min_size to match image scale
    min_size *= im_info[2]
    ws = boxes[:, 2] - boxes[:, 0] + 1
    hs = boxes[:, 3] - boxes[:, 1] + 1
    x_ctr = boxes[:, 0] + ws / 2.
    y_ctr = boxes[:, 1] + hs / 2.
    keep = np.where(
        (ws >= min_size) & (hs >= min_size) &
        (x_ctr < im_info[1]) & (y_ctr < im_info[0]))[0]
    return keep

GenerateProposalsOp

Caffe2GenerateProposalsOp的C++实现。为 Faster RCNN 生成候选边界框。根据图像得分score、边界框回归结果deltas和预定义的边界框形状anchors为图像列表生成提议。采用贪婪的非最大抑制生成最终的边界框。参考：detectron/lib/ops/generate_proposals.py

template <class Context>
class GenerateProposalsOp final : public Operator<Context> {
 public:
  USE_OPERATOR_CONTEXT_FUNCTIONS;
  GenerateProposalsOp(const OperatorDef& operator_def, Workspace* ws)
      : Operator<Context>(operator_def, ws),
        spatial_scale_(
            OperatorBase::GetSingleArgument<float>("spatial_scale", 1.0 / 16)),
        feat_stride_(1.0 / spatial_scale_),
        rpn_pre_nms_topN_(
            OperatorBase::GetSingleArgument<int>("pre_nms_topN", 6000)),
        rpn_post_nms_topN_(
            OperatorBase::GetSingleArgument<int>("post_nms_topN", 300)),
        rpn_nms_thresh_(
            OperatorBase::GetSingleArgument<float>("nms_thresh", 0.7f)),
        rpn_min_size_(OperatorBase::GetSingleArgument<float>("min_size", 16)),
        correct_transform_coords_(OperatorBase::GetSingleArgument<bool>(
            "correct_transform_coords",
            false)) {}

  ~GenerateProposalsOp() {}

  bool RunOnDevice() override;

  // Generate bounding box proposals for a given image
  // im_info: [height, width, im_scale]
  // all_anchors: (H * W * A, 4)
  // bbox_deltas_tensor: (4 * A, H, W)
  // scores_tensor: (A, H, W)
  // out_boxes: (n, 5)
  // out_probs: n
  void ProposalsForOneImage(
      const Eigen::Array3f& im_info,
      const Eigen::Map<const ERMatXf>& all_anchors,
      const utils::ConstTensorView<float>& bbox_deltas_tensor,
      const utils::ConstTensorView<float>& scores_tensor,
      ERArrXXf* out_boxes,
      EArrXf* out_probs) const;

 protected:
  // spatial_scale_ must be declared before feat_stride_
  float spatial_scale_{1.0};
  float feat_stride_{1.0};

  // RPN_PRE_NMS_TOP_N
  int rpn_pre_nms_topN_{6000};
  // RPN_POST_NMS_TOP_N
  int rpn_post_nms_topN_{300};
  // RPN_NMS_THRESH
  float rpn_nms_thresh_{0.7};
  // RPN_MIN_SIZE
  float rpn_min_size_{16};
  // Correct bounding box transform coordates, see bbox_transform() in boxes.py
  // Set to true to match the detectron code, set to false for backward
  // compatibility
  bool correct_transform_coords_{false};
};

GenerateProposalsOp::RunOnDevice()

Created with Raphaël 2.2.0 GenerateProposalsOp scores, bbox_deltas, im_info ComputeAllAnchors Get cur_bbox_deltas and cur_scores ProposalsForOneImage write rois and rois_probs rois, rois_probs End

4个输入分别为分数、边框增量、图像信息和锚点。
输出分别为RoI及相应概率。

  const auto& scores = Input(0);
  const auto& bbox_deltas = Input(1);
  const auto& im_info_tensor = Input(2);
  const auto& anchors = Input(3);
  auto* out_rois = Output(0);
  auto* out_rois_probs = Output(1);

检查scores并获得其维度信息。

  CAFFE_ENFORCE_EQ(scores.ndim(), 4, scores.ndim());
  CAFFE_ENFORCE(scores.template IsType<float>(), scores.meta().name());
  const auto num_images = scores.dim(0);
  const auto A = scores.dim(1);
  const auto height = scores.dim(2);
  const auto width = scores.dim(3);
  const auto K = height * width;

bbox_deltas维度为(num_images, A * 4, H, W)

  // bbox_deltas: (num_images, A * 4, H, W)
  CAFFE_ENFORCE_EQ(
      bbox_deltas.dims(), (vector<TIndex>{num_images, 4 * A, height, width}));

anchors维度为(A, 4)

  // anchors: (A, 4)
  CAFFE_ENFORCE_EQ(anchors.dims(), (vector<TIndex>{A, 4}));
  CAFFE_ENFORCE(anchors.template IsType<float>(), anchors.meta().name());

将anchors广播到每个点。

  // Broadcast the anchors to all pixels
  auto all_anchors_vec =
      utils::ComputeAllAnchors(anchors, height, width, feat_stride_);
  Eigen::Map<const ERMatXf> all_anchors(all_anchors_vec.data(), K * A, 4);

Eigen::Map 是映射现有数据数组的矩阵或向量表达式。

  Eigen::Map<const ERArrXXf> im_info(
      im_info_tensor.data<float>(),
      im_info_tensor.dim(0),
      im_info_tensor.dim(1));

设置输出的形状。

  const int roi_col_count = 5;
  out_rois->Resize(0, roi_col_count);
  out_rois_probs->Resize(0);

Array 类提供通用数组，而 Matrix 类则用于线性代数。此外，Array 类提供了一种简单的方法来执行系数运算，这可能没有线性代数意义，例如为数组中的每个系数添加一个常数或者两个系数数组的乘法。
对于每一张图片，取出相应的图像信息、边界框变化量和分数

  std::vector<ERArrXXf> im_boxes(num_images);
  std::vector<EArrXf> im_probs(num_images);
  for (int i = 0; i < num_images; i++) {
    auto cur_im_info = im_info.row(i);
    auto cur_bbox_deltas = GetSubTensorView<float>(bbox_deltas, i);
    auto cur_scores = GetSubTensorView<float>(scores, i);

调用ProposalsForOneImage 获得预测框和概率。

    ERArrXXf& im_i_boxes = im_boxes[i];
    EArrXf& im_i_probs = im_probs[i];
    ProposalsForOneImage(
        cur_im_info,
        all_anchors,
        cur_bbox_deltas,
        cur_scores,
        &im_i_boxes,
        &im_i_probs);
  }

计算 RoI 的总数。
为什么使用 Extend？

  int roi_counts = 0;
  for (int i = 0; i < num_images; i++) {
    roi_counts += im_boxes[i].rows();
  }
  out_rois->Extend(roi_counts, 50, &context_);
  out_rois_probs->Extend(roi_counts, 50, &context_);
  float* out_rois_ptr = out_rois->mutable_data<float>();
  float* out_rois_probs_ptr = out_rois_probs->mutable_data<float>();
  for (int i = 0; i < num_images; i++) {
    const ERArrXXf& im_i_boxes = im_boxes[i];
    const EArrXf& im_i_probs = im_probs[i];
    int csz = im_i_boxes.rows();

out_rois的内存映射到cur_rois。设置对应图像索引，保存预测框坐标。

    // write rois
    Eigen::Map<ERArrXXf> cur_rois(out_rois_ptr, csz, 5);
    cur_rois.col(0).setConstant(i);
    cur_rois.block(0, 1, csz, 4) = im_i_boxes;

保存预测值。

    // write rois_probs
    Eigen::Map<EArrXf>(out_rois_probs_ptr, csz) = im_i_probs;

    out_rois_ptr += csz * roi_col_count;
    out_rois_probs_ptr += csz;
  }

GetSubTensorView

使用tensor中的数据指针从tensor获取子张量视图。

  DCHECK_EQ(tensor.meta().itemsize(), sizeof(T));

  if (tensor.size() == 0) {
    return utils::ConstTensorView<T>(nullptr, {});
  }

  std::vector<int> start_dims(tensor.ndim(), 0);
  start_dims.at(0) = dim0_start_index;
  auto st_idx = ComputeStartIndex(tensor, start_dims);
  auto ptr = tensor.data<T>() + st_idx;

  auto& input_dims = tensor.dims();
  std::vector<int> ret_dims(input_dims.begin() + 1, input_dims.end());

  utils::ConstTensorView<T> ret(ptr, ret_dims);
  return ret;

GenerateProposalsOp::ProposalsForOneImage

Created with Raphaël 2.2.0 ProposalsForOneImage scores, bbox_deltas,all_anchors, im_info transposeAndReshape sortProposalScorePairsByScore take top pre_nms_topN transform anchors into proposals clip_boxes filter_boxes nms_cpu get out_boxes get out_probs out_boxes, out_probs End

转置并重塑预测的 bbox 变换，以使它们与锚点的顺序相同：

来自 conv 输出的边界框变化量是(4 * A, H, W)格式
转置为(H, W, 4 * A)
重塑为(H * W * A, 4)，其中行以(H, W, A)从最慢到最快的顺序排列，以匹配枚举的锚点

  // Transpose and reshape predicted bbox transformations to get them
  // into the same order as the anchors:
  //   - bbox deltas will be (4 * A, H, W) format from conv output
  //   - transpose to (H, W, 4 * A)
  //   - reshape to (H * W * A, 4) where rows are ordered by (H, W, A)
  //     in slowest to fastest order to match the enumerated anchors
  CAFFE_ENFORCE_EQ(bbox_deltas_tensor.ndim(), 3);
  CAFFE_ENFORCE_EQ(bbox_deltas_tensor.dim(0) % 4, 0);
  auto A = bbox_deltas_tensor.dim(0) / 4;
  auto H = bbox_deltas_tensor.dim(1);
  auto W = bbox_deltas_tensor.dim(2);

将bbox_deltas中的数据映射到 Eigen::Map，调用 Eigen::Transpose 转置得到bbox_deltas。

  // equivalent to python code
  //  bbox_deltas = bbox_deltas.transpose((1, 2, 0)).reshape((-1, 4))
  ERArrXXf bbox_deltas(H * W * A, 4);
  Eigen::Map<ERMatXf>(bbox_deltas.data(), H * W, 4 * A) =
      Eigen::Map<const ERMatXf>(bbox_deltas_tensor.data(), A * 4, H * W)
          .transpose();
  CAFFE_ENFORCE_EQ(bbox_deltas.rows(), all_anchors.rows());

scores的处理与之类似。

  // - scores are (A, H, W) format from conv output
  // - transpose to (H, W, A)
  // - reshape to (H * W * A, 1) where rows are ordered by (H, W, A)
  //   to match the order of anchors and bbox_deltas
  CAFFE_ENFORCE_EQ(scores_tensor.ndim(), 3);
  CAFFE_ENFORCE_EQ(scores_tensor.dims(), (vector<int>{A, H, W}));
  // equivalent to python code
  // scores = scores.transpose((1, 2, 0)).reshape((-1, 1))
  EArrXf scores(scores_tensor.size());
  Eigen::Map<ERMatXf>(scores.data(), H * W, A) =
      Eigen::Map<const ERMatXf>(scores_tensor.data(), A, H * W).transpose();

std::iota 构造scores的索引，然后根据scores从大到小排序。std::partial_sort对部分元素进行排序，但是起于C++17。

  std::vector<int> order(scores.size());
  std::iota(order.begin(), order.end(), 0);
  if (rpn_pre_nms_topN_ <= 0 || rpn_pre_nms_topN_ >= scores.size()) {
    // 4. sort all (proposal, score) pairs by score from highest to lowest
    // 5. take top pre_nms_topN (e.g. 6000)
    std::sort(order.begin(), order.end(), [&scores](int lhs, int rhs) {
      return scores[lhs] > scores[rhs];
    });
  } else {
    // Avoid sorting possibly large arrays; First partition to get top K
    // unsorted and then sort just those (~20x faster for 200k scores)
    std::partial_sort(
        order.begin(),
        order.begin() + rpn_pre_nms_topN_,
        order.end(),
        [&scores](int lhs, int rhs) { return scores[lhs] > scores[rhs]; });
    order.resize(rpn_pre_nms_topN_);
  }

GetSubArray 根据排序后的索引得到排序后的结果。

  ERArrXXf bbox_deltas_sorted;
  ERArrXXf all_anchors_sorted;
  EArrXf scores_sorted;
  utils::GetSubArrayRows(
      bbox_deltas, utils::AsEArrXt(order), &bbox_deltas_sorted);
  utils::GetSubArrayRows(
      all_anchors.array(), utils::AsEArrXt(order), &all_anchors_sorted);
  utils::GetSubArray(scores, utils::AsEArrXt(order), &scores_sorted);

bbox_transform 通过边界框变换将锚点转为提议。

  // Transform anchors into proposals via bbox transformations
  static const std::vector<float> bbox_weights{1.0, 1.0, 1.0, 1.0};
  auto proposals = utils::bbox_transform(
      all_anchors_sorted,
      bbox_deltas_sorted,
      bbox_weights,
      utils::BBOX_XFORM_CLIP_DEFAULT,
      correct_transform_coords_);

2.修剪提案到图像内（可能会导致提议的区域为零，将在下一步中删除）

  // 2. clip proposals to image (may result in proposals with zero area
  // that will be removed in the next step)
  proposals = utils::clip_boxes(proposals, im_info[0], im_info[1]);

3.移除高度或宽度< min_size的预测框

  // 3. remove predicted boxes with either height or width < min_size
  auto keep = utils::filter_boxes(proposals, min_size, im_info);
  DCHECK_LE(keep.size(), scores_sorted.size());

6.应用宽松的nms（例如阈值= 0.7）
7.take after_ms_topN（例如300）
8.返回最高建议（-> RoI顶部）

  // 6. apply loose nms (e.g. threshold = 0.7)
  // 7. take after_nms_topN (e.g. 300)
  // 8. return the top proposals (-> RoIs top)
  if (post_nms_topN > 0 && post_nms_topN < keep.size()) {
    keep = utils::nms_cpu(
        proposals, scores_sorted, keep, nms_thresh, post_nms_topN);
  } else {
    keep = utils::nms_cpu(proposals, scores_sorted, keep, nms_thresh);
  }

生成输出

  // Generate outputs
  utils::GetSubArrayRows(proposals, utils::AsEArrXt(keep), out_boxes);
  utils::GetSubArray(scores_sorted, utils::AsEArrXt(keep), out_probs);

bbox_transform

BBoxTransform 使用边界框将提议边界框转换为目标边界框，bbox_transform 的cpp实现。

使用边界框回归增量将提议框映射到真实框的正向变换。
box：边界框像素坐标，形状为（M，4），格式为[x1; y1; x2; y2]，其中x2> = x1，y2> = y1
deltas：边界框平移和尺度，形状为（M，4），格式为[dx; dy; dw; dh]
dx，dy：边界框中心的尺度不变的平移
dw，dh：对数空间的边界框宽度和高度
weights：deltas的权重[wx，wy，ww，wh]
bbox_xform_clip：变换后对数空间中的最小边界框宽度和高度
correct_transform_coords：正确的边界框变换坐标。设置为true以匹配检测器代码，设置为false以实现后向兼容性
返回值：边界框的像素坐标，形状为（M，4），格式[x1; y1; x2; y2]有关更多详细信息，请参阅“Rich feature hierarchies for accurate object detection and semantic segmentation”附录C.
参考：detectron/lib/utils/boxes.py bbox_transform()

如果boxes 为空，则返回一个空矩阵。

  using T = typename Derived1::Scalar;
  using EArrXX = EArrXXt<T>;
  using EArrX = EArrXt<T>;

  if (boxes.rows() == 0) {
    return EArrXX::Zero(T(0), deltas.cols());
  }

检查boxes和deltas的维度。

  CAFFE_ENFORCE_EQ(boxes.rows(), deltas.rows());
  CAFFE_ENFORCE_EQ(boxes.cols(), 4);
  CAFFE_ENFORCE_EQ(deltas.cols(), 4);

获取boxes的长宽及中心坐标。

  EArrX widths = boxes.col(2) - boxes.col(0) + T(1.0);
  EArrX heights = boxes.col(3) - boxes.col(1) + T(1.0);
  auto ctr_x = boxes.col(0) + T(0.5) * widths;
  auto ctr_y = boxes.col(1) + T(0.5) * heights;

cwiseMin求两组数据的元素间的最小值。

  auto dx = deltas.col(0).template cast<T>() / weights[0];
  auto dy = deltas.col(1).template cast<T>() / weights[1];
  auto dw =
      (deltas.col(2).template cast<T>() / weights[2]).cwiseMin(bbox_xform_clip);
  auto dh =
      (deltas.col(3).template cast<T>() / weights[3]).cwiseMin(bbox_xform_clip);

计算预测框的中心坐标和长宽。

  EArrX pred_ctr_x = dx * widths + ctr_x;
  EArrX pred_ctr_y = dy * heights + ctr_y;
  EArrX pred_w = dw.exp() * widths;
  EArrX pred_h = dh.exp() * heights;

再次切换坐标表示方法。

  T offset(correct_transform_coords ? 1.0 : 0.0);

  EArrXX pred_boxes = EArrXX::Zero(deltas.rows(), deltas.cols());
  // x1
  pred_boxes.col(0) = pred_ctr_x - T(0.5) * pred_w;
  // y1
  pred_boxes.col(1) = pred_ctr_y - T(0.5) * pred_h;
  // x2
  pred_boxes.col(2) = pred_ctr_x + T(0.5) * pred_w - offset;
  // y2
  pred_boxes.col(3) = pred_ctr_y + T(0.5) * pred_h - offset;

  return pred_boxes;

clip_boxes

  CAFFE_ENFORCE_EQ(boxes.cols(), 4);

  EArrXXt<typename Derived::Scalar> ret(boxes.rows(), boxes.cols());

  // x1 >= 0 && x1 < width
  ret.col(0) = boxes.col(0).cwiseMin(width - 1).cwiseMax(0);
  // y1 >= 0 && y1 < height
  ret.col(1) = boxes.col(1).cwiseMin(height - 1).cwiseMax(0);
  // x2 >= 0 && x2 < width
  ret.col(2) = boxes.col(2).cwiseMin(width - 1).cwiseMax(0);
  // y2 >= 0 && y2 < height
  ret.col(3) = boxes.col(3).cwiseMin(height - 1).cwiseMax(0);

  return ret;

filter_boxes

  CAFFE_ENFORCE_EQ(boxes.cols(), 4);

  // Scale min_size to match image scale
  min_size *= im_info[2];

  using T = typename Derived::Scalar;
  using EArrX = EArrXt<T>;

  EArrX ws = boxes.col(2) - boxes.col(0) + T(1);
  EArrX hs = boxes.col(3) - boxes.col(1) + T(1);
  EArrX x_ctr = boxes.col(0) + ws / T(2);
  EArrX y_ctr = boxes.col(1) + hs / T(2);

  EArrXb keep = (ws >= min_size) && (hs >= min_size) &&
      (x_ctr < T(im_info[1])) && (y_ctr < T(im_info[0]));

  return GetArrayIndices(keep);

nms_cpu

对候选框进行贪婪非极大值抑制。若边界框间的交并比（IoU）大于阈值，则选定较高得分的边界框而丢弃其他的。
参考：Detectron/detectron/utils/cython_nms.pyx
proposals：建议框的像素坐标，形状为（M，4），格式：[x1;Y1;X2;Y2]
scores：每个边界框的得分，形状为（M，1）
sorted_indices：将分数从高到低排序的索引
return：所选提案的行索引

检查输入的形状。

  CAFFE_ENFORCE_EQ(proposals.rows(), scores.rows());
  CAFFE_ENFORCE_EQ(proposals.cols(), 4);
  CAFFE_ENFORCE_EQ(scores.cols(), 1);
  CAFFE_ENFORCE_LE(sorted_indices.size(), proposals.rows());

取出proposals每一列的数据，计算建议框的面积。

  using EArrX = EArrXt<typename Derived1::Scalar>;

  auto x1 = proposals.col(0);
  auto y1 = proposals.col(1);
  auto x2 = proposals.col(2);
  auto y2 = proposals.col(3);

  EArrX areas = (x2 - x1 + 1.0) * (y2 - y1 + 1.0);

AsEArrXt借助Eigen::Map将vector中的数据映射到ERMatXt。

  EArrXi order = AsEArrXt(sorted_indices);

似乎没有必要每次都检查topN >= 0。默认值改成std::numeric_limits::max()？

  std::vector<int> keep;
  int ci = 0;
  while (order.size() > 0) {
    // exit if already enough proposals
    if (topN >= 0 && keep.size() >= topN) {
      break;
    }

ConstEigenVectorArrayMap是一维常量数组。
取出第一个索引保存到keep。
xx1、yy1、xx2、yy2为其余框与得分最高框重叠矩形的坐标。

    int i = order[0];
    keep.push_back(i);
    ConstEigenVectorArrayMap<int> rest_indices(
        order.data() + 1, order.size() - 1);
    EArrX xx1 = GetSubArray(x1, rest_indices).cwiseMax(x1[i]);
    EArrX yy1 = GetSubArray(y1, rest_indices).cwiseMax(y1[i]);
    EArrX xx2 = GetSubArray(x2, rest_indices).cwiseMin(x2[i]);
    EArrX yy2 = GetSubArray(y2, rest_indices).cwiseMin(y2[i]);

    EArrX w = (xx2 - xx1 + 1.0).cwiseMax(0.0);
    EArrX h = (yy2 - yy1 + 1.0).cwiseMax(0.0);
    EArrX inter = w * h;
    EArrX ovr = inter / (areas[i] + GetSubArray(areas, rest_indices) - inter);

GetArrayIndices为评估为true的元素返回1d数组的索引。
inds中的索引+1才能对应到order。将过滤后的索引赋值给order，开启下一轮筛选。

    // indices for sub array order[1:n]
    auto inds = GetArrayIndices(ovr <= thresh);
    order = GetSubArray(order, AsEArrXt(inds) + 1);
  }

  return keep;

参考资料：

faster rcnn源码解析(持续更新中)
Faster R-CNN论文及源码解读
【目标检测】Faster RCNN算法详解
faster rcnn中rpn的anchor，sliding windows，proposals？
Faster-Rcnn中RPN（Region Proposal Network）的理解
How does the region proposal network (RPN) in Faster R-CNN work?
目标检测方法简介:RPN(Region Proposal Network) and SSD(Single Shot MultiBox Detector)
RCNN,Fast RCNN,Faster RCNN 总结
Faster RCNN原理分析：Region Proposal Networks详解
Detection: Faster R-CNN
faster rcnn学习之rpn、fast rcnn数据准备说明
makefile/frcnn
unsky/FPN
请问faster rcnn和ssd 中为什么用smooth l1 loss，和l2有什么区别？
Faster R-CNN: Down the rabbit hole of modern object detection
keras版faster-rcnn算法详解（1.RPN计算）
Faster R-CNN: Down the rabbit hole of modern object detection
Faster R-CNN理解
一文读懂Faster RCNN
目标检测–Faster RCNN1
Faster-rcnn详解
Faster R-CNN论文及源码解读
Training R-CNNs of Various Velocities: Slow, Fast, and Faster

为简单起见我们将 cls 层实现为二分类 softmax 层。或者，可以使用逻辑回归来产生 $k$ 个分数。 ↩︎

你可能感兴趣的:(Caffe2,DeepLearning,ObjectDetection)

深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
提升自动驾驶导航能力：基于深度学习的场景理解技术星辰和大海都需要门票路径规划算法自动驾驶深度学习人工智能
EnhancingAutonomousVehicleNavigationUsingDeepLearning-BasedSceneUnderstanding提升自动驾驶导航能力：基于深度学习的场景理解技术摘要-为应对复杂环境下的自动驾驶导航，系统高度依赖场景理解的准确性。本研究提出一种基于深度学习的新方法，将目标识别、场景分割、运动预测与强化学习相结合以提升导航性能。该方法首先采用U-Net架构分解
python图像识别哪些库_利用ImageAI库只需几行python代码实现目标检测 weixin_39667398 python图像识别哪些库
什么是目标检测目标检测关注图像中特定的物体目标，需要同时解决解决定位(localization)+识别(Recognition)。相比分类，检测给出的是对图片前景和背景的理解，我们需要从背景中分离出感兴趣的目标，并确定这一目标的描述(类别和位置)，因此检测模型的输出是一个列表，列表的每一项使用一个数组给出检出目标的类别和位置(常用矩形检测框的坐标表示)。通俗的说，ObjectDetection的目
AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
基于级联深度学习算法在双参数MRI中检测前列腺病变的评估| 文献速递-AI辅助的放射影像疾病诊断有Li 人工智能深度学习算法
Title题目EvaluationofaCascadedDeepLearning–basedAlgorithmforProstateLesionDetectionatBiparametricMRI基于级联深度学习算法在双参数MRI中检测前列腺病变的评估Background背景MultiparametricMRI(mpMRI)improvesprostatecancer(PCa)detectionc
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
深度学习学习指南努力的Lorre 深度学习人工智能
本帖子将以本书的逻辑和顺序做一个梳理：CS基础->AI算法->模型压缩->异构计算->AI框架->AI编译器《DeepLearningSystems》(https://deeplearningsystems.ai/)CS基础推荐书单所需的编程语言(C/C++、Python)就不多讲了，数据结构算法也是大学基础课程，不多赘述。对于操作系统需要多了解，推荐多看一看《深入理解计算机系统》(传说中的面试圣
Java全栈AI平台实战：从模型训练到部署的革命性突破——Spring AI+Deeplearning4j+TensorFlow Java API深度解析墨夶 Java学习资料3 java 人工智能 spring
一、背景与需求：为什么需要Java驱动的AI平台？某医疗影像公司面临以下挑战：多语言开发混乱：Python训练模型，C++部署推理，Java调用服务，导致维护成本高昂部署效率低下：PyTorch模型需手动转换ONNX格式，TensorRT优化耗时2小时/模型实时性不足：视频流分析延迟达3秒，无法满足急诊场景需求通过Java全栈AI平台，我们实现了：端到端开发：Java调用PyTorch训练模型，直
大规模胰腺癌检测通过非对比增强CT和深度学习| 文献速递-视觉通用模型与疾病诊断有Li 深度学习人工智能
Title题目Large-scalepancreaticcancerdetectionvianon-contrastCTanddeeplearning大规模胰腺癌检测通过非对比增强CT和深度学习01文献速递介绍胰腺导管腺癌（PDAC）是最致命的实体恶性肿瘤，通常在晚期和不可手术的阶段被检测到。早期或偶然发现与延长生存期相关，但使用单一测试筛查无症状个体的PDAC仍然不可行，因为假阳性的潜在危害和低
文献速递：深度学习乳腺癌诊断---使用深度学习改善乳腺癌诊断的MRI技术有Li 深度学习人工智能
Title题目ImprovingbreastcancerdiagnosticswithdeeplearningforMRI使用深度学习改善乳腺癌诊断的MRI技术01文献速递介绍乳腺磁共振成像（MRI）是一种高度敏感的检测乳腺癌的方式，报道的敏感性超过80%。传统上，其在筛查中的使用被限制在高风险患者身上。新的证据支持在中等风险和普通风险女性中进行筛查MRI的作用4）。诊断MRI对于额外的指示也很有
《基于超声的深度学习模型用于降低BI-RADS 4A乳腺病变的恶性率》论文笔记 MobileNet 往事随风、、论文笔记机器学习深度学习论文阅读人工智能机器学习健康医疗
《APPLICATIONOFDEEPLEARNINGTOREDUCETHERATEOFMALIGNANCYAMONGBI-RADS4ABREASTLESIONSBASEDONULTRASONOGRAPHY》《基于超声的深度学习模型用于降低BI-RADS4A乳腺病变的恶性率》原文地址：链接文章目录摘要简介方法患者图像获取与处理深度学习模型统计分析结果讨论结论摘要本研究旨在开发一个基于超声（US）图像
SAE层、BPNN层结合的深度学习模型 sbc-study 深度学习人工智能机器学习
EarlyFaultDetectionofMachineToolsBasedonDeepLearningandDynamicIdentificationBoLuo,HaotingWang,HongqiLiu,BinLi,andFangyuPengIEEETRANSACTIONSONINDUSTRIALELECTRONICS,VOL.66,NO.1,JANUARY2019一SAE层(栈式自编码器层-
多标签分类的激活函数和损失函数通过幸福的路唯有奋斗深度学习
刚入门DeepLearning不久，前一段时间一直在学习cifar10的分类，突然最近要做一个多标签的任务，突然有点不知所措，不知从何下手了。于是查阅了一些资料，了解一下多分类任务与多标签分类任务的异同。-多分类任务：只有一个标签，但是标签有多种类别。-多标签分类任务：一条数据可能有一个或者多个标签，比如一个病人的眼底检测报告，它可能被标记患有糖尿病、高血压多个标签。多标签分类任务的特点：1.类别
Deep Lake 简介
DeepLake简介DeepLake是由Activeloop开发的一款开源深度学习数据湖（DeepLearningDataLake），专为人工智能时代设计，旨在解决深度学习项目中数据管理的复杂性与低效问题。核心特点特性说明多模态数据支持支持图像、视频、音频、文本、点云等多种数据类型，适用于各类AI场景。张量存储数据以张量格式存储，兼容主流深度学习框架（如PyTorch、TensorFlow）。数据
【深度学习】自编码器：数据压缩与特征学习的神经网络引擎瑶光守护者深度学习学习神经网络人工智能机器学习强化学习
作者选择了由IanGoodfellow、YoshuaBengio和AaronCourville三位大佬撰写的《DeepLearning》(人工智能领域的经典教程，深度学习领域研究生必读教材),开始深度学习领域学习，深入全面的理解深度学习的理论知识。之前的文章参考下面的链接：【深度学习】线性因子模型：数据降维与结构解析的数学透镜【学习笔记】强化学习：实用方法论【学习笔记】序列建模：递归神经网络（RN
Python----目标检测（YOLO简介）蹦蹦跳跳真可爱589 目标检测 Python 目标检测 YOLO 目标跟踪人工智能计算机视觉 python
一、YOLO简介[YOLO](YouOnlyLookOnce）是一种流行的物体检测和图像分割模型，由华盛顿大学的约瑟夫-雷德蒙（JosephRedmon）和阿里-法哈迪（AliFarhadi）开发，YOLO于2015年推出，因其高速度和高精确度而迅速受到欢迎。在计算机视觉（ComputerVision）领域，目标检测（ObjectDetection）一直是最为基础且至关重要的研究方向之一。随着深度
aws flask_如何将屏幕日志记录添加到Flask应用程序并将其部署在AWS Elastic Beanstalk上... weixin_26742939 java python linux mysql leetcode
awsflaskAttheendof2019Deeplearning.aireportedthatonly22%ofcompaniesthatusemachinelearningactuallydeployedamodel.Mostcompaniesdonotgetbeyondaproofofconcept,oftenbymeansofamodelinaJupyterNotebooks.Asare
GeoTorchAI 项目使用与配置指南尤贝升Sherman
GeoTorchAI项目使用与配置指南GeoTorchAIGeoTorchAI:AFrameworkforTrainingandUsingSpatiotemporalDeepLearningModelsatScale项目地址:https://gitcode.com/gh_mirrors/ge/GeoTorchAI1.项目目录结构及介绍GeoTorchAI的目录结构如下：GeoTorchAI/├──
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进陆或愉
Dive-into-DL-PyTorch项目解析：目标检测中的R-CNN系列算法演进Dive-into-DL-PyTorch本项目将《动手学深度学习》(DiveintoDeepLearning)原书中的MXNet实现改为PyTorch实现。项目地址:https://gitcode.com/gh_mirrors/di/Dive-into-DL-PyTorch引言目标检测是计算机视觉领域的核心任务之一
Java 人工智能应用：使用 DL4J 实现深度学习算法向哆哆 Java入门到精通人工智能 java 深度学习
Java人工智能应用：使用DL4J实现深度学习算法在当今数字化时代，人工智能技术正以前所未有的速度改变着各个行业的发展格局。而Java作为一种广泛应用于企业级开发的编程语言，在人工智能领域也发挥着越来越重要的作用。其中，深度学习作为人工智能的核心技术之一，为解决复杂问题提供了强大的能力。本篇文章将深入探讨如何使用Java深度学习库DL4J（Deeplearning4j）实现深度学习算法，助力开发者
学习笔记--Structural-RNN: Deep Learning on Spatio-Temporal Graphs Giving_Kore CV论文笔记 Structural RNN RNN CV spatiotemporal
论文链接：https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Jain_Structural-RNN_Deep_Learning_CVPR_2016_paper.pdf此为原创笔记，如需转载请注明Structural-RNN:DeepLearningonSpatio-TemporalGraphs [–AsheshJai
《Transformer如何进行图像分类：从新手到入门》机器学习司猫白深度学习 transformer 分类深度学习图像分类
引言如果你对人工智能（AI）或深度学习（DeepLearning）感兴趣，可能听说过“Transformer”这个词。它最初在自然语言处理（NLP）领域大放异彩，比如在翻译、聊天机器人和文本生成中表现出色。但你知道吗？Transformer不仅能处理文字，还能用来分类图像！这听起来是不是有点神奇？别担心，这篇博客将带你从零开始，了解Transformer的基本概念、它如何被应用到图像分类，以及通过
yolov12毕设前置知识准备 1 豌豆射手^ YOLO 课程设计目标跟踪
1什么是目标检测呢？目标检测（ObjectDetection）主要用于识别图像或视频中特定类型物体的位置，并标注其类别。简单来说，就是让计算机像人类一样“看懂”图像内容，不仅能识别出物体（如人、车、猫等），还能确定物体在画面中的具体位置（通常用矩形框或其他形状表示）。目标检测的核心任务：1物体分类（Classification）2确定图像中物体的类别（如“这是一辆汽车”）。3定位（Localiza
深度学习入门:如何从零开始搭建自己的深度学习模型? AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介深度学习（DeepLearning）近几年已经成为人们关注的热点话题。从2012年的ImageNet竞赛开始，激起了众多研究者的兴趣，也带来了越来越多的应用场景。随着技术的飞速发展，深度学习已经成为了各个领域最具潜力的技术。作为一名AI科研工作者，了解、掌握深度学习相关知识可以帮助你更好地理解并解决实际问题。本文将全面介绍深度学习的基础知识、技术要点及其应用。文
1、初识YOLO：目标检测的闪电战进取星辰 YOLO 目标检测人工智能
前言：当计算机学会了"找东西"你有没有遇到过这种情况？在停车场转了半天，死活找不到自己的车翻遍相册想找一张带狗的照片，结果只能手动一张张看超市排队时，总希望有个自动收银台能快速识别商品这些问题，目标检测（ObjectDetection）技术都能解决！而今天我们要聊的YOLO（YouOnlyLookOnce），就是目标检测领域的"闪电侠"——快、准、狠！在这篇文章中，我会带你：✅用5行代码实现第一个
神经网络入门书籍推荐,神经网络的书籍推荐阳阳2013哈哈物联网神经网络深度学习机器学习
有什么适合深度学习的书单吗？。12本最好的深度学习书籍：1.用Scikit-Learn和TensorFlow进行机器学习2.深度学习（DeepLearning）3.DeepLearningfortheLayman(为外行准备的深度学习)4.建立你自己的神经网络（MakeYourOwnNeuralNetwork）5.深度学习初学者（DeepLearningforBeginners）6.神经网络和深度
探秘 Alfred：一款强大的 macOS 生产力工具宋韵庚
探秘Alfred：一款强大的macOS生产力工具alfredalfred-py:Adeeplearningutilitylibraryfor**human**,moredetailabouttheusageoflibto:https://zhuanlan.zhihu.com/p/341446046项目地址:https://gitcode.com/gh_mirrors/al/alfred在程序员和效
2025转行指南：Java开发工程师转AI工程师，附全网最详细的大模型学习路线 AI小白熊 java 人工智能学习大模型程序员 ai 开发语言
关键要点研究表明，Java开发工程师转AI工程师需要学习数学、Python编程、机器学习和深度学习等技能。证据显示，掌握TensorFlow、PyTorch等框架和云部署技术（如Aliyun、AWS）也很重要。学习资源包括Coursera的免费课程、DiveintoDeepLearning书和国内平台如PaddlePaddle。技能和学习资料概述所需技能要从Java开发工程师成功转型为AI工程师，
SuperVINS：实时视觉-惯性SLAM框架，应对挑战性成像条件秋泉律Samson
SuperVINS：实时视觉-惯性SLAM框架，应对挑战性成像条件SuperVINSAreal-timevisual-inertialSLAMframeworkforchallengingimagingconditions(integrateddeeplearningfeatures)项目地址:https://gitcode.com/gh_mirrors/su/SuperVINS项目介绍Super
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多