Courage2022

Mask RCNN网络源码解读（Ⅶ） --- Mask分支解析以及将其映射回原尺度----完结撒花

0.先决知识

1.简介

2.mask_rcnn.py解析

2.1 初始化函数

2.2 MaskRCNNHeads类

2.3 MaskRCNNPredictor类

3.RoIHeads类解析

3.1 正向传播过程

3.2 mask部分损失

3.3 maskrcnn_inference

4.将预测信息映射回原尺度 transform.py

4.1 GeneralizedRCNNTransform类

4.1.1 postprocess方法

0.先决知识

学习此篇博客之前，读者应有：

①一定的python编程基础

②已经完全读懂Faster R-CNN代码，如果您还没学过Faster R-CNN内容，请参阅我的专栏：

Faster R-CNN网络源码解析https://blog.csdn.net/qq_41694024/category_12155708.html ③应有深度学习的基础

1.简介

本篇博客将讲述如何利用之前实现好的Faster R-CNN算法实现Mask R-CNN。

2.mask_rcnn.py解析

这里我们定义了MaskRCNN类，继承自FasterRCNN。

2.1 初始化函数

    def __init__(
            self,
            backbone,
            num_classes=None,
            # transform parameters
            min_size=800,
            max_size=1333,
            image_mean=None,
            image_std=None,
            # RPN parameters
            rpn_anchor_generator=None,
            rpn_head=None,
            rpn_pre_nms_top_n_train=2000,
            rpn_pre_nms_top_n_test=1000,
            rpn_post_nms_top_n_train=2000,
            rpn_post_nms_top_n_test=1000,
            rpn_nms_thresh=0.7,
            rpn_fg_iou_thresh=0.7,
            rpn_bg_iou_thresh=0.3,
            rpn_batch_size_per_image=256,
            rpn_positive_fraction=0.5,
            rpn_score_thresh=0.0,
            # Box parameters
            box_roi_pool=None,
            box_head=None,
            box_predictor=None,
            box_score_thresh=0.05,
            box_nms_thresh=0.5,
            box_detections_per_img=100,
            box_fg_iou_thresh=0.5,
            box_bg_iou_thresh=0.5,
            box_batch_size_per_image=512,
            box_positive_fraction=0.25,
            bbox_reg_weights=None,
            # Mask parameters
            mask_roi_pool=None,
            mask_head=None,
            mask_predictor=None,
    ):

        if not isinstance(mask_roi_pool, (MultiScaleRoIAlign, type(None))):
            raise TypeError(
                f"mask_roi_pool should be of type MultiScaleRoIAlign or None instead of {type(mask_roi_pool)}"
            )

        if num_classes is not None:
            if mask_predictor is not None:
                raise ValueError("num_classes should be None when mask_predictor is specified")

        out_channels = backbone.out_channels

        if mask_roi_pool is None:
            mask_roi_pool = MultiScaleRoIAlign(featmap_names=["0", "1", "2", "3"], output_size=14, sampling_ratio=2)

        if mask_head is None:
            out_channels = backbone.out_channels
            mask_layers = (256, 256, 256, 256)
            mask_dilation = 1
            mask_head = MaskRCNNHeads(out_channels, mask_layers, mask_dilation)

        if mask_predictor is None:
            mask_predictor_in_channels = 256
            mask_dim_reduced = 256
            mask_predictor = MaskRCNNPredictor(mask_predictor_in_channels, mask_dim_reduced, num_classes)

        super().__init__(
            backbone,
            num_classes,
            # transform parameters
            min_size,
            max_size,
            image_mean,
            image_std,
            # RPN-specific parameters
            rpn_anchor_generator,
            rpn_head,
            rpn_pre_nms_top_n_train,
            rpn_pre_nms_top_n_test,
            rpn_post_nms_top_n_train,
            rpn_post_nms_top_n_test,
            rpn_nms_thresh,
            rpn_fg_iou_thresh,
            rpn_bg_iou_thresh,
            rpn_batch_size_per_image,
            rpn_positive_fraction,
            rpn_score_thresh,
            # Box parameters
            box_roi_pool,
            box_head,
            box_predictor,
            box_score_thresh,
            box_nms_thresh,
            box_detections_per_img,
            box_fg_iou_thresh,
            box_bg_iou_thresh,
            box_batch_size_per_image,
            box_positive_fraction,
            bbox_reg_weights,
        )

        self.roi_heads.mask_roi_pool = mask_roi_pool
        self.roi_heads.mask_head = mask_head
        self.roi_heads.mask_predictor = mask_predictor

传入了一些参数，一直到Mask parameters之前的参数我们在Faster R-CNN部分有讲到过，这里不再赘述！在这些参数之外，我们会新增三个参数：

@mask_roi_pool

@mask_head

@mask_predictor

这三个参数组成了Mask分支的一系列结构，这里默认为空。

获取backbone的输出通道数赋值给out_channels。

如果mask_roi_pool没有传入（类初始化为空），则通过MultiScaleRoIAlign方法构建一个mask_roi_pool。这里主要将我们的输入特征 $H \times W \times 256$ 下采样到 $14 \times 14 \times 256$ 的大小，我们在构造mask_roi_pool时，参数featmap_names是指采用FPN结构时，在哪些特征层进行目标特征采样，output_size指采样的高和宽，sampling_ratio采样率默认为2，即采样四个点，之前我们有说过这里不再赘述。

如果mask_head没有传入（类初始化为空），则通过MaskRCNNHeads方法构建一个mask_head，这里就对应着上图中的四个 $3\times3$ 的卷积层。（2.2节）。

如果mask_predictor没有传入（类初始化为空），则通过MaskRCNNPredictor方法构建一个mask_predictor，这里的mask_predictor_in_channels就是mask_head中输出的256通道数的特征矩阵，mask_dim_reduced是通过转置卷积将通道数调整为256，num_classes是分类类别个数。（2.3节）。

之后将参数传给父类FasterRCNN中，就会自动构建好在Faster RCNN中使用的结构了。这些参数不包含mask_head、mask_predictor、mask_roi_pool。

比如说在faster_rcnn_framework.py中的roi_head中：

        roi_heads = RoIHeads(
            # box
            box_roi_pool, box_head, box_predictor,
            box_fg_iou_thresh, box_bg_iou_thresh,  # 0.5  0.5
            box_batch_size_per_image, box_positive_fraction,  # 512  0.25
            bbox_reg_weights,
            box_score_thresh, box_nms_thresh, box_detections_per_img)  # 0.05  0.5  100

它会将这个roi_head传入到FasterRCNN的父类中（FasterRCNNBase类）

        super(FasterRCNN, self).__init__(backbone, rpn, roi_heads, transform)

调用父类的初始化方法之后，我们的roi_heads就已经创建好了，所以直接可以进行如下代码了：

        self.roi_heads.mask_roi_pool = mask_roi_pool
        self.roi_heads.mask_head = mask_head
        self.roi_heads.mask_predictor = mask_predictor

也就是说mask-rcnn分支是添加到ROIHeads类下的。

2.2 MaskRCNNHeads类

class MaskRCNNHeads(nn.Sequential):
    def __init__(self, in_channels, layers, dilation):
        """
        Args:
            in_channels (int): number of input channels
            layers (tuple): feature dimensions of each FCN layer
            dilation (int): dilation rate of kernel
        """
        d = OrderedDict()
        next_feature = in_channels

        for layer_idx, layers_features in enumerate(layers, 1):
            d[f"mask_fcn{layer_idx}"] = nn.Conv2d(next_feature,
                                                  layers_features,
                                                  kernel_size=3,
                                                  stride=1,
                                                  padding=dilation,
                                                  dilation=dilation)
            d[f"relu{layer_idx}"] = nn.ReLU(inplace=True)
            next_feature = layers_features

        super().__init__(d)
        # initial params
        for name, param in self.named_parameters():
            if "weight" in name:
                nn.init.kaiming_normal_(param, mode="fan_out", nonlinearity="relu")
        if mask_head is None:
            out_channels = backbone.out_channels
            mask_layers = (256, 256, 256, 256)
            mask_dilation = 1
            mask_head = MaskRCNNHeads(out_channels, mask_layers, mask_dilation)
传入变量：

        in_channels：FPN层的out_channels

        layers：将四个特征层的channel调整到（256，256，256，256）

        mask_dilation：不起作用的参数

类继承自nn.Sequential，首先初始化有序字典d，将in_channels赋值给next_feature。

遍历layers循环构建每一个 $3\times3$ 的卷积层以及ReLU，每遍历一次会构建一个卷积层，输入特征层的channel就是next_feature，输出特征层的channel就是layers_features（256），卷积核大小为 $3\times3$ ，步距为1，padding=1（不会改变特征层的大小），每一次会跟上一个ReLU，每循环一次记录此次循环的输出的channel数next_feature，以便下次循环初始化。

循环完成之后我们就构建了3个 $3\times3$ 的卷积层了，将这个字典传给父类的初始化方法，最后对参数进行初始化，这里仅仅对卷积层的kernel权重初始化了。

2.3 MaskRCNNPredictor类

class MaskRCNNPredictor(nn.Sequential):
    def __init__(self, in_channels, dim_reduced, num_classes):
        super().__init__(OrderedDict([
            ("conv5_mask", nn.ConvTranspose2d(in_channels, dim_reduced, 2, 2, 0)),
            ("relu", nn.ReLU(inplace=True)),
            ("mask_fcn_logits", nn.Conv2d(dim_reduced, num_classes, 1, 1, 0))
        ]))
        # initial params
        for name, param in self.named_parameters():
            if "weight" in name:
                nn.init.kaiming_normal_(param, mode="fan_out", nonlinearity="relu")
这里对应上图中红色框体部分。

在父类初始化函数中传入有序字典：

①第一个结构是转置卷积：in_channels就是256；dim_reduced就是out_channel，这里也是256；卷积核大小为 $2\times2$ ，步距为2，padding为0。再用ReLU激活函数激活。

②第二个结构是卷积层：输入channel是dim_reduced，输出channel是分类类别，卷积核大小为 $1\times1$ ，步距为1，padding为0。

3.RoIHeads类解析

3.1 正向传播过程

    def forward(self,
                features,       # type: Dict[str, Tensor]
                proposals,      # type: List[Tensor]
                image_shapes,   # type: List[Tuple[int, int]]
                targets=None    # type: Optional[List[Dict[str, Tensor]]]
                ):
        # type: (...) -> Tuple[List[Dict[str, Tensor]], Dict[str, Tensor]]
        """
        Arguments:
            features (List[Tensor])
            proposals (List[Tensor[N, 4]])
            image_shapes (List[Tuple[H, W]])
            targets (List[Dict])
        """

        # 检查targets的数据类型是否正确
        if targets is not None:
            for t in targets:
                floating_point_types = (torch.float, torch.double, torch.half)
                assert t["boxes"].dtype in floating_point_types, "target boxes must of float type"
                assert t["labels"].dtype == torch.int64, "target labels must of int64 type"

        if self.training:
            # 划分正负样本，统计对应gt的标签以及边界框回归信息
            proposals, matched_idxs, labels, regression_targets = self.select_training_samples(proposals, targets)
        else:
            labels = None
            regression_targets = None
            matched_idxs = None

        # 将采集样本通过Multi-scale RoIAlign pooling层
        # box_features_shape: [num_proposals, channel, height, width]
        box_features = self.box_roi_pool(features, proposals, image_shapes)

        # 通过roi_pooling后的两层全连接层
        # box_features_shape: [num_proposals, representation_size]
        box_features = self.box_head(box_features)

        # 接着分别预测目标类别和边界框回归参数
        class_logits, box_regression = self.box_predictor(box_features)

        result: List[Dict[str, torch.Tensor]] = []
        losses = {}
        if self.training:
            assert labels is not None and regression_targets is not None
            loss_classifier, loss_box_reg = fastrcnn_loss(
                class_logits, box_regression, labels, regression_targets)
            losses = {
                "loss_classifier": loss_classifier,
                "loss_box_reg": loss_box_reg
            }
        else:
            boxes, scores, labels = self.postprocess_detections(class_logits, box_regression, proposals, image_shapes)
            num_images = len(boxes)
            for i in range(num_images):
                result.append(
                    {
                        "boxes": boxes[i],
                        "labels": labels[i],
                        "scores": scores[i],
                    }
                )

        if self.has_mask():
            mask_proposals = [p["boxes"] for p in result]  # 将最终预测的Boxes信息取出
            if self.training:
                # matched_idxs为每个proposal在正负样本匹配过程中得到的gt索引(背景的gt索引也默认设置成了0)
                if matched_idxs is None:
                    raise ValueError("if in training, matched_idxs should not be None")

                # during training, only focus on positive boxes
                num_images = len(proposals)
                mask_proposals = []
                pos_matched_idxs = []
                for img_id in range(num_images):
                    pos = torch.where(labels[img_id] > 0)[0]  # 寻找对应gt类别大于0，即正样本
                    mask_proposals.append(proposals[img_id][pos])
                    pos_matched_idxs.append(matched_idxs[img_id][pos])
            else:
                pos_matched_idxs = None

            mask_features = self.mask_roi_pool(features, mask_proposals, image_shapes)
            mask_features = self.mask_head(mask_features)
            mask_logits = self.mask_predictor(mask_features)

            loss_mask = {}
            if self.training:
                if targets is None or pos_matched_idxs is None or mask_logits is None:
                    raise ValueError("targets, pos_matched_idxs, mask_logits cannot be None when training")

                gt_masks = [t["masks"] for t in targets]
                gt_labels = [t["labels"] for t in targets]
                rcnn_loss_mask = maskrcnn_loss(mask_logits, mask_proposals, gt_masks, gt_labels, pos_matched_idxs)
                loss_mask = {"loss_mask": rcnn_loss_mask}
            else:
                labels = [r["labels"] for r in result]
                mask_probs = maskrcnn_inference(mask_logits, labels)
                for mask_prob, r in zip(mask_probs, result):
                    r["masks"] = mask_prob

            losses.update(loss_mask)

        return result, losses
我们只说在Faster R-CNN中没有说过的部分：

我们判断是否有mask分支：if self.has_mask():
    def has_mask(self):
        if self.mask_roi_pool is None:
            return False
        if self.mask_head is None:
            return False
        if self.mask_predictor is None:
            return False
        return True
我们将Fast RCNN最终预测的信息result（框体boxes + 标签labels + 分数 scores）的框体信息（boxes）取出存放在mask_proposals中。（注意：如果在训练模式下result为空的列表，非训练模式才有）

如果是训练模式下，取出batch_size的数目num_images，初始化两个变量mask_proposals（存储后续用于计算mask分支损失时所利用到的proposal）和pos_matched_idxs（proposal对应的gt索引）。

遍历每一张图片：

①将每张图片所对应的labels（如果是训练模式labels就是在select_training_samples中对正负样本进行匹配后得到的proposal，其中即包含正样本也包含负样本）（每张图片对应的proposal的类别标签，其中背景的标签为0，我们寻找所有大于0的标签即被分配为正样本的proposal，我们记录它的索引在pos中）

②依次取每张图片中它所对应的proposal中的正样本存入mask_proposals中。

③依次取每张图片中它所对应的正样本proposal对应的gt的索引ID。

调试一下：

proposal是列表类型，由于我们的batch_size为2，因此只有两个元素，每个元素对应一张图片中的proposal个数（512*4）

pos是当前图片中被分为正样本的proposal的索引

mask_proposals存放着对应pos索引的proposal的框体信息

pos_matched_idxs对应着gt的索引

将特征层features、mask_proposals（对于训练模式是我们刚才寻找的归为正样本的proposals、对于验证模式是result得到的box信息）、image_shape（batch中每张图片经过resize后batch前的一个大小）传入mask_roi_pool中。

这时就会将我们的目标全部调整到相同大小（35：当前batch中有35个proposal；256：输入特征层的channel；14*14：通过ROIAlign后得到的特征图）

依次通过mask_head和mask_predictor就可以得到mask分支的输出了：

这里35指35个proposal，91是因为我们使用的COCO数据集（COCO数据集能分类的物体是90类 + 1类背景），针对每个类别我们都会预测一个mask，都是 $28\times28$ 的。

接下来对于训练模式和验证模式，我们又要做不同的处理：

对于训练模式，我们要去计算mask分支的损失；对于非训练模式，我们要提取针对每个目标它所对应预测类别的mask信息。

对于训练模式，将target中的masks信息以及labels信息提取出来

target中存放着提前标注好的信息；对于这个mask，这个2代表我们当前图片有两个目标，799和1207分别对应图片的高度和宽度，mask是和原图一样大小的默认位置填充为0目标位置填充为1

我们将mask_logits, mask_proposals, gt_masks, gt_labels, pos_matched_idxs传入maskrcnn_loss方法计算mask分支的损失。

对于非训练模式，获取所有目标的label，将mask_logits和labels信息传递给maskrcnn_inference中。

3.2 mask部分损失

def maskrcnn_loss(mask_logits, proposals, gt_masks, gt_labels, mask_matched_idxs):
    # type: (Tensor, List[Tensor], List[Tensor], List[Tensor], List[Tensor]) -> Tensor
    """

    Args:
        mask_logits:
        proposals:
        gt_masks:
        gt_labels:
        mask_matched_idxs:

    Returns:
        mask_loss (Tensor): scalar tensor containing the loss
    """

    # 28(FCN分支输出mask的大小)
    discretization_size = mask_logits.shape[-1]
    # 获取每个Proposal(全部为正样本)对应的gt类别
    labels = [gt_label[idxs] for gt_label, idxs in zip(gt_labels, mask_matched_idxs)]
    # 根据Proposal信息在gt_masks上裁剪对应区域做为计算loss时的真正gt_mask
    mask_targets = [
        project_masks_on_boxes(m, p, i, discretization_size) for m, p, i in zip(gt_masks, proposals, mask_matched_idxs)
    ]

    # 将一个batch中所有的Proposal对应信息拼接在一起(统一处理提高并行度)
    labels = torch.cat(labels, dim=0)
    mask_targets = torch.cat(mask_targets, dim=0)

    # torch.mean (in binary_cross_entropy_with_logits) doesn't
    # accept empty tensors, so handle it separately
    if mask_targets.numel() == 0:
        return mask_logits.sum() * 0

    # 计算预测mask与真实gt_mask之间的BCELoss
    mask_loss = F.binary_cross_entropy_with_logits(
        mask_logits[torch.arange(labels.shape[0], device=labels.device), labels], mask_targets
    )
    return mask_loss
mask_matched_idxs存储的是针对每一张图片当中归为正样本的proposal所对应gt的索引：

将idx传入gt_label就可以获得每个Proposal(全部为正样本)对应的gt类别。

接着我们需要根据我们的proposal信息在gt_mask中裁剪用于我们最终计算损失时的mask：我们之前在讲计算损失的时候提到过，我们会根据proposal的位姿信息在原图的mask上进行裁剪，裁剪之后就会得到GT Mask

第一个数值对应当前图片中有多少个正样本的proposal，后面的 $28\times28$ 对应每个proposal得到的mask_targets。也即上图中的GT Mask。

再将labels和mask_targets拼接在一起，最后进行二值交叉熵运算得到损失（网络预测的logits与真实的mask_targets）。

mask_logit对于每个类别都预测了一个mask。但对于计算损失的时候只需要计算关于gt的类别就可以了。因此我们采用切片的方式，将所有关于gt类别的mask抽出来了。

3.3 maskrcnn_inference

def maskrcnn_inference(x, labels):
    # type: (Tensor, List[Tensor]) -> List[Tensor]
    """
    From the results of the CNN, post process the masks
    by taking the mask corresponding to the class with max
    probability (which are of fixed size and directly output
    by the CNN) and return the masks in the mask field of the BoxList.

    Args:
        x (Tensor): the mask logits
        labels (list[BoxList]): bounding boxes that are used as
            reference, one for ech image

    Returns:
        results (list[BoxList]): one BoxList for each image, containing
            the extra field mask
    """
    # 将预测值通过sigmoid激活全部缩放到0~1之间
    mask_prob = x.sigmoid()

    # select masks corresponding to the predicted classes
    num_masks = x.shape[0]
    # 先记录每张图片中boxes/masks的个数
    boxes_per_image = [label.shape[0] for label in labels]
    # 在将所有图片中的masks信息拼接在一起(拼接后统一处理能够提升并行度)
    labels = torch.cat(labels)
    index = torch.arange(num_masks, device=labels.device)
    # 提取每个masks中对应预测最终类别的mask
    mask_prob = mask_prob[index, labels][:, None]
    # 最后再按照每张图片中的masks个数分离开
    mask_prob = mask_prob.split(boxes_per_image, dim=0)

    return mask_prob

预测目标的个数是25个。

遍历labels：得到每张图片目标的个数boxes_per_image（这里我们只有一张图片）

将labels拼接在一起（在这里没用），创建index索引，索引值为0-num_mask-1即0-24，提取每个masks中对应预测最终类别的mask：

4.将预测信息映射回原尺度 transform.py

4.1 GeneralizedRCNNTransform类

4.1.1 postprocess方法

在之前的Faster R-CNN中，这里主要的作用是将预测的边界框映射回原尺度。在Mask R-CNN中除了要做这步以外，我们也需要将mask信息也映射回原图尺度。
    def postprocess(self,
                    result,                # type: List[Dict[str, Tensor]]
                    image_shapes,          # type: List[Tuple[int, int]]
                    original_image_sizes   # type: List[Tuple[int, int]]
                    ):
        # type: (...) -> List[Dict[str, Tensor]]
        """
        对网络的预测结果进行后处理（主要将bboxes还原到原图像尺度上）
        Args:
            result: list(dict), 网络的预测结果, len(result) == batch_size
            image_shapes: list(torch.Size), 图像预处理缩放后的尺寸, len(image_shapes) == batch_size
            original_image_sizes: list(torch.Size), 图像的原始尺寸, len(original_image_sizes) == batch_size

        Returns:

        """
        if self.training:
            return result

        # 遍历每张图片的预测信息，将boxes信息还原回原尺度
        for i, (pred, im_s, o_im_s) in enumerate(zip(result, image_shapes, original_image_sizes)):
            boxes = pred["boxes"]
            boxes = resize_boxes(boxes, im_s, o_im_s)  # 将bboxes缩放回原图像尺度上
            result[i]["boxes"] = boxes
            if "masks" in pred:
                masks = pred["masks"]
                # 将mask映射回原图尺度
                masks = paste_masks_in_image(masks, boxes, o_im_s)
                result[i]["masks"] = masks

        return result
在前面所说，我们针对于每个目标都会预测一个 $28\times28$ 的大小的mask，我们调试一下预测脚本：

我们可以看到针对我们输入的预测图片有25个目标，每个目标都有一个 $28\times28$ 大小的mask。

通过paste_masks_in_image方法将特征图中的mask映射到原图中，这里传入的参数是：

@masks：待预测回原图的mask信息

@boxes：已经映射回原图的边界框信息

@o_im_s：图像的原始尺寸
def paste_masks_in_image(masks, boxes, img_shape, padding=1):
    # type: (Tensor, Tensor, Tuple[int, int], int) -> Tensor

    # pytorch官方说对mask进行expand能够略微提升mAP
    # refer to: https://github.com/pytorch/vision/issues/5845
    masks, scale = expand_masks(masks, padding=padding)
    boxes = expand_boxes(boxes, scale).to(dtype=torch.int64)
    im_h, im_w = img_shape

    if torchvision._is_tracing():
        return _onnx_paste_mask_in_image_loop(
            masks, boxes, torch.scalar_tensor(im_h, dtype=torch.int64), torch.scalar_tensor(im_w, dtype=torch.int64)
        )[:, None]
    res = [paste_mask_in_image(m[0], b, im_h, im_w) for m, b in zip(masks, boxes)]
    if len(res) > 0:
        ret = torch.stack(res, dim=0)[:, None]  # [num_obj, 1, H, W]
    else:
        ret = masks.new_empty((0, 1, im_h, im_w))
    return ret
expand_masks方法是在特征图周围填充了padding个数的0，即在 $28\times28$ 的特征图周围填充一圈0使其变为 $30\times30$ 的特征图。

scale是在padding前后的缩放因子。为了与目标边界框进行对齐对目标边界框也需要进行一个expand处理。

语句块if torchvision._is_tracing():不会执行。
res = [paste_mask_in_image(m[0], b, im_h, im_w) for m, b in zip(masks, boxes)]
同时遍历masks和boxes，将每个目标的mask信息、边界框box信息、原图的高宽输入到paste_mask_in_image方法中。
def paste_mask_in_image(mask, box, im_h, im_w):
    # type: (Tensor, Tensor, int, int) -> Tensor

    # refer to: https://github.com/pytorch/vision/issues/5845
    TO_REMOVE = 1
    w = int(box[2] - box[0] + TO_REMOVE)
    h = int(box[3] - box[1] + TO_REMOVE)
    w = max(w, 1)
    h = max(h, 1)

    # Set shape to [batch, C, H, W]
    # 因为后续的bilinear操作只支持4-D的Tensor
    mask = mask.expand((1, 1, -1, -1))  # -1 means not changing the size of that dimension

    # Resize mask
    mask = F.interpolate(mask, size=(h, w), mode='bilinear', align_corners=False)
    mask = mask[0][0]  # [batch, C, H, W] -> [H, W]

    im_mask = torch.zeros((im_h, im_w), dtype=mask.dtype, device=mask.device)
    # 填入原图的目标区域(防止越界)
    x_0 = max(box[0], 0)
    x_1 = min(box[2] + 1, im_w)
    y_0 = max(box[1], 0)
    y_1 = min(box[3] + 1, im_h)

    # 将resize后的mask填入对应目标区域
    im_mask[y_0:y_1, x_0:x_1] = mask[(y_0 - box[1]):(y_1 - box[1]), (x_0 - box[0]):(x_1 - box[0])]
    return im_mask
前五行代码进行了一个预处理，我也不太明白，大概的流程是让目标边界框的高度和宽度都是大于1的。我们对图片进行处理的时候是以像素为基准的，也不可能一个目标的高宽小于一个像素吧！！！？？？

由于我们输入的mask只有高宽信息：

这步是因为我们在进行双线性插值的时候规定的tensor维度是4D的。

利用双线性插值的方法对mask进行尺度还原，与原图片（输入时）大小相等。

再通过切片的方式只把mask的高宽提取出来：

创建一个值为0的tensor，大小和我们的输入预测图片原尺寸相同：防止目标边界框越界，因为我们刚才对目标边界框进行了expand处理可能会出现越界的情况，因此将其裁剪将目标边界框限制在图片内部。

（为什么要+1，切片是左闭右开的形式，为了能够取到xmax和ymax都需要+1）

将mask对应区域的信息填充到创建的im_mask中。这就是将mask映射到原图的主要实现方式。

这里假设黑的的框是原图，橙色对应网络预测的目标边界框，最后一行对应的操作就是将mask中对应图片内部的信息填充到im_mask中，因为经过双线性插值填充过的mask = mask.expand((1, 1, -1, -1)信息可能会把目标边界框信息溢出原图像，因此我们需要进行一个类似移花接木的操作

回到这部分代码：
def paste_masks_in_image(masks, boxes, img_shape, padding=1):
    # type: (Tensor, Tensor, Tuple[int, int], int) -> Tensor

    # pytorch官方说对mask进行expand能够略微提升mAP
    # refer to: https://github.com/pytorch/vision/issues/5845
    masks, scale = expand_masks(masks, padding=padding)
    boxes = expand_boxes(boxes, scale).to(dtype=torch.int64)
    im_h, im_w = img_shape

    if torchvision._is_tracing():
        return _onnx_paste_mask_in_image_loop(
            masks, boxes, torch.scalar_tensor(im_h, dtype=torch.int64), torch.scalar_tensor(im_w, dtype=torch.int64)
        )[:, None]
    res = [paste_mask_in_image(m[0], b, im_h, im_w) for m, b in zip(masks, boxes)]
    if len(res) > 0:
        ret = torch.stack(res, dim=0)[:, None]  # [num_obj, 1, H, W]
    else:
        ret = masks.new_empty((0, 1, im_h, im_w))
    return ret
这里得到的res就是将每一个目标的mask蒙版都映射到原图之中了。

如果len(res)大于0表示当前有目标，我们通过stack方法将其拼接在一起。

这时我们的ret的shape如下：

返回的ret就是把所有的mask映射回原图的信息了。
    def postprocess(self,
                    result,                # type: List[Dict[str, Tensor]]
                    image_shapes,          # type: List[Tuple[int, int]]
                    original_image_sizes   # type: List[Tuple[int, int]]
                    ):
        # type: (...) -> List[Dict[str, Tensor]]
        """
        对网络的预测结果进行后处理（主要将bboxes还原到原图像尺度上）
        Args:
            result: list(dict), 网络的预测结果, len(result) == batch_size
            image_shapes: list(torch.Size), 图像预处理缩放后的尺寸, len(image_shapes) == batch_size
            original_image_sizes: list(torch.Size), 图像的原始尺寸, len(original_image_sizes) == batch_size

        Returns:

        """
        if self.training:
            return result

        # 遍历每张图片的预测信息，将boxes信息还原回原尺度
        for i, (pred, im_s, o_im_s) in enumerate(zip(result, image_shapes, original_image_sizes)):
            boxes = pred["boxes"]
            boxes = resize_boxes(boxes, im_s, o_im_s)  # 将bboxes缩放回原图像尺度上
            result[i]["boxes"] = boxes
            if "masks" in pred:
                masks = pred["masks"]
                # 将mask映射回原图尺度
                masks = paste_masks_in_image(masks, boxes, o_im_s)
                result[i]["masks"] = masks

        return result
输出的mask就是我们得到的经过输入的mask映射回原图的信息了，将mask信息存入到网络预测结果中。我们的Mask RCNN网络也就到此结束了。

你可能感兴趣的:(Mask,RCNN网络解析笔记,深度学习,目标检测,人工智能)

Python学习总结学学睡觉 python 学习开发语言
客户端与服务端聊天窗口服务端导入wxPython用于创建图形界面。socket用于网络通信，AF_INET是IPv4地址族，SOCK_STREAM表示流式套接字（TCP）。利用wxPython创建图形界面，并通过socket与服务器通信。主要功能：连接服务器。发送和接收消息。断开连接。界面上有文本框和按钮来操作。wxPython处理UI部分，socket处理网络通信。importthreading
【模块】Non-local Neural dearr__ 扒网络模块深度学习 pytorch python
论文《Non-localNeuralNetworks》作用非局部神经网络通过非局部操作捕获长距离依赖，这对于深度神经网络来说至关重要。这些操作允许模型在空间、时间或时空中的任何位置间直接计算相互作用，从而捕获长距离的交互和依赖关系。这种方法对于视频分类、对象检测/分割以及姿态估计等任务表现出了显著的改进。机制非局部操作通过在输入特征图的所有位置上计算响应的加权和来实现，其中权重由位置之间的关系（如
【模块】GNConv卷积模块 dearr__ 扒网络模块深度学习 python pytorch
论文《GCNet:Non-localNetworksMeetSqueeze-ExcitationNetworksandBeyond》1、作用GCNet（GlobalContextNetwork）结合了非局部网络（Non-LocalNetwork，NLNet）的长距离依赖捕捉能力和Squeeze-ExcitationNetwork（SENet）的轻量级特性，有效地建模全局上下文信息。通过简化非局部块
嵌入式开发：嵌入式软件开发和编程粤嵌教育嵌入式嵌入式开发嵌入式培训嵌入式软件嵌入式硬件嵌入式
每天，人们都要面对和使用数十种设备，这些设备的功能依赖于微芯片和电路板，这些是带有内置软件的小工具，例如照相机、健身追踪器、咖啡机等。由于许多在生活的某些领域执行关键功能，因此在嵌入式开发中嵌入式软件仍然是一个热门话题。如果你想找到一家可靠的嵌入式系统公司，可以提供软件开发服务来实现你对智能数字设备的想法，你需要了解有关嵌入式软件编程的基本事实。介绍首先，应该注意的是，我们安装在笔记本电脑或智能手
RabbitMQ系列（二）基本概念之Publisher yyueshen RabbitMQ #RabbitMQ概念 rabbitmq 分布式
在RabbitMQ中，Publisher（发布者）是负责向RabbitMQ服务器发送消息的客户端角色，通常被称为“生产者”。以下是其核心功能与工作机制的详细解析：一、核心定义与作用消息发送者Publisher将消息发送到RabbitMQ的Exchange（交换机），而非直接发送到队列。Exchange根据消息的RoutingKey（路由键）和绑定规则将消息路由到对应的队列（Queue）。解耦生产与
【华为OD机试真题E卷】 27、计算最大乘积 | 机试真题+思路参考+代码解析（C++、Java、Py） KFickle Java Py）华为od c++java 华为OD机试真题计算最大乘积
文章目录一、题目题目描述输入输出样例1二、代码与思路参考C++代码Java代码Python代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题D、E卷，每题都使用C++，Java，Python语言进行解答，每个题目的思路分析都非常详细，持续更新，支持在线OJ刷题，订阅后评论获取权限，有代码问题随时解答，代码仅供学习参考一、题目题目描述给定一个元素类型
三分钟掌握 TCP/IP：揭示互联网飞速互联的奥秘！跑起来总会有风 tcp/ip 网络
TCP/IP模型详解本文基于经典的TCP/IP模型原理，结合常见实践进行深入解读，适用于对计算机网络或互联网协议栈感兴趣的读者。希望能帮助大家更好地理解现代网络通信的核心框架。一、什么是TCP/IP？TCP/IP是互联网的基础协议栈，英文全称为TransmissionControlProtocol/InternetProtocol。它由美国国防部（DoD）在20世纪60年代发展起来，并在ARPAN
通用无线设备对码软件_通用软件无线电平台USRP-LW N310 weixin_39793319 通用无线设备对码软件
USRP-LWN310http://www.luowave.com产品综述：USRP-LWN310是一种网络的软件定义无线电（SDR），它提供了部署大规模的可靠的和容错性的分布式无线系统。USRP-LWN310通过引入远程执行任务的能力简化了对SDR系统的控制和管理，如更新软件，重新启动，工厂复位、自检，主机/ARM调试以及监控系统运行。USRP-LWN310是目前SDR市场上通道数量最为密集的产
嵌入式linux系统中压力测试的方法嵌入式开发星球 linux 压力测试运维
在Linux环境下，确保系统各项资源充分且稳定地运行对任何系统管理员来说都至关重要。特别是在生产环境中，理解如何对系统资源进行基准测试和压力测试可以帮助预防未来的问题，同时也能够优化现有系统的性能。在本文中，我们将探讨如何使用命令行工具来对Linux系统的CPU、内存、网络和I/O资源进行压力测试，抛砖引玉，希望大家线下详细学习并加以练习。CPU压力测试在Linux系统中，对CPU进行压力测试有助
Vue3 Composition API与十大组件开发案例详解北辰alk vue vue.js
文章目录一、Vue3核心API解析1.1CompositionAPI优势1.2核心API二、十大组件开发案例案例1：响应式表单组件案例2：动态模态框（Teleport应用）案例3：可复用列表组件案例4：全局状态通知组件案例5：图片懒加载组件案例6：异步数据加载组件案例7：可拖拽排序列表案例8：路由守卫高阶组件案例9：主题切换Provider案例10：可视化表单生成器三、组件开发最佳实践四、总结一、
基于yolov10的水果成熟度之石榴成熟度检测 qq1309399183 计算机视觉实战项目集合 YOLO 目标检测目标跟踪计算机视觉人工智能水果成熟度检测视觉检测
石榴成熟度检测**Pomegranate*是一个基于深度学习的系统，旨在自动化检测和分类石榴果实的生长阶段（未成熟、成熟、成熟期）。该系统采用最新的YOLOv10目标检测模型，能够高效地分析图像或视频中的石榴果实，并根据其外观特征识别其生长阶段。通过这种技术，农民可以更好地监控石榴果实的发育过程，优化作物管理，合理安排收获时间，从而提高生产效率和经济收益。系统概述石榴作为一种重要的水果作物，广泛种
《Operating System Concepts》阅读笔记：p162-p176 操作系统
《OperatingSystemConcepts》学习第17天，p162-p176总结，总计15页。一、技术总结1.thread（1)定义AthreadisabasicunitofCPUutilization;itcomprisesathreadID,aprogramcounter(PC),aregisterset,andastack.Aprocesscontrolstructurethatisa
ROS2软件调用架构和机制解析：Publisher创建 slam02∞ ros2 dds
术语DDS(DataDistributionService):用于实时系统的数据分发服务标准，是ROS2底层通信的基础RMW(ROSMiddleware):ROS中间件接口，提供与具体DDS实现无关的抽象APIQoS(QualityofService):服务质量策略，控制通信的可靠性、历史记录、耐久性等属性符号解析:动态库加载过程中，查找和绑定函数指针的机制1.架构概述ROS2采用分层设计，通过多
【C++】——精细化哈希表架构：理论与实践的综合分析 vip1024p 面试学习路线阿里巴巴 c++散列表架构
先找出你的能力在哪里，然后再决定你是谁。——塔拉·韦斯特弗《你当像鸟飞往你的山》目录1.C++与哈希表：核心概念与引入2.哈希表的底层机制：原理与挑战2.1核心功能解析：效率与灵活性的平衡2.2哈希冲突的本质：问题与应对策略2.3开散列与闭散列：两大解决方案的比较3.闭散列的精确实现：从设计到优化3.1整体框架设计：面向扩展的架构3.2仿函数的灵活性：高效哈希的关键3.3插入操作：冲突检测与位置分
萤石云RTC技术优势详解与开放服务做萤石二次开发的哈哈实时音视频 RTC webrtc
春节假期结束，又有一批一批的人踏上了外出工作的奋斗之路，空间上的阻隔，降低了部分留在家乡的“老小组合”与打拼者之间的交流。萤石S10带屏摄像机的出现，解决了数码产品操作与网络要求更为复杂的问题，为消费者大大降低使用门槛，进一步促进亲情沟通的便利。萤石S10双向视频通话摄像机操作便捷，支持4G无线流量，同时支持微信接听视频呼叫的功能，其采用ERTC（萤石实时音视频）技术，弱网下也能流畅通话。更多优化
怎么样换手机ip地址？这些方法你知道吗 hgdlip 更换ip地址手机 ip 智能手机 tcp/ip 智能路由器
在当今数字化时代，IP地址作为设备在网络中的唯一标识，对于保护个人隐私、绕过地域限制以及提升网络安全等方面都至关重要。有时候，我们可能需要更换手机的IP地址，以实现特定的网络活动或解决某些网络问题。本文将详细介绍如何更换手机的IP地址，帮助读者轻松掌握这一技能。‌一、了解IP地址‌首先，我们需要明确什么是IP地址。IP地址是互联网协议地址（InternetProtocolAddress）的缩写，它
A类地址与B类地址：区别、联系与应用 hgdlip ip 服务器运维 A类地址 B类地址
在浩瀚的数字世界中，IP地址作为网络中设备的唯一标识符，扮演着至关重要的角色。随着互联网的不断发展，IP地址的分类也日益精细，其中A类地址和B类地址作为IPv4地址体系中的两大支柱，各自承载着不同的网络需求。本文将深入探讨A类地址和B类地址的区别和联系及其在实际应用中的场景，带您一窥IP地址世界的奥秘。‌一、A类地址与B类地址的区别‌‌地址结构‌：A类地址使用第一个字节表示网络地址，剩余三个字节用
如果更换ip地址会怎么样？网络ip地址怎么更换 hgdlip ip 更换ip地址 tcp/ip 网络网络协议
IP地址，作为网络设备的数字身份证，其稳定性和安全性对于网络通讯至关重要。然而，在某些特定情况下，我们可能需要更换设备的IP地址，以满足安全、隐私或网络管理的需求。那么，如果更换IP地址会怎么样？又该如何安全、有效地进行IP地址的更换呢？本文将为您全面解析更换IP地址的影响，并提供详细的操作指南，帮助您轻松应对这一任务。一、更换IP地址的积极影响‌‌增强隐私保护‌：定期更换IP地址可以有效减少个人
笔记：大模型Tokens是啥？为啥大模型按Tokens收费？瞬间动力硅基蒸馏 easyui 前端 javascript 人工智能 to oneapi 阿里云
一、Token的定义与示例1.核心概念Token是自然语言处理中的最小文本单位，代表模型处理文本时的一次计算单元。英文场景：1个token≈1个单词或标点符号。示例：句子"Hello,world!"拆分为["Hello",",","world","!"]，共4个token。中文场景：1个token≈1个汉字或词语。示例：短语"深度求索"拆分为["深","度","求","索"]，共4个token；若
Java内存的堆（堆内、堆外）、栈含义理解笔记瞬间动力 spring cloud jvm spring intellij-idea java
一、核心概念区分1.内存中的堆（Heap）与栈（Stack）栈内存▸用途：存储方法调用、局部变量、基本类型数据（如inta=1）▸特点：线程私有，每个线程独立分配栈空间。自动分配和释放（编译时确定），遵循LIFO（后进先出）原则。容量小且固定，易发生栈溢出（如无限递归导致StackOverflowError）堆内存▸用途：存储对象实例、数组等引用类型数据（如newObject()）▸特点：全局共享
如何用Python 3调用ArXiv API查询ArXiv论文元数据诸神缄默不语编程学习笔记 python 开发语言 ArXiv API XML urllib
诸神缄默不语-个人CSDN博文目录ArXivAPI文档：arXivAPIAccess-arXivinfoarXivAPIBasics-arXivinfoarXivAPIUser’sManual-arXivinfo文章目录1.调包2.获取数据1.简单入门2.XML返回值示例3.添加分类信息，获取最新论文4.ArXiv查询入参详解3.解析XML数据1.调包importurllibfromurllib.
docker快速安装带认证Es和Kinbana 大大大大肉包 docker docker elasticsearch 容器
es安装1、进行拉取镜像dockerpullelasticsearch:7.17.16dockerpullkinbana:7.17.162、查看下载的镜像：dockerimages；3、创建虚拟网络：dockernetworkcreatees-net4、创建挂载目录mkdir-p/usr/local/elasticsearch/pluginsmkdir-p/usr/local/elasticsea
**LangChain 核心概念与架构详解** dgay_hua langchain 架构 python
简介LangChain是一个强大的框架，专注于构建基于大语言模型(LLM)的应用。本文将深入介绍LangChain的核心架构、关键组件以及其特性。通过理解这些内容，开发者能更高效地构建复杂的LLM应用。LangChain架构解析LangChain的架构由多个包组成，每个包负责特定的功能模块。以下是主要组件的功能和作用：1.核心基础包(langchain-core)此包定义了LangChain的基础
全面解析：如何查找电脑的局域网与公网IP地址‌ hgdlip ip 电脑 tcp/ip 网络协议网络电脑
在数字化时代，IP地址作为网络设备的唯一标识，对于网络连接、远程访问、网络诊断等方面都至关重要。无论是出于工作需要，还是解决网络问题，了解怎么查找电脑的IP地址都是一项必备技能。本文将详细介绍几种常见的方法，帮助用户轻松找到电脑的IP地址。一、查找电脑局域网IP地址‌局域网IP地址，也称为内网IP地址，是在局域网内部用于设备间通信的地址。在Windows和Mac系统中，查找局域IP地址的方法略有不
RabbitMQ系列（七）基本概念之Channel yyueshen RabbitMQ #RabbitMQ概念 rabbitmq 分布式
RabbitMQ中的Channel（信道）是客户端与RabbitMQ服务器通信的虚拟会话通道，其核心作用在于优化资源利用并提升消息处理效率。以下是其核心机制与功能的详细解析：一、Channel的核心定义虚拟通信链路Channel是建立在TCP连接（Connection）上的轻量级虚拟连接，允许在单个TCP连接上复用多个独立的信道（Channel）。为了确保其私有性和线程安全性，每个Channel拥
Python语法糖教程第2天—Python装饰器深度解析与高阶应用指南 Bruce_xiaowei 编程笔记总结经验 python 开发语言
Python语法糖教程第2天—Python装饰器深度解析与高阶应用指南一、装饰器本质揭秘1.1装饰器的运行时序defdecorator(func):print("装饰器初始化阶段")defwrapper(*args,**kwargs):print("函数执行前操作")result=func(*args,**kwargs)print("函数执行后操作")returnresultreturnwrapp
疯狂python_疯狂 python weixin_39646970 疯狂python
书籍：python游戏编码CodingGamesinPython-2018简介初学者和有经验的程序员可以使用Python来构建和玩电脑游戏，从令人惊叹的脑筋急转弯到具有爆炸性声音效果和3D图形的疯狂动作游戏。Python中CodingGames的每一章都展示了如何用简单的编号步骤构建一个完整的工作游戏。本书讲授如何使用免费的资源，如PyGameZero和Ble...文章python人工智能命理20
ES6笔记总结（Xmind格式）：第二天星河路漫漫 ES6笔记总结 es6 笔记前端
Xmind鸟瞰图：简单文字总结：ES6知识总结Proxy（代理）：1.作用：实现数据的私有化处理2.target目标对象handler处理函数3.处理函数中有两个方法：get,set4.读取数据会触发get方法，写入数据会触发set方法Reflect（反射）1.作用：用于拦截并操作JavaScript对象的方法2.提供与Object内置方法相同功能的方法3.提供更安全的操作4.作为Proxy的默认
ES6 笔记总结 js_user 前端基础 es6
1.变量var可以重复声明，无法限制修改，函数级（没有块级作用域）let不能重复声明，块级作用域，变量-可以修改const不能重复声明，块级作用域，常量-不能修改2.箭头函数1.方便如果只有一个参数，（）可以省略如果只有一个return,{}可以省略修正this3.参数扩展1.收集剩余的参数functionshow(a,b,...args){剩余的参数必须是最后一个}展开数组展开后的效果，跟直接打
yolov5-训练好的模型部署的几种方式-ONNX 黄晓魚 halcon3d PCL点云处理深度神经网络 YOLO C#python
ONNX，即OpenNeuralNetworkExchange，是微软和Facebook发布的一个深度学习开发工具生态系统，旨在让AI开发人员能够随着项目发展而选择正确的工具。ONNX所针对的是深度学习开发生态中最关键的问题之一，在任意一个框架上训练的神经网络模型，无法直接在另一个框架上用。开发者需要耗费大量时间精力把模型从一个开发平台移植到另一个。因此，如何实现不同框架之间的互操作性，简化从研究
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象