Activewaste

mmdetection源码笔记（二）：创建网络模型之cascade_rcnn.py的解读（中）

引言：

cascade_rcnn.py文件在moels/detections文件夹下。本次对文件cascade_rcnn.py的代码解读，是根据py配置文件configs/cascade_rcnn_r50_fpn_1x.py的数据信息进行讲解的。

moels/detectionscascade_rcnn.py文件中

主要的内容如下：

__init__() ：module的构造函数。
init_weights() ：backbone为cascade rcnn的初始化权重方法，在__init__()调用进行初始化。
extract_feat() ：提取img特征，主要实现了backbone和neck的forward()的前向计算。
forward_train() ：在这里实现层之间的连接关系，其实就是所谓的前向传播。当执行model(x)（该model为module的子类）的时候，底层自动调用forward方法计算结果。
simple_test() ：检测过程的前向传播forward调用的函数，通过最原始的nn.Module到父类BaseDetector的forward，继续由底层，层层向上调用到这里。
aug_test() ：Test with augmentations。
show_result() ：

共七个部分，本篇文章主要对前四个部分的代码精度，这四个步骤中的__init__()和forward_train()是module类的最主要的两个部分，也是定义网络的最关键的部分。
自定义一个模型就是通过继承nn.Module类来实现，在__init__()构造函数中申明各个层的定义，在forward()中实现层之间的连接关系，实际上就是前向传播的过程。

注：后面三个部分，博主后续会继续阅读代码，在对这三个部分进行补充。

首先，看本篇讲解时，先了解一下下篇文章，该文章讲解了创建模型的过程，尤其以detection为例，讲解了mmdetection通过注册表的形式，实例化了类名为DETECTION的Rigistry类，并且在其module_dict属性中，保存了detection的module类，和其对应的类名。通过这篇文章，可以了解mmdetection如何注册和创建模型的。

mmdetection源码笔记（二）：创建网络模型之registry.py和builder.py解读（上）

其次，了解一下torch.nn.module（有pytorch基础也行，博主刚开始看mmdetection时，没有pytorch一点基础，然后看到forward()函数时，找了好几个文件夹，看他在哪里调用的…，后面才知道，forward()是自定义层的前向计算，自动执行的（也就是对输入自动进行处理）），推荐下篇文章：

PyTorch之前向传播函数forward

init()

@DETECTORS.register_module 
#在build_from_cfg()中，实例化detector，然后在通过形参的方式，将类和类名送入了方法register_module中。
class CascadeRCNN(BaseDetector, RPNTestMixin):
                                           # 参数来自cascade_rcnn_r50_fpn_1x.py
    def __init__(self,
                 num_stages,               # 3
                 backbone,                 # ResNet
                 neck=None,                # FPN
                 shared_head=None,         
                 rpn_head=None,            # RPNHead
                 bbox_roi_extractor=None,  # SingleRoIExtractor
                 bbox_head=None,           # SharedFCBBoxHead  *  3 （三阶段）
                 mask_roi_extractor=None,  
                 mask_head=None,
                 train_cfg=None,           # assigner : MaxIoUAssigner ;  sampler : RandomSampler 
                 test_cfg=None,            # skip
                 pretrained=None):         # modelzoo://resnet50
        assert bbox_roi_extractor is not None
        assert bbox_head is not None
        super(CascadeRCNN, self).__init__()

        self.num_stages = num_stages
        self.backbone = builder.build_backbone(backbone)  # build backbone and Registry
        
		#同上，创建模型，对各个组件（比如backbone、neck、bbox_head等字典数据，构建成module类）分别创建module类模型
        if neck is not None:
            self.neck = builder.build_neck(neck)
        if rpn_head is not None:
            self.rpn_head = builder.build_head(rpn_head)
        if shared_head is not None:
            self.shared_head = builder.build_shared_head(shared_head)
        if bbox_head is not None:
            self.bbox_roi_extractor = nn.ModuleList()      
            #ModuleList() 能够像列表一样索引 , [module1 , module2 , module3 ....]
            #type='SingleRoIExtractor'  
            
            self.bbox_head = nn.ModuleList()
            #SharedFCBBoxHead * 3 ; 三个字典构成list列表，字典的type一样，但是里面的其他字段不一样
            
            if not isinstance(bbox_roi_extractor, list):
                bbox_roi_extractor = [
                    bbox_roi_extractor for _ in range(num_stages)  
                    # cascade rcnn, 1 stage + 3 stage , 3 include 3 times detection
                ]
            if not isinstance(bbox_head, list): # bbox_head is list, so skip
                bbox_head = [bbox_head for _ in range(num_stages)]
            assert len(bbox_roi_extractor) == len(bbox_head) == self.num_stages
            
            for roi_extractor, head in zip(bbox_roi_extractor, bbox_head):
                self.bbox_roi_extractor.append(
                    builder.build_roi_extractor(roi_extractor))  # build bbox_roi_extractor
                self.bbox_head.append(builder.build_head(head))  # build bbox_head

        if mask_head is not None:   # 配置文件是cascade rcnn，没有涉及到mask部分，不过mask也是一样的，build都是相同目的 
            self.mask_head = nn.ModuleList()
            if not isinstance(mask_head, list):
                mask_head = [mask_head for _ in range(num_stages)]
            assert len(mask_head) == self.num_stages
            
            for head in mask_head:
                self.mask_head.append(builder.build_head(head)) # build mask_head
                
            if mask_roi_extractor is not None:                  # 配置文件中也没有 mask_roi_extractor   -> None   ，所以跳到下面的else部分。
            #该部分类似于build.py文件中的build()方法，本质都是build模型，只是对多个字典还是单个字典进行分别处理而已。
                self.share_roi_extractor = False
                self.mask_roi_extractor = nn.ModuleList()
                if not isinstance(mask_roi_extractor, list):
                    mask_roi_extractor = [
                        mask_roi_extractor for _ in range(num_stages)
                    ]
                assert len(mask_roi_extractor) == self.num_stages
                for roi_extractor in mask_roi_extractor:
                    self.mask_roi_extractor.append(
                        builder.build_roi_extractor(roi_extractor)) # build mask_roi_extractor
            else:
                self.share_roi_extractor = True                     # share_roi_extractor = True
                self.mask_roi_extractor = self.bbox_roi_extractor   # mask_roi_extractor = bbox_roi_extractor 

        self.train_cfg = train_cfg                                  # train_cfg字典
        self.test_cfg = test_cfg                                    # test_cfg字典
        
        # 以上都是在建模型的过程，换句话说就是将config配置文件中的字典映射成module，将数据进行保存到module的属性中。这些module类都是torch.nn.module的子类。

        self.init_weights(pretrained=pretrained)                        # 初始化detector的权值。

init_weights()

# 初始化权值过程
    def init_weights(self, pretrained=None):                            # pretrained= modelzoo://resnet50
        super(CascadeRCNN, self).init_weights(pretrained)
        self.backbone.init_weights(pretrained=pretrained)               # backbone.init_weights()
        if self.with_neck:
            if isinstance(self.neck, nn.Sequential):                    # nn.Sequential  ?
                for m in self.neck:
                    m.init_weights()                                    # neck.init_weights()
            else:
                self.neck.init_weights()
        if self.with_rpn:                                               # true
            self.rpn_head.init_weights()                                # rpn_head.init_weights() 
        if self.with_shared_head:
            self.shared_head.init_weights(pretrained=pretrained)        # hared_head.init_weights()
        for i in range(self.num_stages):
            if self.with_bbox:
                self.bbox_roi_extractor[i].init_weights()
                self.bbox_head[i].init_weights()
            if self.with_mask:
                if not self.share_roi_extractor:
                    self.mask_roi_extractor[i].init_weights()
                self.mask_head[i].init_weights()

extract_feat()

 	def extract_feat(self, img):
        x = self.backbone(img)  # 经过backbone的前向计算  提取特征
        if self.with_neck:      #如果有neck特征处理的话，将提取处的特征，进行对应的特征处理。
            x = self.neck(x)

forward_train()

我们上面说，实例化一个module类的时候，会自动执行forward()方法，计算结果。
那为什么实例化一个类的时候就可以调用forward？原来是实例化的时候会调用__call__方法，然后在这个方法里面调用forward方法。

在Python中，一个特殊的魔术方法可以让类的实例的行为表现的像函数一样，你可以调用他们，将一个函数当做一个参数传到另外一个函数中等等。这是一个非常强大的特性让Python编程更加舒适甜美。 __call_(self, [args…])
允许一个类的实例像函数一样被调用。实质上说，这意味着 x() 与 x.__call_() 是相同的。注意 _call_ 参数可变。这意味着你可以定义 _call_ 为其他你想要的函数，无论有多少个参数。

然而在本py文件中，并没有forward()方法。

网上说，当继承nn.module时，必须实现forward()方法，那这里为什么没有实现？我查看了其父类BaseDetector，发现，在父类BaseDetector中，实现了forward()，所以子类CascadeRCNN是继承的BaseDetector，而BaseDetector继承nn.module，所以在BaseDetector中实现forward()应该也是可以的，所以调用CascadeRCNN的时候，也就会调用父类的forward()（子类没有重写覆盖父类的forward()方法），在父类BaseDetector的forward()中，调用了forward_train()（其在父类中是抽象方法）。所以，可以理解为，forward_train()的作用就是CascadeRCNN的前向传播计算。

检测思路：

大体上思路：input -> backbone -> neck -> head -> cls and pred

结合以上的思路，我们捋一捋forward()的实现过程：

首先输入图片，然后就是提取特征，这里用到的函数是extract_feat()；它包含了backbone + neck 两个部分，计算了前向的backbone传播和FPN。即调用了self.backbone(img)和self.neck(x)。
然后就是要提取框框了，这一步用rpn_head(x)实现。rpn_head(x)在models/anchor_head/rpn_head.py中，RPN的目标是得到候选框，所以这里就还要用到anchor_head.py中的另一个函数get_bboxs()，该函数在models/anchor_head/anchor_head.py中，前者是后者的子类。
提取框框后，直接送入训练？不行，上一步rpn输出了一堆候选框，但是在将这些候选框拿去训练之前还需要分为正负样本。assigners就是完成这个工作的。将proposal分为正负样本过后，通过sampler对这些proposal进行采样得到sampler_result进行训练。主要是调用了bbox_assigner.assign()和bbox_sampler.sample()。
现在bbox已经处理好了，当然得到的那些框还不能直接送到bbox head，在此之前还要做一次RoI Pooling，将不同大小的框映射成固定大小。roi_layers用的是RoIAlign(由配置文件可以知道具体用的是什么类型的ROI处理)，RoI的结果就可以送到bbox head了。调用的函数是bbox_roi_extractor()。
bbox head部分和之前的rpn部分的操作差不多，主要是针对每个框进行分类和坐标修正。之前rpn分为前景和背景两类，这里分为N+1类(实际类别 + 背景)。调用的是bbox_head。
mask_head部分这里没有将，因为主要是依据配置文件configs/cascade_rcnn_r50_fpn_1x.py的，但是其处理和bbox head是一样的。（bbox_head 输出：bbox_cls + bbox_pred；而mask_head 输出：mask_pred）
最最最重要的是loss的计算，它从RPN阶段，就开始有loss了。

以上就是下面forward的大致处理过程，里面涉及到很多的函数操作，这里先不抠细节进行详细讲解，后面会花点时间，挨个对各个部分进行详细的代码解读。然后在来对本篇文章不正确的地方进行修改。forward_train()的代码如下：

# 在这里实现层之间的连接关系，其实就是所谓的前向传播（训练过程的前向传播计算 ）
    # 实现父类的抽象方法 forward_train() ，该方法在父类的forward()中被调用执行 。
    def forward_train(self,
                      img,
                      img_meta,
                      gt_bboxes,
                      gt_labels,
                      gt_bboxes_ignore=None,
                      gt_masks=None,
                      proposals=None):
                      
        #提取特征，包含了backbone + neck 两个部分 , 计算了前向的backbone传播和FPN
        x = self.extract_feat(img)               # 执行extract_feat() 的 forward() 
        
        # 从RPN开始有loss了
        #开始计算loss,  include rpn_loss 、  bbox_loss  、mask_loss
        losses = dict()
        
        #rpn输出了一堆候选框
        if self.with_rpn:
            rpn_outs = self.rpn_head(x)                         # x 为提取的特征，将特征输入到rpn_head()，进行处理，输出bbox
            
            # tuple可以直接作加法，相当于元组合并
            rpn_loss_inputs = rpn_outs + (gt_bboxes, img_meta,  #计算rpn_loss时的输入
                                          self.train_cfg.rpn)
            rpn_losses = self.rpn_head.loss(                    #rpn_head.loss() 计算loss 
                *rpn_loss_inputs, gt_bboxes_ignore=gt_bboxes_ignore)
            losses.update(rpn_losses)                           # 字典的合并方法

            proposal_cfg = self.train_cfg.get('rpn_proposal',   # proposal_cfg is a  dict.
                                              self.test_cfg.rpn)
                                              
            proposal_inputs = rpn_outs + (img_meta, proposal_cfg) #将RPN输出的box和相关参数信息输入proposal
            proposal_list = self.rpn_head.get_bboxes(*proposal_inputs) #获得回归候选框
        else:
            # 直接指定proposals
            proposal_list = proposals  

#上一步rpn输出了一堆候选框，但是在将这些候选框拿去训练之前还需要分为正负样本。assigners就是完成这个工作的

        for i in range(self.num_stages):    # num_stages = 3 。 cascade rcnn  1 stage + 3 stage，三次循环
            self.current_stage = i                     # 3 stage rcnn for detect
            rcnn_train_cfg = self.train_cfg.rcnn[i]    # 不同stage ，rcnn的参数不一样
            lw = self.train_cfg.stage_loss_weights[i]  # stage_loss_weights=[1, 0.5, 0.25])  


            # assign gts and sample proposals  分正负样本，采样候选框  assign()  and  sample() 
            sampling_results = []                      
            if self.with_bbox or self.with_mask:       # if include bbox or mask  -> true
                bbox_assigner = build_assigner(rcnn_train_cfg.assigner)  # build assigner -> MaxIoUAssigner
                bbox_sampler = build_sampler(                            # build_sampler  -> RandomSampler
                    rcnn_train_cfg.sampler, context=self)
                    
                num_imgs = img.size(0)                 # img.size(0)  估摸着是图片的数量吧 
                if gt_bboxes_ignore is None:
                    gt_bboxes_ignore = [None for _ in range(num_imgs)]  # 生成 num_imgs 个none值

            # start assign  and  sample   (file in  max_iou_assigner.py and random_sampler.py)
                for j in range(num_imgs):
                    assign_result = bbox_assigner.assign(               #bbox_assigner.assign()
                        proposal_list[j], gt_bboxes[j], gt_bboxes_ignore[j],
                        gt_labels[j])
                    #Sample positive and negative bboxes.
                    sampling_result = bbox_sampler.sample(              #bbox_sampler.sample()  
                        assign_result,
                        proposal_list[j],
                        gt_bboxes[j],
                        gt_labels[j],
                        feats=[lvl_feat[j][None] for lvl_feat in x])
                    sampling_results.append(sampling_result) #sample results ( list of proposals bbox )

            # ROI_pooling 过程
            # bbox head forward and loss     
            bbox_roi_extractor = self.bbox_roi_extractor[i]  # i stage  bbox_roi_extractor
            bbox_head = self.bbox_head[i]

            rois = bbox2roi([res.bboxes for res in sampling_results]) 
            # deal with proposals bbox to roi        *** bbox2roi() how to work ?***
            
            
            bbox_feats = bbox_roi_extractor(x[:bbox_roi_extractor.num_inputs],  # x extract_feat 提取的特征
                                            rois)
            if self.with_shared_head:                         #false
                bbox_feats = self.shared_head(bbox_feats)
                
            cls_score, bbox_pred = bbox_head(bbox_feats)      #bbox_head()处理，分类得分score and 框预测pred

            bbox_targets = bbox_head.get_target(sampling_results, gt_bboxes,
                                                gt_labels, rcnn_train_cfg) #获得 gt 框？？
                                                
            loss_bbox = bbox_head.loss(cls_score, bbox_pred, *bbox_targets) #计算 bbox_loss
            for name, value in loss_bbox.items():
                losses['s{}.{}'.format(i, name)] = (
                    value * lw if 'loss' in name else value)   #lw(loss_weight)=[1, 0.5, 0.25]

#同样mask部分和bbox一样，只是参数不一样，同样也要，ROI_pooling and head  --> mask_pred  (also have mask_loss)
            # mask head forward and loss   
            if self.with_mask:
                if not self.share_roi_extractor:               # share_roi_extractor -> None ->  = True
                    mask_roi_extractor = self.mask_roi_extractor[i]
                    pos_rois = bbox2roi(                       # bbox2roi(res.pos_bboxes)
                        [res.pos_bboxes for res in sampling_results])# sampling_results 中的 postive sample ?
                        
                    mask_feats = mask_roi_extractor(
                        x[:mask_roi_extractor.num_inputs], pos_rois)
                    if self.with_shared_head:
                        mask_feats = self.shared_head(mask_feats)
                else:
                    # reuse positive bbox feats
                    pos_inds = []
                    device = bbox_feats.device            # ????
                    for res in sampling_results:
                        pos_inds.append(
                            torch.ones(                   # torch.ones() 返回一个全为1 的张量
                                res.pos_bboxes.shape[0],  # pos_bboxes.shape[0]  定义了输出形状
                                device=device,
                                dtype=torch.uint8))
                        pos_inds.append(
                            torch.zeros(                  # zeros
                                res.neg_bboxes.shape[0],  # neg_bboxes.shape[0]  定义了输出形状
                                device=device,
                                dtype=torch.uint8))
                    pos_inds = torch.cat(pos_inds)        # 连接操作
                    mask_feats = bbox_feats[pos_inds]     # 此时，bbox中的对象上的值为1，非对象区域(背景)为0
                                                          # 这样就生成了 mask 区域 ？？
                                                          
                mask_head = self.mask_head[i]
                mask_pred = mask_head(mask_feats)         # mask_head() 做预测  -> pred
                mask_targets = mask_head.get_target(sampling_results, gt_masks,
                                                    rcnn_train_cfg)
                pos_labels = torch.cat(
                    [res.pos_gt_labels for res in sampling_results])
                loss_mask = mask_head.loss(mask_pred, mask_targets, pos_labels)
                for name, value in loss_mask.items():
                    losses['s{}.{}'.format(i, name)] = (
                        value * lw if 'loss' in name else value)

            # refine bboxes
            if i < self.num_stages - 1: # num_stages = 3 , so when stage = 1 
                pos_is_gts = [res.pos_is_gt for res in sampling_results]
                roi_labels = bbox_targets[0]  # bbox_targets is a tuple
                with torch.no_grad():         # 不需要计算梯度，也不会进行反向传播
                    proposal_list = bbox_head.refine_bboxes(       # refine_bboxes()  function？？？（后续再对其详细的解读）
                        rois, roi_labels, bbox_pred, pos_is_gts, img_meta)
        # for 循环结束
        return losses                # forward() end

后面还有三个函数，这里先不对其讲解，后面看到这一块的内容时，博主再来对其细化。本篇文章的内容是博主刚刚阅读mmdetection代码后，按照自己的理解做的笔记，如有错误的地方，还请指出，相互学习，共同进步。

mmdetection系列文章：

mmdetection源码笔记（一）：train.py解读
mmdetection源码笔记（二）：创建网络模型之registry.py和builder.py解读（上）
mmdetection源码笔记（二）：cascade_rcnn.py搭建模型过程中各个module的forward()的代码解读（下）（待完成）
mmdetection源码笔记（三）：创建数据集模型之datasets/coco.py的解读（上）
mmdetection源码笔记（三）：创建数据集模型之datasets/custom.py的解读（下）
mmdetection源码笔记（四）：训练模型之train_detector()的解读
mmdetection源码笔记（五）：测试之test.py的解读

深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
mmdetection3d系列--（1）安装步骤（无坑版） h i i l mmdetection3d 目标检测计算机视觉自动驾驶深度学习 pytorch
最近在看一些基于点云3d目标检测的文章，需要复现甚至修改一些算法，就找到了mmlab开源的mmdetection3d目标检测框架，方便后续学习。在安装的时候遇到一点坑，比如环境问题，安装完能跑demo但是不能跑训练测试问题等。在解决问题后还是完成了安装。在这里记录一下正确的安装流程，已备再次查阅，也给大家提供一点参考。首先建环境，最好是新建一个环境condacreate-ndetpython=3.
Ubuntu20.04LTS 安装 mmdetection 全记录
Ubuntu20.04LTS安装mmdetection全记录环境需求准备工作anaconda安装gcc/g++安装安装nvidia显卡驱动安装CUDA正式安装mmdetection创建一个conda虚拟环境安装PyTorch和Torchvision安装mmcvmmdetection安装后记环境需求Requirements：·Linux(Windowsisnotofficiallysupported
MMDet实例分割loss_rpn_bbox为nan但其它loss正常的解决 MWHLS python python pytorch 深度学习人工智能
文章首发见博客：https://mwhls.top/4901.html。无图/格式错误/后续更新请见首发页。更多更新请到mwhls.top查看欢迎留言提问或批评建议，私信不回。昨天还以为这个月无活可整，没想到第二天就来事了，下个月还好久，留到下月发也不大好(º﹃º)。问题描述使用MMDetection训练实例分割，训练可执行，测试可执行，但loss_rpn_bbox为nan，loss_bbox却有
使用 MMDetection 实现 Pascal VOC 数据集的目标检测项目练习（一）开端深蓝海拓 Pascal VOC图像集的练习项目目标检测人工智能计算机视觉 pytorch 深度学习
一、背景知识PascalVOCPascalVOC（PatternAnalysis,StaticalModelingandComputationalLearning和VisualObjectClasses）是一个知名的计算机视觉数据集，专注于目标检测、图像分割等任务。它包含20个不同物体类别的图像注释，如人、动物、交通工具等。PascalVOC挑战赛自2005年至2012年每年举办，其中VOC200
error: subprocess-exited-with-error【已解决】 AI浩疑难问题 chrome 前端
问题详述安装mmdetection的时候出现了如下错误：(mmdet)[root@localhostmmdetection]#Usingpip25.1.1from/root/mmdet/lib64/python3.9/site-packages/pip(python3.9)-bash:syntaxerrornearunexpectedtoken`('(mmdet)[root@localhostmm
vscode调试常用选项不要绝望总会慢慢变强视觉大作战 vscode
在vscode调试过程中，存在一个文件来控制调试的相关选项，位置为mmdetection/.vscode/launch.json{//UseIntelliSensetolearnaboutpossibleattributes.//Hovertoviewdescriptionsofexistingattributes.//Formoreinformation,visit:https://go.mic
mmdeploy 转换torch为onnx 选与握 #openmmlab mmdeploy
安装mmdeploy以前已经安装了相关的mmsegment、mmcv和mmdetection等库方式安装mmdeploy：pipinstallmmdeploy或者，也可以从源代码安装，注意分支版本：gitclonehttps://github.com/open-mmlab/mmdeploy.gitcdmmdeploypipinstall-e.应用torch转onnx使用MMDeploy中的工具to
装饰器在Python中的作用及在PyTorchMMDetection中的实战应用 _Itachi__ python python 开发语言
装饰器在Python中的作用1.装饰器是什么？为什么它很重要？装饰器（Decorator）是Python中的一种高级语法，用于在不修改原函数代码的情况下，动态增强函数的功能。它的核心思想是**"装饰"现有函数**，类似于给手机套壳——手机本身功能不变，但多了保护或附加功能。1.1装饰器的核心作用代码复用：避免重复写相同的逻辑（如日志、计时、权限检查）非侵入式扩展：不改动原函数代码就能添加功能提高可
【BUG】mmdetection ValueError: need at least one array to concatenate 何如千泷 BUG bug mmdetection
问题：使用mmdetection框架使用COCO格式训练自定义数据集时出现如下错误：ValueError:needatleastonearraytoconcatenate解决方法：修改mmdet/datasets/coco.py文件，将CocoDataset类中的METAINFO修改为自己数据集的类别信息，具体如下：#METAINFO={#'classes':#('person','bicycle
2024年Android最全Android ANR 实现机制详解_android anr demo，阿里面试官是p几 2301_82242326 程序员 android
最后想要了解更多关于大厂面试的同学可以点赞支持一下，除此之外，我也分享一些优质资源，包括：Android学习PDF+架构视频+源码笔记，高级架构技术进阶脑图、Android开发面试专题资料，高级进阶架构资料这几块的内容。非常适合近期有面试和想在技术道路上继续精进的朋友。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习
MMdetection-教程5：自定义运行设置闰土_RUNTU 目标检测 MMdetection pytorch 深度学习人工智能
目录自定义优化设置自定义pytorch支持的优化器自定义自主实现的优化器1.定义一个新的优化器2.添加优化器到注册表3.在配置文件中指定优化器自定义优化器构造函数（optimizerconstructor）其他设置自定义训练策略（trainingschedules）自定义工作流（workflow）自定义钩子（hooks）定义自主实现的钩子使用MMCV实现的钩子修改默认的runtime钩子自定义优化
2024年安卓最全Android识别模拟器，判断是模拟器还是真机，安卓面试题高级 2401_84544854 程序员 android
最后这里我希望可以帮助到大家提升进阶。内容包含：Android学习PDF+架构视频+面试文档+源码笔记，高级架构技术进阶脑图、Android开发面试专题资料，高级进阶架构资料这几块的内容。非常适合近期有面试和想在技术道路上继续精进的朋友。喜欢本文的话，不妨给我点个小赞、评论区留言或者转发支持一下呗~网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正
MMDetection3D的安装问题，报错缺失libtorch_cuda_cu.so文件 V10LET_Yan BEVformer python ubuntu 计算机视觉目标检测机器学习神经网络深度学习
前言这个系列是记录我个人在学习过程中，遇到的一些问题，并记录我成功的方法，真实有效MMDetecion3D本身的安装文档非常不利好于新人，所以在此记录了我遇到的坑与解决办法使用平台i7-12700k4070tiubuntu20.04conda虚拟环境中，python=3.8遇到的问题根据官方文档操作，前面全部安装成功，包括MMDetction3D也显示安装成功，但是仍然在运行他给出的demo：py
深度学习项目十一：mmdetection训练自己的数据集小啊磊_Vv 深度学习和视觉项目实战目标跟踪人工智能计算机视觉 python 深度学习
mmdetection训练自己的数据集这里写目录标题mmdetection训练自己的数据集一：环境搭建二：数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式yolo转coco数据集格式的代码三：训练dataset数据文件配置configs1.在configs/faster_rcnn/faster-rcnn_r101_fpn_1x_coco.py
MMDetection实用工具详解（上）：日志分析、结果分析、混淆矩阵 MickeyCV 目标检测 python 深度学习 linux 目标检测
实用工具目录一、日志分析使用方法实际案例二、结果分析pkl结果文件生成使用方法实际案例三、混淆矩阵使用方法实际案例遇到的UserWarning解决方案MMDetection官方除了训练和测试脚本，他们还在mmdetection/tools/目录下提供了许多有用的工具。本帖先为大家重点介绍其中三个简单而实用的工具：日志分析、结果分析、混淆矩阵。一、日志分析tools/analysis_tools/a
征程 6 工具链 BEVPoolV2 算子使用教程 1 - BEVPoolV2 算子详解算法自动驾驶
1.引言当前，地平线征程6工具链已经全面支持了BEVPoolingV2算子，并与mmdetection3d的实现完成了精准对齐。然而，需要注意的是，此算子因其内在的复杂性以及相关使用示例的稀缺，致使部分用户在实际运用过程中遭遇了与预期不符的诸多问题。在这样的背景下，本文首先会对BEVPoolingV2的实现进行全方位、细致入微的剖析讲解，，让复杂的原理变得清晰易懂。随后，还会通过代表性的示例，来进
记一次pytorch训练loss异常的问题 lyyiangang pytorch 人工智能 python
记一次pytorch训练loss异常的问题问题描述使用mmdetection框架训练时，某项loss出现异常大的值，比如1781232349724294.000。这个问题只在多卡训练时才会出现。解决方法在确认target和predction没有问题后，发现是在dataset中的数据处理出现了问题。在dataset中的__getitem__函数中，对数据进行了处理，但是在处理时，将数据转换为了num
基于Kitti数据集实现MMDetection3D点云物体检测训练 Xian-HHappy 技术知识点 kitti三维点云无人驾驶 MMDetection3D 人工智能计算机视觉目标检测
DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。需要更多数据资源和技术解决方案，知识星球：“DataBall-X数据球(free)”贵在坚持！-----------------------------------------------------------------------------------------------MMDetection3D环境安
Flink 源码笔记03—StreamGraph到JobGraph 董嘻嘻 Flink源码笔记 flink java big data
文章目录简介入口函数traverseStreamGraphAndGenerateHashesgenerateDeterministicHashgenerateUserSpecifiedHashsetChainingisChainable简介JobGraph可以认为是StreamGraph的优化图，它将一些符合特定条件的operators合并成一个operatorchain，以减少数据在节点之间序列
利用MMDetection进行模型微调和权重初始化 MickeyCV 目标检测深度学习目标检测计算机视觉 python
目录模型微调修改第一处：更少的训练回合Epoch修改第二处：更小的学习率LearningRate修改第三处：使用预训练模型权重初始化实际使用案例init_cfg的具体使用规则初始化器配置汇总本文基于MMDetection官方文档，对模型微调和权重初始化进行第三方讲解。模型微调在COCO数据集上预训练的检测器可以作为其他数据集优质的预训练模型。微调超参数与默认的训练策略不同。它通常需要更小的学习率和
RocketMQ特性--事物消息【源码笔记】瓜农老梁
目录一、问题思考二、事务消息客户端发送流程1.事务发送与普通启动差异2.事务消息发送调用链3.事务消息发送分析4.事务消息发送结果分析5.结束事务分析三、事务消息服务端存储流程1.事务消息存储调用链2.事务半消息存储代码分析（一）3.事务半消息存储代码分析（二）四、事务消息服务端响应结束事务请求1.处理未知类型请求2.处理事务提交请求3.处理事务回滚请求五、事务消息服务端状态回查1.事务回查线程类
PAG动效框架源码笔记（一）概览庞海礁的个人空间笔记 ffmpeg 人工智能
转载请注明出处：庞海礁的个人空间–https://github.com/panghaijiao前言PAG特效框架是腾讯开源的一套完整的动效工作流解决方案，相较于传统特效渲染框架，其支持更丰富的组合样式，网上已有详细介绍，在此不再赘述PAG框架是如何实现特效渲染？本文结合预合成视频序列帧特效，通过分析其源码来展示其完整的渲染流程。开始之前，先问大家一个问题：渲染一个视频类型的PAG特效文件，一般需要
MMDetection3D v1.4.0安装教程 Ly.Leo 激光雷达神经网络点云 3d 激光雷达目标检测
安装MMDetection3Dv1.4.01.系统环境2.安装2.1基本环境安装2.2调整具体版本2.3验证2.3安装MinkowskiEngine和TorchSparse3.最终环境配置5.附加库根据v1.4.0版本官方手册测试后的安装配置，亲测可行。1.系统环境项目版本日期Ubuntu18.04.06LTS-显卡RTX2070-显卡驱动525.105.17-2.安装MMDetection3D的
Spring源码笔记之SpringIOC--（3）什么是BeanFactory？冷雨夜中漫步 spring全家桶 spring 笔记 java
什么是BeanFactory？BeanFactory是SpringIOC的最顶层接口，涵盖了IOC容器最基本的操作。ListableBeanFactory、ConfigurableBeanFactory提供了IOC容器获取所有Bean、配置Bean的额外能力。所有BeanFactory的实现类持有所有Bean的定义BeanDefinition，用一个唯一的字符串（即Bean的名字）区分。BeanF
MIT-BEVFusion系列五--Nuscenes数据集详细介绍，有下载好的图片端木的AI探索屋 bevfusion 自动驾驶算法 python 人工智能目标检测
一、数据集部分mmdetection官方对Nuscenes的中文解释地址：https://mmdetection3d.readthedocs.io/zh_CN/latest/advanced_guides/datasets/nuscenes.htmlhttps://www.nuscenes.org/nuscenes#data-format1.1数据集概述 nuScenes数据集(pronou
qt.qpa.plugin: Could not load the Qt platform plugin “xcb“ in zisuina_2 pytorch 深度学习 qt python
在运行mmdetection的时候发现qt5里面缺了啥qt.qpa.plugin:CouldnotloadtheQtplatformplugin“xcb”in“…”卸载了好多Qt5重新安装，都没有用尝试1：sudogedit~/.bashrc最后一行加上exportQT_DEBUG_PLUGINS=1对于我来说，没有效果尝试2：卸载qt5,重新安装，没啥用解决方案在虚拟环境中重新装opencv，对
【深度学习】：滴滴出行-交通场景目标检测 X.AI666 深度学习目标跟踪人工智能计算机视觉
清华大学驭风计划课程链接学堂在线-精品在线课程学习平台(xuetangx.com)代码和报告均为本人自己实现（实验满分），只展示主要任务实验结果，如果需要详细的实验报告或者代码可以私聊博主，接实验技术指导1对1有任何疑问或者问题，也欢迎私信博主，大家可以相互讨论交流哟~~案例5：滴滴出行-交通场景目标检测相关知识点：目标检测、开源框架的配置和使用（mmdetection,mmcv）1任务和数据简介
安装使用MMDeploy（Python版） *Major* 人工智能 python
安装使用MMDeploy（Python版）一安装MMDeploypythonmmdeploy-main/tools/deploy.pymmdeploy-main/configs/mmdet/detection/detection_tensorrt_dynamic-320x320-1344x1344.pymmdetection/configs/faster_rcnn/faster-rcnn_r50_
阅读eventbus源码笔记 lfg枫林
阅读eventbus源码笔记一.eventbus的register注册主要做了两件事情1.解析被@subscriber注解标记的方法并返回一个带有改方法信息的集合List这个是如何实现的呢?通过register(Objectobject)方法传入的当前界面的实例获取Class类型的对象,如果有依赖eventbus的apt则用apt解析@subscriber注解标记的方法,如果没有的话则用反射解析.
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h