cuihaoren01

mmDetection源码分析（2）：训练与配置文件

训练函数调用

训练脚本

python tools/train.py configs/faster_rcnn_r50_fpn_1x.py

训练可选项：

–work_dir：模型checkpoint以及训练log文件的输出目录，若在脚本中不设置，则为config/*.py中work_dir中的路径。
–resume_from：指定在某个checkpoint的基础上继续训练，若在脚本中不设置，则为config/*.py中resume_from中的值，默认为None。
–validate：指是否在训练中建立checkpoint的时候对该checkpoint进行评估
–gpus: 指使用GPU的数量，默认值为1

build_detector

build_dataset

train_detector

train_detector三个输入参数：

model：build_detector返回的模型
train_dataset：build_dataset返回的dataset
cfg：模型的配置文件
distributed：默认为False
validate：默认为False
logger：默认为None，若为None则会重新创建

配置文件详解

model

type：model类型，需要在/mmdet/models/detectors/__init__.py中定义
pretrained：预训练的模型
backbone: 骨架参数字典 types需要在/mmdet/models/backbones/__init__.py中定义
neck:neck的类型，需要在/mmdet/models/necks/__init__.py中定义
rpn_head: RPN的类型需要在/mmdet/models/anchor_heads/__init__.py中定义
bbox_roi_extractor: 目前只有SingleRoIExtractor这一种类型，需在/mmdet/models/roi_extractors/__init__.py中定义
bbox_head: head的类型需要在/mmdet/models/bbox_heads/__init__.py中定义

train_cfg

训练超参数的设置。需要设置一下参数字典rpn，rcnn。
其中assigner和sampler的类型分别要在/mmdet/core/box/assigners/__init__.py和/mmdet/core/box/samplers/__init__.py中进行配置。

test_cfg

测试阶段的超参数的配置

需要设置rpn、rcnn的参数字典，要配置如nms的阈值与置信度的阈值。

data

dataset_type：数据集类型，需要在/mmdet/datasets/__init__.py中设置数据集类型。
data_root：数据集根目录

参数字典data配置，配置train、val、test数据集的参数。

optimizer

优化器的选择。

通过设置参数，构造优化器。

lr_config

学习率优化策略参数设置。

checkpoint_config

设置多少epoch存储一次checkpoint

log_config

输出log文件的配置
多少个batch输出一次信息
log文件的风格

其他

total_epoches: 最大epoch数
log_level:
work_dir：log文件和模型文件存储路径
load_from：训练模型的路径
resume_from：恢复训练模型的路径

以下内容从mmdetection的configs中的各项参数具体解释转载过来。

# model settings
model = dict(
	type='FasterRCNN',                         # model类型
    pretrained='modelzoo://resnet50',          # 预训练模型：imagenet-resnet50
    backbone=dict(
        type='ResNet',                         # backbone类型
        depth=50,                              # 网络层数
        num_stages=4,                          # resnet的stage数量
        out_indices=(0, 1, 2, 3),              # 输出的stage的序号
        frozen_stages=1,                       # 冻结的stage数量，即该stage不更新参数，-1表示所有的stage都更新参数
        style='pytorch'),                      # 网络风格：如果设置pytorch，则stride为2的层是conv3x3的卷积层；如果设置caffe，则stride为2的层是第一个conv1x1的卷积层
    neck=dict(
        type='FPN',                            # neck类型
        in_channels=[256, 512, 1024, 2048],    # 输入的各个stage的通道数
        out_channels=256,                      # 输出的特征层的通道数
        num_outs=5),                           # 输出的特征层的数量
    rpn_head=dict(
        type='RPNHead',                        # RPN网络类型
        in_channels=256,                       # RPN网络的输入通道数
        feat_channels=256,                     # 特征层的通道数
        anchor_scales=[8],                     # 生成的anchor的baselen，baselen = sqrt(w*h)，w和h为anchor的宽和高
        anchor_ratios=[0.5, 1.0, 2.0],         # anchor的宽高比
        anchor_strides=[4, 8, 16, 32, 64],     # 在每个特征层上的anchor的步长（对应于原图）
        target_means=[.0, .0, .0, .0],         # 均值
        target_stds=[1.0, 1.0, 1.0, 1.0],      # 方差
        use_sigmoid_cls=True),                 # 是否使用sigmoid来进行分类，如果False则使用softmax来分类
    bbox_roi_extractor=dict(
        type='SingleRoIExtractor',                                   # RoIExtractor类型
        roi_layer=dict(type='RoIAlign', out_size=7, sample_num=2),   # ROI具体参数：ROI类型为ROIalign，输出尺寸为7，sample数为2
        out_channels=256,                                            # 输出通道数
        featmap_strides=[4, 8, 16, 32]),                             # 特征图的步长
    bbox_head=dict(
        type='SharedFCBBoxHead',                     # 全连接层类型
        num_fcs=2,                                   # 全连接层数量
        in_channels=256,                             # 输入通道数
        fc_out_channels=1024,                        # 输出通道数
        roi_feat_size=7,                             # ROI特征层尺寸
        num_classes=81,                              # 分类器的类别数量+1，+1是因为多了一个背景的类别
        target_means=[0., 0., 0., 0.],               # 均值
        target_stds=[0.1, 0.1, 0.2, 0.2],            # 方差
        reg_class_agnostic=False))                   # 是否采用class_agnostic的方式来预测，class_agnostic表示输出bbox时只考虑其是否为前景，后续分类的时候再根据该bbox在网络中的类别得分来分类，也就是说一个框可以对应多个类别
# model training and testing settings
train_cfg = dict(
    rpn=dict(
        assigner=dict(
            type='MaxIoUAssigner',            # RPN网络的正负样本划分
            pos_iou_thr=0.7,                  # 正样本的iou阈值
            neg_iou_thr=0.3,                  # 负样本的iou阈值
            min_pos_iou=0.3,                  # 正样本的iou最小值。如果assign给ground truth的anchors中最大的IOU低于0.3，则忽略所有的anchors，否则保留最大IOU的anchor
            ignore_iof_thr=-1),               # 忽略bbox的阈值，当ground truth中包含需要忽略的bbox时使用，-1表示不忽略
        sampler=dict(
            type='RandomSampler',             # 正负样本提取器类型
            num=256,                          # 需提取的正负样本数量
            pos_fraction=0.5,                 # 正样本比例
            neg_pos_ub=-1,                    # 最大负样本比例，大于该比例的负样本忽略，-1表示不忽略
            add_gt_as_proposals=False),       # 把ground truth加入proposal作为正样本
        allowed_border=0,                     # 允许在bbox周围外扩一定的像素
        pos_weight=-1,                        # 正样本权重，-1表示不改变原始的权重
        smoothl1_beta=1 / 9.0,                # 平滑L1系数
        debug=False),                         # debug模式
    rcnn=dict(
        assigner=dict(
            type='MaxIoUAssigner',            # RCNN网络正负样本划分
            pos_iou_thr=0.5,                  # 正样本的iou阈值
            neg_iou_thr=0.5,                  # 负样本的iou阈值
            min_pos_iou=0.5,                  # 正样本的iou最小值。如果assign给ground truth的anchors中最大的IOU低于0.3，则忽略所有的anchors，否则保留最大IOU的anchor
            ignore_iof_thr=-1),               # 忽略bbox的阈值，当ground truth中包含需要忽略的bbox时使用，-1表示不忽略
        sampler=dict(
            type='RandomSampler',             # 正负样本提取器类型
            num=512,                          # 需提取的正负样本数量
            pos_fraction=0.25,                # 正样本比例
            neg_pos_ub=-1,                    # 最大负样本比例，大于该比例的负样本忽略，-1表示不忽略
            add_gt_as_proposals=True),        # 把ground truth加入proposal作为正样本
        pos_weight=-1,                        # 正样本权重，-1表示不改变原始的权重
        debug=False))                         # debug模式
test_cfg = dict(
    rpn=dict(                                 # 推断时的RPN参数
        nms_across_levels=False,              # 在所有的fpn层内做nms
        nms_pre=2000,                         # 在nms之前保留的的得分最高的proposal数量
        nms_post=2000,                        # 在nms之后保留的的得分最高的proposal数量
        max_num=2000,                         # 在后处理完成之后保留的proposal数量
        nms_thr=0.7,                          # nms阈值
        min_bbox_size=0),                     # 最小bbox尺寸
    rcnn=dict(
        score_thr=0.05, nms=dict(type='nms', iou_thr=0.5), max_per_img=100)   # max_per_img表示最终输出的det bbox数量
    # soft-nms is also supported for rcnn testing
    # e.g., nms=dict(type='soft_nms', iou_thr=0.5, min_score=0.05)            # soft_nms参数
)
# dataset settings
dataset_type = 'CocoDataset'                # 数据集类型
data_root = 'data/coco/'                    # 数据集根目录
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)   # 输入图像初始化，减去均值mean并处以方差std，to_rgb表示将bgr转为rgb
data = dict(
    imgs_per_gpu=2,                # 每个gpu计算的图像数量
    workers_per_gpu=2,             # 每个gpu分配的线程数
    train=dict(
        type=dataset_type,                                                 # 数据集类型
        ann_file=data_root + 'annotations/instances_train2017.json',       # 数据集annotation路径
        img_prefix=data_root + 'train2017/',                               # 数据集的图片路径
        img_scale=(1333, 800),                                             # 输入图像尺寸，最大边1333，最小边800
        img_norm_cfg=img_norm_cfg,                                         # 图像初始化参数
        size_divisor=32,                                                   # 对图像进行resize时的最小单位，32表示所有的图像都会被resize成32的倍数
        flip_ratio=0.5,                                                    # 图像的随机左右翻转的概率
        with_mask=False,                                                   # 训练时附带mask
        with_crowd=True,                                                   # 训练时附带difficult的样本
        with_label=True),                                                  # 训练时附带label
    val=dict(
        type=dataset_type,                                                 # 同上
        ann_file=data_root + 'annotations/instances_val2017.json',         # 同上
        img_prefix=data_root + 'val2017/',                                 # 同上
        img_scale=(1333, 800),                                             # 同上
        img_norm_cfg=img_norm_cfg,                                         # 同上
        size_divisor=32,                                                   # 同上
        flip_ratio=0,                                                      # 同上
        with_mask=False,                                                   # 同上
        with_crowd=True,                                                   # 同上
        with_label=True),                                                  # 同上
    test=dict(
        type=dataset_type,                                                 # 同上
        ann_file=data_root + 'annotations/instances_val2017.json',         # 同上
        img_prefix=data_root + 'val2017/',                                 # 同上
        img_scale=(1333, 800),                                             # 同上
        img_norm_cfg=img_norm_cfg,                                         # 同上
        size_divisor=32,                                                   # 同上
        flip_ratio=0,                                                      # 同上
        with_mask=False,                                                   # 同上
        with_label=False,                                                  # 同上
        test_mode=True))                                                   # 同上
# optimizer
optimizer = dict(type='SGD', lr=0.02, momentum=0.9, weight_decay=0.0001)   # 优化参数，lr为学习率，momentum为动量因子，weight_decay为权重衰减因子
optimizer_config = dict(grad_clip=dict(max_norm=35, norm_type=2))          # 梯度均衡参数
# learning policy
lr_config = dict(
    policy='step',                        # 优化策略
    warmup='linear',                      # 初始的学习率增加的策略，linear为线性增加
    warmup_iters=500,                     # 在初始的500次迭代中学习率逐渐增加
    warmup_ratio=1.0 / 3,                 # 起始的学习率
    step=[8, 11])                         # 在第8和11个epoch时降低学习率
checkpoint_config = dict(interval=1)      # 每1个epoch存储一次模型
# yapf:disable
log_config = dict(
    interval=50,                          # 每50个batch输出一次信息
    hooks=[
        dict(type='TextLoggerHook'),      # 控制台输出信息的风格
        # dict(type='TensorboardLoggerHook')
    ])
# yapf:enable
# runtime settings
total_epochs = 12                               # 最大epoch数
dist_params = dict(backend='nccl')              # 分布式参数
log_level = 'INFO'                              # 输出信息的完整度级别
work_dir = './work_dirs/faster_rcnn_r50_fpn_1x' # log文件和模型文件存储路径
load_from = None                                # 加载模型的路径，None表示从预训练模型加载
resume_from = None                              # 恢复训练模型的路径
workflow = [('train', 1)]                       # 当前工作区名称

你可能感兴趣的:(mmdetection)

传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
mot数据集_MOT数据集转化成VOC格式脚本(mot2voc) 飞啦不休 mot数据集
使用mmdetection检测框架进行相关的训练，由于MOT的数据集标注格式和检测常用的VOC以及COCO格式有很大的差距，因此用于检测任务的时候，需要将mot格式的数据集转化成VOC格式用于检测任务的训练，评估。HUST小菜鸡：将MOT17-Det数据集转成VOC格式zhuanlan.zhihu.com之前我写过一篇将MOT17转化成VOC格式的文章，但是该方法是一个分布的步骤，而且在实际操作过
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
mmdetection3d系列--（1）安装步骤（无坑版） h i i l mmdetection3d 目标检测计算机视觉自动驾驶深度学习 pytorch
最近在看一些基于点云3d目标检测的文章，需要复现甚至修改一些算法，就找到了mmlab开源的mmdetection3d目标检测框架，方便后续学习。在安装的时候遇到一点坑，比如环境问题，安装完能跑demo但是不能跑训练测试问题等。在解决问题后还是完成了安装。在这里记录一下正确的安装流程，已备再次查阅，也给大家提供一点参考。首先建环境，最好是新建一个环境condacreate-ndetpython=3.
Ubuntu20.04LTS 安装 mmdetection 全记录
Ubuntu20.04LTS安装mmdetection全记录环境需求准备工作anaconda安装gcc/g++安装安装nvidia显卡驱动安装CUDA正式安装mmdetection创建一个conda虚拟环境安装PyTorch和Torchvision安装mmcvmmdetection安装后记环境需求Requirements：·Linux(Windowsisnotofficiallysupported
MMDet实例分割loss_rpn_bbox为nan但其它loss正常的解决 MWHLS python python pytorch 深度学习人工智能
文章首发见博客：https://mwhls.top/4901.html。无图/格式错误/后续更新请见首发页。更多更新请到mwhls.top查看欢迎留言提问或批评建议，私信不回。昨天还以为这个月无活可整，没想到第二天就来事了，下个月还好久，留到下月发也不大好(º﹃º)。问题描述使用MMDetection训练实例分割，训练可执行，测试可执行，但loss_rpn_bbox为nan，loss_bbox却有
使用 MMDetection 实现 Pascal VOC 数据集的目标检测项目练习（一）开端深蓝海拓 Pascal VOC图像集的练习项目目标检测人工智能计算机视觉 pytorch 深度学习
一、背景知识PascalVOCPascalVOC（PatternAnalysis,StaticalModelingandComputationalLearning和VisualObjectClasses）是一个知名的计算机视觉数据集，专注于目标检测、图像分割等任务。它包含20个不同物体类别的图像注释，如人、动物、交通工具等。PascalVOC挑战赛自2005年至2012年每年举办，其中VOC200
error: subprocess-exited-with-error【已解决】 AI浩疑难问题 chrome 前端
问题详述安装mmdetection的时候出现了如下错误：(mmdet)[root@localhostmmdetection]#Usingpip25.1.1from/root/mmdet/lib64/python3.9/site-packages/pip(python3.9)-bash:syntaxerrornearunexpectedtoken`('(mmdet)[root@localhostmm
vscode调试常用选项不要绝望总会慢慢变强视觉大作战 vscode
在vscode调试过程中，存在一个文件来控制调试的相关选项，位置为mmdetection/.vscode/launch.json{//UseIntelliSensetolearnaboutpossibleattributes.//Hovertoviewdescriptionsofexistingattributes.//Formoreinformation,visit:https://go.mic
mmdeploy 转换torch为onnx 选与握 #openmmlab mmdeploy
安装mmdeploy以前已经安装了相关的mmsegment、mmcv和mmdetection等库方式安装mmdeploy：pipinstallmmdeploy或者，也可以从源代码安装，注意分支版本：gitclonehttps://github.com/open-mmlab/mmdeploy.gitcdmmdeploypipinstall-e.应用torch转onnx使用MMDeploy中的工具to
装饰器在Python中的作用及在PyTorchMMDetection中的实战应用 _Itachi__ python python 开发语言
装饰器在Python中的作用1.装饰器是什么？为什么它很重要？装饰器（Decorator）是Python中的一种高级语法，用于在不修改原函数代码的情况下，动态增强函数的功能。它的核心思想是**"装饰"现有函数**，类似于给手机套壳——手机本身功能不变，但多了保护或附加功能。1.1装饰器的核心作用代码复用：避免重复写相同的逻辑（如日志、计时、权限检查）非侵入式扩展：不改动原函数代码就能添加功能提高可
【BUG】mmdetection ValueError: need at least one array to concatenate 何如千泷 BUG bug mmdetection
问题：使用mmdetection框架使用COCO格式训练自定义数据集时出现如下错误：ValueError:needatleastonearraytoconcatenate解决方法：修改mmdet/datasets/coco.py文件，将CocoDataset类中的METAINFO修改为自己数据集的类别信息，具体如下：#METAINFO={#'classes':#('person','bicycle
MMdetection-教程5：自定义运行设置闰土_RUNTU 目标检测 MMdetection pytorch 深度学习人工智能
目录自定义优化设置自定义pytorch支持的优化器自定义自主实现的优化器1.定义一个新的优化器2.添加优化器到注册表3.在配置文件中指定优化器自定义优化器构造函数（optimizerconstructor）其他设置自定义训练策略（trainingschedules）自定义工作流（workflow）自定义钩子（hooks）定义自主实现的钩子使用MMCV实现的钩子修改默认的runtime钩子自定义优化
MMDetection3D的安装问题，报错缺失libtorch_cuda_cu.so文件 V10LET_Yan BEVformer python ubuntu 计算机视觉目标检测机器学习神经网络深度学习
前言这个系列是记录我个人在学习过程中，遇到的一些问题，并记录我成功的方法，真实有效MMDetecion3D本身的安装文档非常不利好于新人，所以在此记录了我遇到的坑与解决办法使用平台i7-12700k4070tiubuntu20.04conda虚拟环境中，python=3.8遇到的问题根据官方文档操作，前面全部安装成功，包括MMDetction3D也显示安装成功，但是仍然在运行他给出的demo：py
深度学习项目十一：mmdetection训练自己的数据集小啊磊_Vv 深度学习和视觉项目实战目标跟踪人工智能计算机视觉 python 深度学习
mmdetection训练自己的数据集这里写目录标题mmdetection训练自己的数据集一：环境搭建二：数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式yolo转coco数据集格式的代码三：训练dataset数据文件配置configs1.在configs/faster_rcnn/faster-rcnn_r101_fpn_1x_coco.py
MMDetection实用工具详解（上）：日志分析、结果分析、混淆矩阵 MickeyCV 目标检测 python 深度学习 linux 目标检测
实用工具目录一、日志分析使用方法实际案例二、结果分析pkl结果文件生成使用方法实际案例三、混淆矩阵使用方法实际案例遇到的UserWarning解决方案MMDetection官方除了训练和测试脚本，他们还在mmdetection/tools/目录下提供了许多有用的工具。本帖先为大家重点介绍其中三个简单而实用的工具：日志分析、结果分析、混淆矩阵。一、日志分析tools/analysis_tools/a
征程 6 工具链 BEVPoolV2 算子使用教程 1 - BEVPoolV2 算子详解算法自动驾驶
1.引言当前，地平线征程6工具链已经全面支持了BEVPoolingV2算子，并与mmdetection3d的实现完成了精准对齐。然而，需要注意的是，此算子因其内在的复杂性以及相关使用示例的稀缺，致使部分用户在实际运用过程中遭遇了与预期不符的诸多问题。在这样的背景下，本文首先会对BEVPoolingV2的实现进行全方位、细致入微的剖析讲解，，让复杂的原理变得清晰易懂。随后，还会通过代表性的示例，来进
记一次pytorch训练loss异常的问题 lyyiangang pytorch 人工智能 python
记一次pytorch训练loss异常的问题问题描述使用mmdetection框架训练时，某项loss出现异常大的值，比如1781232349724294.000。这个问题只在多卡训练时才会出现。解决方法在确认target和predction没有问题后，发现是在dataset中的数据处理出现了问题。在dataset中的__getitem__函数中，对数据进行了处理，但是在处理时，将数据转换为了num
基于Kitti数据集实现MMDetection3D点云物体检测训练 Xian-HHappy 技术知识点 kitti三维点云无人驾驶 MMDetection3D 人工智能计算机视觉目标检测
DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。需要更多数据资源和技术解决方案，知识星球：“DataBall-X数据球(free)”贵在坚持！-----------------------------------------------------------------------------------------------MMDetection3D环境安
利用MMDetection进行模型微调和权重初始化 MickeyCV 目标检测深度学习目标检测计算机视觉 python
目录模型微调修改第一处：更少的训练回合Epoch修改第二处：更小的学习率LearningRate修改第三处：使用预训练模型权重初始化实际使用案例init_cfg的具体使用规则初始化器配置汇总本文基于MMDetection官方文档，对模型微调和权重初始化进行第三方讲解。模型微调在COCO数据集上预训练的检测器可以作为其他数据集优质的预训练模型。微调超参数与默认的训练策略不同。它通常需要更小的学习率和
MMDetection3D v1.4.0安装教程 Ly.Leo 激光雷达神经网络点云 3d 激光雷达目标检测
安装MMDetection3Dv1.4.01.系统环境2.安装2.1基本环境安装2.2调整具体版本2.3验证2.3安装MinkowskiEngine和TorchSparse3.最终环境配置5.附加库根据v1.4.0版本官方手册测试后的安装配置，亲测可行。1.系统环境项目版本日期Ubuntu18.04.06LTS-显卡RTX2070-显卡驱动525.105.17-2.安装MMDetection3D的
MIT-BEVFusion系列五--Nuscenes数据集详细介绍，有下载好的图片端木的AI探索屋 bevfusion 自动驾驶算法 python 人工智能目标检测
一、数据集部分mmdetection官方对Nuscenes的中文解释地址：https://mmdetection3d.readthedocs.io/zh_CN/latest/advanced_guides/datasets/nuscenes.htmlhttps://www.nuscenes.org/nuscenes#data-format1.1数据集概述 nuScenes数据集(pronou
qt.qpa.plugin: Could not load the Qt platform plugin “xcb“ in zisuina_2 pytorch 深度学习 qt python
在运行mmdetection的时候发现qt5里面缺了啥qt.qpa.plugin:CouldnotloadtheQtplatformplugin“xcb”in“…”卸载了好多Qt5重新安装，都没有用尝试1：sudogedit~/.bashrc最后一行加上exportQT_DEBUG_PLUGINS=1对于我来说，没有效果尝试2：卸载qt5,重新安装，没啥用解决方案在虚拟环境中重新装opencv，对
【深度学习】：滴滴出行-交通场景目标检测 X.AI666 深度学习目标跟踪人工智能计算机视觉
清华大学驭风计划课程链接学堂在线-精品在线课程学习平台(xuetangx.com)代码和报告均为本人自己实现（实验满分），只展示主要任务实验结果，如果需要详细的实验报告或者代码可以私聊博主，接实验技术指导1对1有任何疑问或者问题，也欢迎私信博主，大家可以相互讨论交流哟~~案例5：滴滴出行-交通场景目标检测相关知识点：目标检测、开源框架的配置和使用（mmdetection,mmcv）1任务和数据简介
安装使用MMDeploy（Python版） *Major* 人工智能 python
安装使用MMDeploy（Python版）一安装MMDeploypythonmmdeploy-main/tools/deploy.pymmdeploy-main/configs/mmdet/detection/detection_tensorrt_dynamic-320x320-1344x1344.pymmdetection/configs/faster_rcnn/faster-rcnn_r50_
mmdetection模型转onnx和tensorrt实战 dream_home8407 python 深度学习人工智能
一,说明1.本次实战使用的是mmdetection算法框架中的Cascase-Rcnn训练的模型；2.模型转换时,运行环境中各种工具的版本要保持一致；3.TensorRT我一直装不上,我用的是镜像环境.参考链接:link二,使用Docker镜像1.0,镜像基础环境构建exportTAG=openmmlab/mmdeploy:ubuntu20.04-cuda11.8-mmdeploydockerpu
mmdetection使用自己的voc数据集训练模型实战 dream_home8407 人工智能深度学习 python
一.自己数据集整理将labelimg格式数据集进行整理1.1.更换图片后缀为jpgimportosimportshutilroot_path='/media/ai-developer/img'file=os.listdir(root_path)forimginfile:ifimg.endswith('jpeg')orimg.endswith('JPG')orimg.endswith('png'):
AI 实战训练营（Class 1）OpenMMLab 概述 Zhangdd1208 MMLab实战训练营人工智能深度学习计算机视觉
AI实战训练营（Class1）OpenMMLab概述OpenMMLab概述OpenMMLab各开源算法库详细介绍明星算法库:MMDetectionMMYOLOMMOCRMMDetection3DMMRotateMMSegmentationMMpretrainMMposeMMHuman3DMMAction2MMagicMMDeployPlaygroundOpenMMLab开源生态OpenMMLab概
mmocr 安装及快速运行 TYUT_xiaoming mmocr ocr
MMOCR是一个基于PyTorch和MMDetection的开源工具箱，支持众多OCR相关的模型，涵盖了文本检测、文本识别以及关键信息提取等多个主要方向。它还支持了大多数流行的学术数据集，并提供了许多实用工具帮助用户对数据集和模型进行多方面的探索和调试，助力优质模型的产出和落地。它具有以下特点：全流程，多模型：支持了全流程的OCR任务，包括文本检测、文本识别及关键信息提取的各种最新模型。模块化设计
mmdetection使用projects/gradio_demo 盛世芳华目标检测
我用google的colab搭建。#Checknvccversion!nvcc-V#CheckGCCversion!gcc--version#installdependencies:(usecu111becausecolabhasCUDA11.1)%pipinstall-Uopenmim!miminstall"mmengine>=0.7.0"!miminstall"mmcv>=2.0.0rc4"#
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他