故乡的云和星星

MMDetection网络结构讲解

前言
MMDetection2中大部分模型都是通过配置4个基础的组件来构造的，本篇博客主要是介绍MMDetection中的配置文件，主要内容是按照MMDetection文档进行中文翻译的，有兴趣的话建议去看原版的英文文档。

一、配置文件结构
在config/_base_文件夹下面总共有4个基础的组件，它们分别是：dataset、model、schedule、default_runtime。

许多的方法都可以被这些基础组件轻松的构造，我们将由_base_中的组件构成的配置称之为primitive。

为了方便于理解，我们推荐使用者去继承已有的方法，例如，如果你想要去基于Faster-RCNN做一些更改，你首先需要在你的配置文件中去继承Faster-RCNN的基础结构（加入_base_ = ../faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py这行代码就行），然后在配置文件中更改必要的组件。

如果你要构造一个和其他方法没有关系的全新的方法，那么你应该在configs文件夹下面创建一个xxx_rcnn的文件。

二、配置文件名称风格
我们是按照下面这种风格来命名配置文件的，我们也建议使用者也这样来命名你们自己的配置文件。

{model}_[model setting]_{backbone}_{neck}_[norm setting]_[misc]_[gpu x batch_per_gpu]_{schedule}_{dataset}
{xxx}是必选项，[yyy]是可选项

{model}:模型的类型，例如faster_rcnn、mask_rcnn, 等等.
[model setting]: 给模型一些指定设置, 例如without_semantic for htc、moment for reppoints, 等等.
{backbone}: backbone 的类型 r50 (ResNet-50), x101 (ResNeXt-101)。（相当于特征提取网络）
{neck}: neck 的类型选择，例如fpn, pafpn, nasfpn, c4.
[norm_setting]: 如果没有指定，那就默认为bn (Batch Normalization) , 还有其他可选的norm layer类型，比如 gn (Group Normalization)、syncbn (Synchronized Batch Normalization). gn-head/gn-neck 表示 GN 仅仅被用在head/neck模块上, gn-all 表示 GN 被用在整个模型上, 例如：backbone, neck, head这些模块。
[misc]: 一些比较杂的模型设置或者插件，例如 dconv, gcb, attention, albu, mstrain.
[gpu x batch_per_gpu]: GPU的个数以及每块GPU上的batch size大小，默认为8*2(8块GPU，每块GPU上2个batch size，相当于batch size为16)。
{schedule}: 训练的 schedule, 可选择的有1x, 2x, 20e等等. 1x 和 2x 分别表示 12 个epochs 和 24个epochs。 20e 被用在 cascade models中,它表示20个epochs. 对于1x/2x而言, 初始的学习率分别在第8/16个epeochs和第11/22个epochs以10的倍率递减。对于20e而言,初始的学习率在第16个epeochs和第19个epochs以10的倍率。
{dataset}: 数据集有 coco, cityscapes, voc_0712, wider_face这些选项。
三、一个Mask-RCNN的例子
为了帮助使用者对这个检测模型的配置和模块有一个基本的理解，我们对以ResNet50为backbone，FPN为neck的Mask-RCNN模型的配置文件进行了简单的注释。更多和模块与配置相关的信息请参照我们相应的API文档。

下面将官网提供的例子分成3个部分来讲：

1、model
model = dict(
type='MaskRCNN', # 检测器的名称
pretrained=
'torchvision://resnet50', # ImageNet的预训练模型
backbone=dict( # backbone的配置
type='ResNet', # backbone的类型, 请参照 https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/backbones/resnet.py#L288 查看更多的细节.
depth=50, # backbone网络的深度, 对于ResNet and ResNext的backbone而言，通常是使用50或者101的深度
num_stages=4, # backbone中stage的个数（应该是相当于ResNet网络中block的个数）.
out_indices=(0, 1, 2, 3), # backbone中每一个stage过程输出的feature的下标
frozen_stages=1, # 1 stage 的权重被冻结
norm_cfg=dict( # normalization layers的配置.
type='BN', # norm layer的类型, 通常是 BN or GN
requires_grad=True), # 是否训练BN中的gamma and beta参数
norm_eval=True, # 是否冻结BN中的统计信息（相当于模型eval的过程，不进行统计数据）
style='pytorch'), # backbone的类型, 'pytorch' means that stride 2 layers are in 3x3 conv, 'caffe' means stride 2 layers are in 1x1 convs.(感觉这句直接看英文还方便些)

neck=dict( #neck模块的配置
type='FPN', # 该detection的neck为FPN. 我们还提供了 'NASFPN', 'PAFPN'等neck类型. 具体请参照 https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/necks/fpn.py#L10 查看更多的细节。
in_channels=[256, 512, 1024, 2048], # 输入的channels,这个地方和backbone的output channels保持一直。
out_channels=256, # 特征金字塔(pyramid feature map)的每一层输出的channel数
num_outs=5), # output 输出的个数

rpn_head=dict( # RPN模块的配置
type='RPNHead', # RPN head 的类型为'RPNHead', 我们还支持 'GARPNHead'等等. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/dense_heads/rpn_head.py#L12.
in_channels=256, # 每一个输入的feature的input channels, 这个地方需要和neck模块的output channels保持一致。
feat_channels=256, # Feature channels of convolutional layers in the head（应该是指RPN模块头部的卷积操作，输出channel为256，它的输入为上面FPN得到的多尺度feature map）.
anchor_generator=dict( # 生成anchor的配置
type='AnchorGenerator', # 绝大多数都是用AnchorGenerator, SSD 检测器(单阶段的目标检测算法)使用的是`SSDAnchorGenerator`. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/anchor/anchor_generator.py#L10.
scales=[8], # anchor的生成个数, 特征图上每一个位置所生成的anchor个数为scale * base_sizes
ratios=[0.5, 1.0, 2.0], # anchor中height 和width的比率.
strides=[4, 8, 16, 32, 64]), # The strides of the anchor generator. 这个需要和FPN feature strides保持一致. 如果base_sizes没有设置的话，这个strides 将会被当作base_sizes.
bbox_coder=dict( # Config of box coder to encode and decode the boxes during training and testing
type='DeltaXYWHBBoxCoder', # Type of box coder. 'DeltaXYWHBBoxCoder' is applied for most of methods. Refer to https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/bbox/coder/delta_xywh_bbox_coder.py#L9 for more details.
target_means=[0.0, 0.0, 0.0, 0.0], # The target means used to encode and decode boxes
target_stds=[1.0, 1.0, 1.0, 1.0]), # The standard variance used to encode and decode boxes
loss_cls=dict( # 分类分支的损失函数配置
type='CrossEntropyLoss', # 分类分支的损失函数类型, 我们也提供FocalLoss等损失函数
use_sigmoid=True, # RPN 过程通常是一个二分类，所以它通常使用sigmoid函数。
loss_weight=1.0), # 分类损失分支所占的权重。
loss_bbox=dict( # box回归分支的损失函数配置.
type='L1Loss', # loss的类型, 我们还提供了许多IoU Losses and smooth L1-loss 等. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/losses/smooth_l1_loss.py#L56.
loss_weight=1.0)), # 回归分支损失所占的权重.

roi_head=dict( # RoIHead 封装了二阶段检测器的第二阶段的模块
type='StandardRoIHead', # RoI head的类型. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/roi_heads/standard_roi_head.py#L10.
bbox_roi_extractor=dict( # RoI feature extractor 用于 bbox regression.
type='SingleRoIExtractor', # RoI feature extractor的类型, 绝大多少方法都使用 SingleRoIExtractor. 具体实现细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/roi_heads/roi_extractors/single_level.py#L10.
roi_layer=dict( # RoI Layer的配置
type='RoIAlign', # RoI Layer的类型, 同时还支持DeformRoIPoolingPack 和 ModulatedDeformRoIPoolingPack这两种类型. 具体实现细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/ops/roi_align/roi_align.py#L79.
output_size=7, # feature maps的输出尺度，相当于输出7*7.
sampling_ratio=0), # Sampling ratio when extracting the RoI features. 0 means adaptive ratio.（这个参数我还不太明白orz）
out_channels=256, # 提取特征的输出channels数.
featmap_strides=[4, 8, 16, 32]), # Strides of multi-scale feature maps. It should be consistent to the architecture of the backbone.（这个地方还不太清楚）
bbox_head=dict( # RoIHead中的 bbox head的配置.
type='Shared2FCBBoxHead', # bbox head的类型, 具体细节请参照 https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/roi_heads/bbox_heads/convfc_bbox_head.py#L177.
in_channels=256, # bbox head的输入channels数. 这个地方需要和roi_extractor的out_channels保持一致。
fc_out_channels=1024, # FC layers的输出维度.
roi_feat_size=7, # RoI features的尺寸
num_classes=80, # 分类类别数
bbox_coder=dict( # Box coder used in the second stage.
type='DeltaXYWHBBoxCoder', # Type of box coder. 'DeltaXYWHBBoxCoder' is applied for most of methods.
target_means=[0.0, 0.0, 0.0, 0.0], # Means used to encode and decode box
target_stds=[0.1, 0.1, 0.2, 0.2]), # Standard variance for encoding and decoding. It is smaller since the boxes are more accurate. [0.1, 0.1, 0.2, 0.2] is a conventional setting.
reg_class_agnostic=False, # Whether the regression is class agnostic.
loss_cls=dict( # 分类分支的损失函数配置
type='CrossEntropyLoss', # 分类分支损失函数的类型, 我们还提供了FocalLoss 等.
use_sigmoid=False, # 是否使用sigmoid.
loss_weight=1.0), # 分类分支损失所占的权重.
loss_bbox=dict( # 回归分支损失函数配置.
type='L1Loss', # 损失函数类型, 我们还提供了许多IoU Losses和smooth L1-loss等.
loss_weight=1.0)), # 回归分支损失所占的权重.

mask_roi_extractor=dict( # RoI feature extractor 用于 mask regression.
type='SingleRoIExtractor', # RoI feature extractor的类型, 绝大多数方法都是使用SingleRoIExtractor.
roi_layer=dict( # RoI Layer 的配置，提取特征用于实例分割。
type='RoIAlign', # RoI Layer的类型,我们还提供了DeformRoIPoolingPack and ModulatedDeformRoIPoolingPack.
output_size=14, # feature maps的输出size.
sampling_ratio=0), # Sampling ratio when extracting the RoI features.（这个参数还没太弄明白）
out_channels=256, # extracted feature的输出channels.
featmap_strides=[4, 8, 16, 32]), # Strides of multi-scale feature maps.(这个参数没太弄明白)
mask_head=dict( # Mask 的预测模块
type='FCNMaskHead', # mask head的类型, 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/models/roi_heads/mask_heads/fcn_mask_head.py#L21.
num_convs=4, # mask head中卷积层的个数.
in_channels=256, # mask head输入的channels数, 应该和mask roi extractor的输出channel数保持一致。
conv_out_channels=256, # convolutional layer输出的channel数.
num_classes=80, # 分割任务的类别数
loss_mask=dict( # mask 分支的损失函数配置.
type='CrossEntropyLoss', # 用于分割的损失函数类型
use_mask=True, # Whether to only train the mask in the correct class（是否训练仅仅是正确类别的mask）.
loss_weight=1.0)))) # mask分支损失所占的权重.

train_cfg = dict( # 训练过程中rpn and rcnn和模块的超参数设置
rpn=dict( # 训练过程中rpn的超参数配置
assigner=dict( # assigner的配置（assigner是个什么东西？可以理解为一个超参配置的字典吧）
type='MaxIoUAssigner', # assigner的类型, MaxIoUAssigner被用在许多常见的detectors. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/bbox/assigners/max_iou_assigner.py#L10.
pos_iou_thr=0.7, # IoU >= threshold 0.7 将会被当作一个正样本
neg_iou_thr=0.3, # IoU < threshold 0.3 将会被当作一个负样本
min_pos_iou=0.3, # The minimal IoU threshold to take boxes as positive samples
match_low_quality=True, # Whether to match the boxes under low quality (see API doc for more details).
ignore_iof_thr=-1), # IoF threshold for ignoring bboxes
sampler=dict( # positive/negative sampler的配置
type='RandomSampler', # sampler的类型, 同时还提供有PseudoSampler和其他类型的samplers.具体实现细节请参照Refer to https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/bbox/samplers/random_sampler.py#L8.
num=256, # samples的个数
pos_fraction=0.5, # 正样本占总样本的比例。
neg_pos_ub=-1, # The upper bound of negative samples based on the number of positive samples.
add_gt_as_proposals=False), # Whether add GT as proposals after sampling.
allowed_border=-1, # The border allowed after padding for valid anchors.
pos_weight=-1, # The weight of positive samples during training.
debug=False), # 是否设置debug 模式
rpn_proposal=dict( # 在训练过程中生成proposals的配置
nms_across_levels=False, # Whether to do NMS for boxes across levels
nms_pre=2000, # 在NMS之前的box个数
nms_post=1000, # NMS处理后保留的box个数
max_num=1000, # NMS处理之后所使用的box个数
nms_thr=0.7, # NMS过程所使用的阈值
min_bbox_size=0), # 允许的最小的box尺寸

rcnn=dict( # roi heads的超参数配置
assigner=dict( # 第二阶段的assigner配置, 这个和上面rpn中用到的assigner有所不同
type='MaxIoUAssigner', # assigner的类型, MaxIoUAssigner被用于所有的roi_heads. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/bbox/assigners/max_iou_assigner.py#L10.
pos_iou_thr=0.5, # IoU >= threshold 0.5 被当作正样本
neg_iou_thr=0.5, # IoU >= threshold 0.5 被当作正样本
min_pos_iou=0.5, # 最小的IoU 阈值来判断 boxes 是否为正样本。
match_low_quality=False, # Whether to match the boxes under low quality (see API doc for more details).
ignore_iof_thr=-1), # IoF threshold for ignoring bboxes
sampler=dict(
type='RandomSampler', # sampler的类型, 还提供PseudoSampler和其他的samplers类型. 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/bbox/samplers/random_sampler.py#L8.
num=512, # 样例的个数
pos_fraction=0.25, # 正样例占总样例的比例。
neg_pos_ub=-1, # The upper bound of negative samples based on the number of positive samples.
add_gt_as_proposals=True
), #在sample过程之后，是否将ground trueth当作proposals.
mask_size=28, # mask的size大小
pos_weight=-1, # The weight of positive samples during training(不太明白).
debug=False)) # 是否设置debug mode

test_cfg = dict( #rpn and rcnn在测试过程的超参数配置
rpn=dict( #在测试过程rpn生成proposals的配置（相当于第一阶段）
nms_across_levels=False, # Whether to do NMS for boxes across levels
nms_pre=1000, # NMS之前的boxs个数
nms_post=1000, # NMS所保留的boxs个数
max_num=1000, # NMS处理之后最多被使用的boxs个数
nms_thr=0.7, # 在NMS处理过程中所使用的阈值
min_bbox_size=0), # 允许的最小的box尺寸
rcnn=dict( # roi heads的配置
score_thr=0.05, # 用来过滤boxes的阈值
nms=dict( # nms 在第二阶段的配置
type='nms', # nms的类型
iou_thr=0.5), # NMS的阈值
max_per_img=100, # Max number of detections of each image
mask_thr_binary=0.5)) # mask 预测的阈值
dataset_type = 'CocoDataset' # Dataset的类型, 将用于定义数据集
data_root = 'data/coco/' # 数据集的存放路径
img_norm_cfg = dict( # 对输入图片进行标准化处理的配置
mean=[123.675, 116.28, 103.53], # 用于预训练backbone模型的均值
std=[58.395, 57.12, 57.375], # 用于预训练backbone模型的标准差
to_rgb=True
) # The channel orders of image used to pre-training the pre-trained backbone models
2、datasets的配置
train_pipeline = [ # 训练的pipeline
dict(type='LoadImageFromFile'), # First pipeline用于从文件存放路径中导入图片
dict(
type='LoadAnnotations', # Second pipeline用于给图片导入对应的标签
with_bbox=True, # 是否使用bounding box标签数据, 如果用于检测任务，则为True
with_mask=True, # 是否使用instance mask标签数据, 如果用于实例分割任务，则为True
poly2mask=False), # 是否将polygon mask转化为instance mask, 设置为False将会加速和减少内存
dict(
type='Resize', # Augmentation pipeline resize图片和图片所对应的标签
img_scale=(1333, 800), # 图片的最大尺寸
keep_ratio=True
), # 是否保存宽高比例
dict(
type='RandomFlip', # Augmentation pipeline flip图片和图片所对应的标签
flip_ratio=0.5), # flip的比率
dict(
type='Normalize', # Augmentation pipeline 对输入的图片进行标准化
mean=[123.675, 116.28, 103.53], # 均值
std=[58.395, 57.12, 57.375], # 标准差
to_rgb=True),
dict(
type='Pad', # Padding 的配置
size_divisor=32), # 填充图像的数目应该可以被整除
dict(type='DefaultFormatBundle'), # Default format bundle to gather data in the pipeline
dict(
type='Collect', # 决定数据中哪些key可以被传入pipeline中
keys=['img', 'gt_bboxes', 'gt_labels', 'gt_masks'])
]
test_pipeline = [
dict(type='LoadImageFromFile'), # First pipeline 从文件路径中导入图片
dict(
type='MultiScaleFlipAug', # An encapsulation that encapsulates the testing augmentations
img_scale=(1333, 800), # 用于Resize pipeline的最大图片尺寸
flip=False, # 是否在test过程flip images
transforms=[
dict(type='Resize', # Use resize augmentation
keep_ratio=True), # 是否保持宽高的比例.
dict(type='RandomFlip'), # 由于flip=False这个RandomFlio将不会被使用。
dict(
type='Normalize', # 标准化操作的配置, 从img_norm_cfg文件中取相应的值
mean=[123.675, 116.28, 103.53],
std=[58.395, 57.12, 57.375],
to_rgb=True),
dict(
type='Pad', # padding图片使其能够被12整除.
size_divisor=32),
dict(
type='ImageToTensor', # 将图片转化为tensor
keys=['img']),
dict(
type='Collect', # Collect pipeline 收集在test过程中必要的key.
keys=['img'])
])
]

data = dict(
# 学习率lr和总的batch size数目成正比，例如：8卡GPU samples_per_gpu = 2的情况（相当于总的batch size = 8*2）,学习率lr = 0.02
# 如果我是单卡GPU samples_per_gpu = 4的情况，学习率lr应该设置为:0.02*(4/16) = 0.005
samples_per_gpu=2, # 每个GPU上的batch size
workers_per_gpu=2, # 每个GPU上的workers数目
train=dict( # 训练数据集的配置
type='CocoDataset', # 数据集的类型, 具体信息请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/datasets/coco.py#L19.
ann_file='data/coco/annotations/instances_train2017.json', # 标注文件的路径
img_prefix='data/coco/train2017/', # 图片文件的前缀
pipeline=[ # pipeline, this is passed by the train_pipeline created before.（这个地方应该可以直接写成pipeline = train_pipeline,因为上面有定义train_pipeline这个中间变量）
dict(type='LoadImageFromFile'),
dict(
type='LoadAnnotations',
with_bbox=True,
with_mask=True,
poly2mask=False),
dict(type='Resize', img_scale=(1333, 800), keep_ratio=True),
dict(type='RandomFlip', flip_ratio=0.5),
dict(
type='Normalize',
mean=[123.675, 116.28, 103.53],
std=[58.395, 57.12, 57.375],
to_rgb=True),
dict(type='Pad', size_divisor=32),
dict(type='DefaultFormatBundle'),
dict(
type='Collect',
keys=['img', 'gt_bboxes', 'gt_labels', 'gt_masks'])
]),
val=dict( # 验证集的配置
type='CocoDataset',
ann_file='data/coco/annotations/instances_val2017.json',
img_prefix='data/coco/val2017/',
pipeline=[ # Pipeline is passed by test_pipeline created before
dict(type='LoadImageFromFile'),
dict(
type='MultiScaleFlipAug',
img_scale=(1333, 800),
flip=False,
transforms=[
dict(type='Resize', keep_ratio=True),
dict(type='RandomFlip'),
dict(
type='Normalize',
mean=[123.675, 116.28, 103.53],
std=[58.395, 57.12, 57.375],
to_rgb=True),
dict(type='Pad', size_divisor=32),
dict(type='ImageToTensor', keys=['img']),
dict(type='Collect', keys=['img'])
])
]),
test=dict( # Test dataset config, modify the ann_file for test-dev/test submission
type='CocoDataset',
ann_file='data/coco/annotations/instances_val2017.json',
img_prefix='data/coco/val2017/',
pipeline=[ # Pipeline is passed by test_pipeline created before
dict(type='LoadImageFromFile'),
dict(
type='MultiScaleFlipAug',
img_scale=(1333, 800),
flip=False,
transforms=[
dict(type='Resize', keep_ratio=True),
dict(type='RandomFlip'),
dict(
type='Normalize',
mean=[123.675, 116.28, 103.53],
std=[58.395, 57.12, 57.375],
to_rgb=True),
dict(type='Pad', size_divisor=32),
dict(type='ImageToTensor', keys=['img']),
dict(type='Collect', keys=['img'])
])
],
samples_per_gpu=2 # 测试过程中每张GPU上的batch size
))
evaluation = dict( # 这个配置是创建一个evaluation hook, 具体细节请查看https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/evaluation/eval_hooks.py#L7.
interval=1, # 隔多少个epoch进行evaluation一次
metric=['bbox', 'segm']) # evaluation所用的评价指标
3、schedule
optimizer = dict( # 构造optimizer的配置, 支持PyTorch中所有的优化器，并且参数名称也和PyTorch中提供的一样。
type='SGD', # optimizers的类型, 具体细节请参照https://github.com/open-mmlab/mmdetection/blob/master/mmdet/core/optimizer/default_constructor.py#L13.
lr=0.02, # optimizers的学习率, 请到PyTorch的文档中查看相关参数的具体用法。
momentum=0.9, # SGD优化器的超参数：Momentum
weight_decay=0.0001) # SGD优化器的超参数：Weight decay
optimizer_config = dict( # 构造optimizer hook的配置, 具体细节请参照 https://github.com/open-mmlab/mmcv/blob/master/mmcv/runner/hooks/optimizer.py#L8.
grad_clip=None) # 绝大多少方法都不会使用gradient clip
lr_config = dict( # Learning rate scheduler config used to register LrUpdater hook
policy='step', # The policy of scheduler, also support CosineAnnealing, Cyclic, etc. Refer to details of supported LrUpdater from https://github.com/open-mmlab/mmcv/blob/master/mmcv/runner/hooks/lr_updater.py#L9.
warmup='linear', # warmup的策略, 还支持 `exp` 和 `constant`.
warmup_iters=500, # warmup的迭代次数
warmup_ratio=
0.001, # 用于warmup的起始学习比率
step=[8, 11]) # 学习率进行衰减的step位置
total_epochs = 12 # model训练的总epoch数

checkpoint_config = dict( # 设置checkpoint hook, 具体细节请参照https://github.com/open-mmlab/mmcv/blob/master/mmcv/runner/hooks/checkpoint.py 的实现.
interval=1) # 每隔几个epoch保存一下checkpoint

log_config = dict( # logger文件的配置
interval=50, # 每隔多少个epoch输出一个log文件
hooks=[
# dict(type='TensorboardLoggerHook') # MMDetection支持Tensorboard logger
dict(type='TextLoggerHook')
]) # logger 被用来记录训练过程.
dist_params = dict(backend='nccl') # 设置分布式训练的参数，也可以设置端口。
log_level = 'INFO' # The level of logging.
load_from = None # 给出之前预训练模型checkpoint的路径，这个不会resume training（resume training会按照上次的记录接着训练，而这个参数应该只是导入之前预训练模型参数，重新训练）
resume_from = None # 给出需要Resume 的checkpoints的路径, 它将会接着上次被保存的地方进行训练。
workflow = [('train', 1)] # Workflow for runner. [('train', 1)] means there is only one workflow and the workflow named 'train' is executed once. The workflow trains the model by 12 epochs according to the total_epochs.（这个workflow具体是干什么的我不是很清楚orz）
work_dir = 'work_dir' # 保存模型的文件夹路径（checkpoints和log文件都会保存在其中）。
FAQ
1、忽略基础配置文件中的部分字段
有些时候，你可以在配置文件中设置_delete_=True来忽略基础配置文件中的部分字段。在MMDetection中，我们以更改Mask-RCNN的backbone为例:

# 原配置文件
model = dict(
type='MaskRCNN',
pretrained='torchvision://resnet50',
backbone=dict(
type='ResNet',
depth=50,
num_stages=4,
out_indices=(0, 1, 2, 3),
frozen_stages=1,
norm_cfg=dict(type='BN', requires_grad=True),
norm_eval=True,
style='pytorch'),
neck=dict(...),
rpn_head=dict(...),
roi_head=dict(...))
在backbone中以HRNet来替换ResNet，因为HRNet的keywords结构和ResNet的有所不同，所以需要设置_delete_=True来忽略ResNet中的部分字段:

# 继承父类配置文件
_base_ = '../mask_rcnn/mask_rcnn_r50_fpn_1x_coco.py'
model = dict(
pretrained='open-mmlab://msra/hrnetv2_w32',
backbone=dict(
# 忽略父类配置文件中的keywords _delete_=True将会使用新的keys取代backbone中的旧keys
_delete_=True,
type='HRNet',
# 设置自己定义的keywords
extra=dict(
stage1=dict(
num_modules=1,
num_branches=1,
block='BOTTLENECK',
num_blocks=(4, ),
num_channels=(64, )),
stage2=dict(
num_modules=1,
num_branches=2,
block='BASIC',
num_blocks=(4, 4),
num_channels=(32, 64)),
stage3=dict(
num_modules=4,
num_branches=3,
block='BASIC',
num_blocks=(4, 4, 4),
num_channels=(32, 64, 128)),
stage4=dict(
num_modules=3,
num_branches=4,
block='BASIC',
num_blocks=(4, 4, 4, 4),
num_channels=(32, 64, 128, 256)))),
neck=dict(...))
2、在配置文件中使用中间变量
有些时候在配置文件中会使用一些中间变量，比如datasets配置中的train_pipeline/test_pipeline。值得注意的是，当在子配置中修改中间变量时，使用者需要再次将中间变量传递到相应的字段中。我们以多尺度策略训练Mask-RCNN为例。train_pipeline/test_pipeline是我们需要改的中间变量。

_base_ = './mask_rcnn_r50_fpn_1x_coco.py'
img_norm_cfg = dict(
mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
# 更改中间变量train_pipeline
train_pipeline = [
dict(type='LoadImageFromFile'),
dict(type='LoadAnnotations', with_bbox=True, with_mask=True),
dict(
type='Resize',
img_scale=[(1333, 640), (1333, 672), (1333, 704), (1333, 736),
(1333, 768), (1333, 800)],
multiscale_mode="value",
keep_ratio=True),
dict(type='RandomFlip', flip_ratio=0.5),
dict(type='Normalize', **img_norm_cfg),
dict(type='Pad', size_divisor=32),
dict(type='DefaultFormatBundle'),
dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels', 'gt_masks']),
]
# 更改中间变量test_pipeline
test_pipeline = [
dict(type='LoadImageFromFile'),
dict(
type='MultiScaleFlipAug',
img_scale=(1333, 800),
flip=False,
transforms=[
dict(type='Resize', keep_ratio=True),
dict(type='RandomFlip'),
dict(type='Normalize', **img_norm_cfg),
dict(type='Pad', size_divisor=32),
dict(type='ImageToTensor', keys=['img']),
dict(type='Collect', keys=['img']),
])
]
data = dict(
# 这个地方直接使用中间变量赋值
train=dict(pipeline=train_pipeline),
val=dict(pipeline=test_pipeline),
test=dict(pipeline=test_pipeline))
这是我自己在看MMDetection2的英文文档过程中，根据自己的理解进行翻译的，后续再对一些细节进行补充。（反正需要自己过一遍英文文档，不如写篇博客记录一下Ծ‸Ծ）。如有问题，欢迎大家在评论区拍砖！
原文链接：https://blog.csdn.net/foolishpeng/article/details/109802096

转载自：https://blog.csdn.net/foolishpeng/article/details/109802096?spm=1001.2014.3001.5501

图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
基于PyTorch和ResNet18的花卉识别实战（附完整代码）意.远 pytorch 人工智能 python 深度学习
一、项目背景与效果花卉分类是计算机视觉的经典任务。本文使用PyTorch框架，基于ResNet18模型实现了102种花卉的分类任务。完整代码可直接复制运行，最终验证集准确率达8.2%，文中同步分析性能瓶颈与优化方案。二、环境配置与数据准备1.环境要求#主要依赖库importtorchfromtorchimportnn,optimfromtorchvisionimporttransforms,dat
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
深度学习在医学影像分析中的应用：DeepSeek系统的实践与探索 Evaporator Core #深度学习 #DeepSeek快速入门 DeepSeek进阶开发与应用深度学习人工智能
随着人工智能技术的迅猛发展，深度学习在医学领域的应用逐渐成为研究热点。医学影像分析作为医疗诊断的重要组成部分，正受益于深度学习技术的突破。DeepSeek系统是一种基于深度学习的医学影像分析平台，旨在通过高效、精准的算法辅助医生进行疾病诊断和治疗决策。本文将深入探讨DeepSeek系统的技术原理、实现方法及其在医学影像分析中的实际应用，并结合代码示例展示其核心功能。1.DeepSeek系统的技术架
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割 985小水博一枚呀论文解读深度学习 transformer 人工智能网络 cnn
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割文章目录【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割2.Re
PyTorch 深度学习博客 Zoro｜ PyTorch Deep Learning 人工智能
PyTorch深度学习博客欢迎来到我的PyTorch深度学习博客！在这里，我将分享使用PyTorch学习和实践深度学习项目的点滴经验。本博客适用于初学者和有一定基础的开发者，旨在帮助大家快速搭建环境、掌握核心概念，并通过实例了解实际应用。环境配置为了确保项目的稳定性和兼容性，我选择了Python3.9环境，并在conda创建的虚拟环境中运行最新且稳定的PyTorch版本2.6.0。1.创建Pyth
深入探索 PyTorch 在语音识别中的应用 Zoro｜ PyTorch Deep Learning 机器学习 pytorch 语音识别人工智能
深入探索PyTorch在语音识别中的应用在本篇博客中，我将分享如何使用PyTorch进行语音识别任务，重点围绕环境配置、数据预处理、特征提取、模型设计以及模型比较展开。本文基于最近一次机器学习作业（HW2）的任务内容，任务目标是对语音信号进行逐帧音素预测，从而完成多类别分类任务。一、介绍任务背景任务目标：利用深度神经网络对语音信号进行逐帧音素预测。音素定义：音素是语音中能够区分单词的最小语音单位。
深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析深度学习
卷积神经网络（ConvolutionalNeuralNetwork,CNN）原理：CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算，提取局部特征；池化层则对特征图进行下采样，降低特征维度，同时保留主要特征；全连接层将特征图展开为一维向量，并进行分类或回归计算。CNN利用卷积操作实现局部连接和权重共享，能够自动学习数据中的空间特征。适用场景：广泛应用于图像处理相关的
算力技术创新驱动多场景应用演进智能计算研究中心其他
内容概要算力技术创新正成为数字经济时代的基础性驱动力，从异构计算架构的多元融合到量子计算的颠覆性突破，技术演进不断突破物理与算法的双重边界。在工业互联网场景中，边缘计算通过分布式节点实现毫秒级响应，支撑智能制造产线的实时控制；智能安防系统依托深度学习模型与流计算技术，完成海量视频数据的动态解析；而科学计算领域通过分布式计算与模型压缩技术，将基因测序、气候模拟等复杂任务的效率提升至新量级。值得注意的
AI模型技术前沿与跨场景应用实践智能计算研究中心其他
内容概要当前AI模型技术正呈现多维度突破与跨领域融合的特征。从技术演进角度看，可解释性模型与量子计算框架的协同发展正在突破传统黑箱限制，而联邦学习、自适应优化等技术则为复杂场景建模提供了新的方法论支撑。应用层面，TensorFlow与PyTorch框架在医疗影像诊断、金融时序预测等领域的实战案例，验证了深度学习模型在垂直行业的泛化能力。值得关注的是，工具链整合已成为技术落地的关键环节，MXNet与
融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践
在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。本文将深入探讨如何混合AMD/NVIDIAGPU集群以支持PyTorch分布式训
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
深度学习框架PyTorch——从入门到精通（5）构建神经网络 Fansv587 Torch框架学习深度学习 pytorch 神经网络经验分享
构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作。在PyTorch里，torch.nn这个命名空间提供了你搭建自己神经网络所需要的所有基础组件。PyTorch里的每一个模块都是nn.Module类的子类。一个神经网络本身
pytorch小记（十二）：pytorch中 masked_fill_() vs. masked_fill() 详解墨绿色的摆渡人 python pytorch小记 pytorch 人工智能 python
pytorch小记（十二）：pytorch中masked_fill_（）vs.masked_fill（）详解PyTorch`masked_fill_()`vs.`masked_fill()`详解1️⃣`masked_fill()`和`masked_fill_()`的作用2️⃣`masked_fill()`vs.`masked_fill_()`示例3️⃣输出结果4️⃣`masked_fill()`v
pytorch小记（十）：pytorch中torch.tril 和 torch.triu 详解墨绿色的摆渡人 python pytorch小记 pytorch 人工智能 python
pytorch小记（十）：pytorch中torch.tril和torch.triu详解PyTorch`torch.tril`和`torch.triu`详解1.`torch.tril`（计算下三角矩阵）作用语法参数示例`diagonal`参数`torch.tril`的应用2.`torch.triu`（计算上三角矩阵）作用语法参数示例`diagonal`参数3.`torch.tril`vs`torc
Pytorch torch.prod函数介绍 qq_27390023 pytorch 人工智能 python
torch.prod是PyTorch库中的一个函数，用于计算输入张量中所有元素或者指定维度上元素的乘积。下面将从函数的基本语法、参数、返回值、使用示例几个方面进行详细介绍。基本语法torch.prod(input,dim=None,keepdim=False,dtype=None)参数input：必需参数，是一个输入的PyTorch张量，函数将对这个张量的元素进行乘积计算。dim：可选参数，指定要
深度学习框架PyTorch——从入门到精通（5）自动微分 Fansv587 深度学习 pytorch 人工智能
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。在该算法中，参数（模型权重）根据损失函数的梯度相对于给定参数进行调整。为了计算这些梯度，PyTorch有一个内置的微分引擎，名为torch.autograd。它支持为任何计算图自动计算梯度。考虑最简单的一层神经网络，具有输入x、参数w和b以
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

MMDetection网络结构讲解

你可能感兴趣的:(深度学习,目标检测,pytorch)