OpenMMLab

MaskFormer 在 MMDtection 中复现全流程解析

熟悉我们的小伙伴肯定知道 MMDetection 已经支持了全景分割算法 MaskFormer 啦！今天我们就以 MaskFormer 为例，和大家一起学习在 MMDetection 复现算法的全流程。我们十分欢迎社区的小伙伴和我们一起往 MMDetection 中添加新的算法，共同打造更加优异的目标检测框架。

全景分割介绍

MaskFormer 介绍

准备工作

确定模型结构

设计并实现模型的基本结构

对齐 forward 结果

对齐 inference 精度

对齐 loss 部分

对齐其余部分

添加单元测试及文档

提交 PR

结语

在开始正式介绍前，我们先一起了解下全景分割和 MaskFormer。

https://github.com/open-mmlab/mmdetectiongithub.com/open-mmlab/mmdetection

全景分割介绍

图像中的像素点可以分成两大类：things 和 stuff。things 是图像中可数的物体，如人，车；stuff 是图像中不可数的像素区域，如路、天空。语义分割简单来说是对图像中每个像素分配一个语义标签，它将 things 也当作 stuff 来看待；实例分割是要将图像中每个实例都分割出来，允许实例之间有重叠。全景分割任务包括语义分割和实例分割，但引入了新的挑战。与语义分割不同，它需要区分单个对象实例；与实例分割不同，实例之间必须是不重叠的。全景分割任务就是对图像中每个像素点分配一个语义标签和一个实例编号。拥有相同 things 标签和实例编号的像素属于同一个物体，对于打上 stuff 标签的区域忽略其实例编号。

下图展示了语义分割、实例分割、全景分割三种任务之间的区别：

全景分割评价指标为 panoptic quality (PQ)，计算公式如下所示。

PQ 可是看成是segmentation quality (SQ) 和 recognition quality (RQ) 的乘积。RQ 与 F1 类似，而 SQ 是相匹配区域的 IOU 的平均值。

MaskFormer 介绍

现代的方法通常是将语义分割看作是逐像素点的分类任务，将实例分割看作是在目标检测的基础上加 mask 分类。MaskFormer 论文作者们认为：mask 分类是一个足够通用的方法，可以使用相同的模型、损失函数和训练流程来统一解决语义和实例级别的分割任务。

MaskFormer 是一个 mask 分类模型，它预测一组二进制 mask，每个 mask 与单个全局类别标签（包括 things 和 stuff）相关联。MaskFormer 简化了语义分割以及全景分割任务，并且性能也不错。

MaskFormer 论文链接： https://arxiv.org/abs/2107.06278
MaskFormer 详细解读： MaskFormer: 语义分割是像素分类问题吗？ - 知乎
MMDetection 复现代码： https://github.com/open-mmlab/mmdetection/tree/master/configs/maskformer

接下来我们进入今天的正题，介绍一下如何在 MMDetection 中添加 MaskFormer 算法。

准备工作

首先，我们要按照 MaskFormer 的官方代码库中的指引，配置好环境，准备好 COCO 全景分割数据集。其次，使用 model zoo 中发布的模型在验证集上跑一遍，看看精度是否和论文上的一致。最后，准备一个小的验证集，用于快速检查复现后的模型与原版模型是否有差异（单卡跑一遍 COCO 验证集，时间还是比较久的，尤其是全景分割任务）。

确定模型结构

模型结构图可以让我们对模型结构有一个整体的认识，论文中一般都会有，但是模型结构图不一定能完全准确地反映模型的实际结构。

比如，下图中的 image features F 实际上不是直接输入到 transformer decoder，而是先经过 pixel decoder 中的一些卷积层再传入到 transformer decoder。

MaskFormer 模型结构图

此外，论文篇幅有限，不会对模型的具体结构参数做详细的说明。因此，在熟读论文并了解模型的整体结构之后，还需要阅读源码，对之前的认知做一个纠正，同时明确模型结构上的小细节。比如，卷积层的卷积大小、步长，后面有没有加 batch normalization 之类的。在完成论文和代码的阅读工作之后，我们可以在模型结构图上，标注出各个模块的具体细节。

设计并实现模型的基本结构

MMDetection 中的目标检测器通常可以分成三部分：backbone、neck（如果有）、head。backbone 部分通常比较明确并且固定，而 neck 和 head 部分有时并不好拆分。

MaskFormer 中 pixel decoder 部分是一个类似于 FPN 的结构，但是感觉不是很通用。因此，这个部分单独做成 plugin，而不是一个 neck。因而，整体上就是把 transformer decoder、pixel decoder 算在 MaskFormerHead 部分。然后考虑到 MaskFormer 和 Mask2Former 结构类似，也可以进行语义分割、实例分割和全景分割，所以就把三种分割后处理拿出来做成一个单独模块 MaskFormerFusionHead。

设计后的 MaskFormer 模块层级结构如下图所示：

MaskFormer 模块层级结构图

主要模块的功能及代码链接分别如下：

PixelDecoder：结构类似于 FPN，swin transformer 为 backbone 时用到。
TransformerEncoderPixelDecoder：resnet 为 backbone 时用到，在 PixelDecoder 基础上多了一个包含 6 个 tansformer encoder block 的 TransformerEncoder。
TransformerDecoder：包含 6 个 transformer decoder block 的 TransformerDecoder。
MaskFormerHead：包含 PixelDecoder、TransformerDecoder。
MaskFormerFusionHead：全景分割、实例分割、语义分割后处理。
MaskFormer：detector。

对齐 forward 结果

在完成 MaskFormerHead 中的 forward 部分（模型训练和推断中的公共部分）之后，需要核对一下模型结构是不是和原版模型结构一致。具体分为三个步骤：

1.分别打印复现后的模型权重的名字，以及原版模型权重的名字，然后核对权重文件中的权重数量是不是一致，权重的名字是否能对应起来。下面代码展示了部分权重的名字，这里只贴了 resnet50 中的 stem 部分，以及 TransformerEncoderPixelDecoder 中的第一个 transformer block 中部分权重的名字。权重的名字不同，这个是因为模块内部各网络层实例取名不同以及各层之间的嵌套关系不同。

# MMDetection 中的 resnet50 中的 stem 权重的名字 
backbone.conv1.weight 
backbone.bn1.weight 
backbone.bn1.bias 
backbone.bn1.running_mean 
backbone.bn1.running_var 
 
# Detectron2 中的 resnet50 中的 stem 权重的名字 
backbone.stem.conv1.weight 
backbone.stem.conv1.norm.weight 
backbone.stem.conv1.norm.bias 
backbone.stem.conv1.norm.running_mean 
backbone.stem.conv1.norm.running_var 
 
# MMDetection 中的 TransformerEncoderPixelDecoder 中的第一个 transformer block 的部分权重的名字 
panoptic_head.pixel_decoder.encoder.layers.1.attentions.0.attn.in_proj_weight 
panoptic_head.pixel_decoder.encoder.layers.1.attentions.0.attn.in_proj_bias 
panoptic_head.pixel_decoder.encoder.layers.1.attentions.0.attn.out_proj.weight 
panoptic_head.pixel_decoder.encoder.layers.1.attentions.0.attn.out_proj.bias 
 
# Detectron2 中的 TransformerEncoderPixelDecoder 中的第一个 transformer block 的部分权重的名字 
sem_seg_head.pixel_decoder.transformer.encoder.layers.1.self_attn.in_proj_weight 
sem_seg_head.pixel_decoder.transformer.encoder.layers.1.self_attn.in_proj_bias 
sem_seg_head.pixel_decoder.transformer.encoder.layers.1.self_attn.out_proj.weight 
sem_seg_head.pixel_decoder.transformer.encoder.layers.1.self_attn.out_proj.bias

2.将官方发布的模型权重的名字改为我们自己实现的模型权重的名字，并将修改之后的权重保存下来。可以总结一下两个模型权重的名字之间的对应关系，然后写一个脚本来实现转换（MMDetection 中有一个替换模型权重名字的脚本，可以参考）。

3.两个版本的模型各自加载相应权重，给定相同输入，检查输出结果是否一致，代码如下：

# 对齐 forward 
import sys 
sys.path.append("/data/open-mmlab/MaskFormer") 
import torch  
import pickle as pkl  
from mmdet.models.builder import build_detector  
from mmcv.utils.config import Config 
 
from mask_former import add_mask_former_config 
from detectron2.config import get_cfg 
from detectron2.modeling import build_model  
 
 
img = torch.rand((1, 3, 256, 256)).cuda() 
img_metas = [{ 
    "img_shape": (250, 250, 3), 
    "pad_shape": (256, 256, 3), 
}] 
 
#################################! MMDetection model 
# 配置文件中只需要完成 model 部分的配置即可 
mmdet_cfg_path = "./configs/maskformer/maskformer_r50_mstrain_16x1_75e_coco.py" 
mmdet_cfg = Config.fromfile(mmdet_cfg_path) 
 
# 构建模型并加载权重 
checkpoint_path = "./checkpoints/maskformer/mmdet/maskformer_r50_converted_from_release_version.pth" 
checkpoint = torch.load(checkpoint_path)["state_dict"] 
mmdet_detector = build_detector(mmdet_cfg.model) 
mmdet_detector.load_state_dict(checkpoint) 
mmdet_detector = mmdet_detector.cuda() 
mmdet_detector.eval() 
 
with torch.no_grad(): 
    mmdet_out = mmdet_detector.forward_dummy(img, img_metas) 
 
#################################! Detectron2 model 
# 加载配置文件 
det2_cfg_path = "/data/open-mmlab/MaskFormer/configs/coco-panoptic/maskformer_r50.yaml" 
det2_cfg = get_cfg() 
add_mask_former_config(det2_cfg) 
det2_cfg.merge_from_file(det2_cfg_path) 
det2_cfg.freeze() 
 
# 构建模型并加载权重 
det2_checkpoint_path = "./checkpoints/maskformer/det2/model_final_6f60dc.pkl" 
with open(det2_checkpoint_path, "rb") as f: 
    det2_weight = pkl.load(f)["model"] 
# MaskFormer 官方 repo 中提供的权重是 np.array，需要转为为 tensor 
det2_weight = { 
    k: torch.from_numpy(v).cuda() 
    for k, v in det2_weight.items() 
} 
det2_detector = build_model(det2_cfg) 
det2_detector.load_state_dict(det2_weight) 
det2_detector = det2_detector.cuda() 
det2_detector.eval() 
 
with torch.no_grad(): 
    features = det2_detector.backbone(img) 
    det2_out = det2_detector.sem_seg_head(features) 
 
print("pred_logits") 
print("mmdet: ", mmdet_out[0][-1].sum()) 
print("det2: ", det2_out["pred_logits"].sum()) 
print("pred_masks") 
print("mmdet: ", mmdet_out[1][-1].sum()) 
print("det2: ", det2_out["pred_masks"].sum())

下图为上面代码运行的结果，两个版本的 forward 结果是一致的。

forward 结果

对齐 inference 精度

在进行 inference 之前，需要完成以下两个步骤：

1.完成整个 simple_test （推断）代码，即从 forward 的返回结果到最终的预测结果的过程，涉及到的代码为以下三部分：

MaskFormer 的 simple_test
MaskFormerHead 的 simple_test
MaskFormerFusionHead

2.确定 inference 阶段的配置（test_cfg）和数据处理流程（val_pipeline）。inference 阶段的配置只需要添加到配置文件中的 test_cfg 部分，而 inference 阶段数据处理流程就是常规的 COCO 检测配置文件中的 val_pipeline，如下：

# test_cfg 及 test_pipeline 的设置 
test_cfg=dict( 
    panoptic_on=True, 
    # For now, the dataset does not support 
    # evaluating semantic segmentation metric. 
    semantic_on=False, 
    instance_on=False, 
    # max_per_image is for instance segmentation. 
    max_per_image=100, 
    object_mask_thr=0.8, 
    iou_thr=0.8, 
    # In MaskFormer's panoptic postprocessing, 
    # it will not filter masks whose score is smaller than 0.5 . 
    filter_low_score=False) 
 
img_norm_cfg = dict( 
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True) 
test_pipeline = [ 
    dict(type='LoadImageFromFile'), 
    dict( 
        type='MultiScaleFlipAug', 
        img_scale=(1333, 800), 
        flip=False, 
        transforms=[ 
            dict(type='Resize', keep_ratio=True), 
            dict(type='RandomFlip'), 
            dict(type='Normalize', **img_norm_cfg), 
            dict(type='Pad', size_divisor=1), 
            dict(type='ImageToTensor', keys=['img']), 
            dict(type='Collect', keys=['img']), 
        ]) 
]

完成上面两步之后，就可以进行 inference，下表是 maskformer_r50 的 inference 结果，复现模型加载转化后的权重的 inference 结果为 46.526，与官方的结果基本一致（需要注意 MMDetection 中默认使用 opencv 来读取和处理图片，Detectron2 使用 pillow 来读取和处理图片，opencv 和 pillow 在读取和处理图片的结果是有差异的，对 inference 结果影响很小，但是对 loss 的影响比较大）。

	实际测试精度（PQ）	论文精度（PQ）	复现模型加载转化后的权重（PQ）
maskformer_r50	46.537	46.5	46.526

下图为官方发布的模型权重推理结果的可视化效果图：

对齐 loss 部分

在对齐好 inference 精度之后，可以确保模型的结构已经正确了。接下来要处理三件事：

ground truth 的预处理。由于 COCOPanopticDataset 返回的是和 things 相关的 gt_labels 和 gt_masks, 以及和 stuff 相关的 gt_semantic_seg，需要转化为不区分 things 和 stuff 的 labels 和 masks。
match_cost (DiceCost，FocalLossCost)、assigner 以及 loss 代码。由于 MaskFormer 中参与匹配的既有 label 也有 mask，而当时针对于 mask 的 match_cost 和 assigner 在 MMDetection 中还未实现，因此，这部分可以参考 MMDetection 有关 bbox 的 match_cost 和 assigner 来实现。
对齐 loss。这里可以伪造输入，然后分别转化为 Detectron2 的数据格式和 MMdetection 的数据格式，然后对比最后的 loss 是否一致。这里还需要排除随机数据变换的影响，比如 RandomFlip, Resize。因此，配置文件中 train_pipeline 可以按下面的代码进行设置，然后 MaskFormer 官方代码中相应的随机数据变换也需要注释掉。

# train_pipeline 的设置 
img_norm_cfg = dict( 
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True) 
train_pipeline = [ 
    dict(type='LoadImageFromFile', to_float32=True), # 加载图片的 backend 应该设置成 pillow 
    dict( 
        type='LoadPanopticAnnotations', 
        with_bbox=True, 
        with_mask=True, 
        with_seg=True), 
    # dict(type="Resize", img_scale=(1333, 800), keep_ratio=True), 
    # dict(type='RandomFlip', flip_ratio=0.), 
    dict(type='Normalize', **img_norm_cfg), 
    dict(type='Pad', size_divisor=1), 
    dict(type='DefaultFormatBundle', img_to_float=True), 
    dict( 
        type='Collect', 
        meta_keys=('filename', 'ori_filename', 'ori_shape', 
                        'img_shape', 'pad_shape', 'scale_factor', 
                        'img_norm_cfg'), 
        keys=['img', 'gt_bboxes', 'gt_labels', 'gt_masks', 'gt_semantic_seg']), 
]

下面这段代码是我们分别加载原版的 MaskFormer 和我们实现的 MaskFormer，用官方发布的MaskFormer_r50 版本权重初始化模型，给定相同的输入（000000000009.jpg），对比 loss。

# 对齐 loss 
import sys 
sys.path.append("/data/open-mmlab/MaskFormer") 
import torch  
import pickle as pkl  
from mmdet.datasets import build_dataset 
from mmdet.models.builder import build_detector  
from mmcv.utils.config import Config 
 
from mask_former import DETRPanopticDatasetMapper, add_mask_former_config 
from detectron2.config import get_cfg 
from detectron2.modeling import build_model  
from detectron2.data import build_detection_train_loader 
 
#################################! MMDetection dataset 
# 配置文件中训练数据处理流程中只加载数据不做变换（去掉 flip， resize） 
mmdet_cfg_path = "./configs/maskformer/maskformer_r50_mstrain_16x1_75e_coco.py" 
mmdet_cfg = Config.fromfile(mmdet_cfg_path) 
mmdet_ds = build_dataset(mmdet_cfg.data.train) 
# 加载 000000000009.jpg 及其标注 
input_data = mmdet_ds[97623] 
input_img = input_data["img"].data.unsqueeze(0).cuda() 
img_metas = [input_data["img_metas"].data, ] 
gt_bboxes = [input_data["gt_bboxes"].data.cuda(), ] 
gt_labels = [input_data["gt_labels"].data.cuda(), ] 
gt_masks = [input_data["gt_masks"].data, ] 
gt_semantic_seg = [input_data["gt_semantic_seg"].data.cuda(), ] 
 
#################################! MMDetection model 
# 构建模型并加载权重 
mmdet_detector = build_detector(mmdet_cfg.model) 
checkpoint_path = "./checkpoints/maskformer/mmdet/maskformer_r50_converted_from_release_version.pth" 
checkpoint = torch.load(checkpoint_path)["state_dict"] 
mmdet_detector.load_state_dict(checkpoint) 
mmdet_detector = mmdet_detector.cuda() 
mmdet_detector.eval() 
 
with torch.no_grad(): 
    mmdet_loss = mmdet_detector.forward_train( 
        input_img,  
        img_metas, 
        gt_bboxes, 
        gt_labels, 
        gt_masks, 
        gt_semantic_seg) 
 
#################################! Detectron2 dataset 
# 加载配置文件 
det2_cfg_path = "/data/open-mmlab/MaskFormer/configs/coco-panoptic/maskformer_r50.yaml" 
det2_cfg = get_cfg() 
add_mask_former_config(det2_cfg) 
det2_cfg.merge_from_file(det2_cfg_path) 
det2_cfg.freeze() 
# 需要注释掉对随机变换的代码 
mapper = DETRPanopticDatasetMapper(det2_cfg, True) 
ds = build_detection_train_loader(det2_cfg, mapper=mapper) 
# 第一张图片为 000000000009.jpg 
det2_input = None 
for x in ds: 
    if det2_input is None: 
        det2_input = x  
        break 
 
#################################! Detectron2 model 
# 构建模型并加载权重 
det2_checkpoint_path = "./checkpoints/maskformer/det2/model_final_6f60dc.pkl" 
with open(det2_checkpoint_path, "rb") as f: 
    det2_weight = pkl.load(f)["model"] 
# MaskFormer 官方 repo 中提供的权重是 np.array，需要转为为 tensor 
det2_weight = { 
    k: torch.from_numpy(v).cuda() 
    for k, v in det2_weight.items() 
} 
det2_detector = build_model(det2_cfg) 
det2_detector.load_state_dict(det2_weight) 
det2_detector = det2_detector.cuda() 
det2_detector.eval() 
# 在 https://github.com/facebookresearch/MaskFormer/blob/da3e60d85fdeedcb31476b5edd7d328826ce56cc/mask_former/mask_former_model.py#L171 
# 中将 self.training 替换成 True 
with torch.no_grad(): 
    det2_loss = det2_detector(det2_input) 
 
print(mmdet_loss) 
print(det2_loss)

如下图所示，前四行为我们实现的 MaskFormer 所产生的 loss，后四行为 Detectron2 版本的 MaskFormer 所产生的 loss。给定相同的输入（000000000009.jpg），我们在 MMDetection 中实现的模型所产生的 loss 和原版的 Detectron2 中实现的模型所产生的 loss 是相同的（这里 loss_ce 和 loss_cls 是对应的）。

mmdet_loss 和 det2_loss

对齐 loss 涉及到的模块的功能及代码链接分别如下：

preprocess_panoptic_gt：Ground truth 的预测预处理。
DiceCost，FocalLossCost：用于mask 之间匹配的 dice cost、focal loss cost。
MaskHungarianAssigner：用于 mask 的匈牙利分配器。
MaskPseudoSampler：用于 mask 的伪采样器。
MaskSamplingResult：用于 mask 的采样结果。

对齐其余部分

除了对齐上面的 foward 结果、 inference 精度、loss 等主要部分，还需要对齐：模型各层参数初始化方式、训练时的数据处理流程（与 detr 的训练数据处理流程相同）、训练配置（learning rate, warmup, weight decay, norm decay）等。这些部分相对简单并且 MMDetection 都已经有相应的实现，只需要设置好相关参数配置即可。下面是优化器及学习率策略的相关配置：

# 优化器 
optimizer = dict( 
    type='AdamW', 
    lr=0.0001, 
    weight_decay=0.0001, 
    eps=1e-8, 
    betas=(0.9, 0.999), 
    paramwise_cfg=dict( 
        custom_keys={ 
            # 调整 backbone 的学习率为整体学习率的十分之一 
            'backbone': dict(lr_mult=0.1, decay_mult=1.0), 
            # 关闭 query_embed 的 weight decay 
            'query_embed': dict(lr_mult=1.0, decay_mult=0.0) 
        }, 
        # 关闭模型中的所有 norm 层的 weight decay 
        norm_decay_mult=0.0)) 
 
# 梯度裁剪 
optimizer_config = dict(grad_clip=dict(max_norm=0.01, norm_type=2)) 
 
# 学习率策略，训练 75 个 epoch，在第 50 个 epoch 结束后，学习率减少为原来的十分之一 
lr_config = dict( 
    policy='step', 
    gamma=0.1, 
    by_epoch=True, 
    step=[50], 
    warmup='linear', 
    warmup_by_epoch=False, 
    warmup_ratio=1.0,  # 不添加warmup 
    warmup_iters=10) 
runner = dict(type='EpochBasedRunner', max_epochs=75)

添加单元测试及文档

单元测试尽可能在完成一个模块之后就添加进去，因为在 PR 合入之前，代码可能要多次改动，这个过程中很可能产生 bug，单元测试可以帮助我们检查出一部分 bug。另外，各个模块需要完善的文档来说明其作用、输入和输出。这么做一方面可以帮助用户快速上手我们写的模块，另一方面也可以检查所写模块是否是自己所想要的。

提交 PR

提交一个大 PR（代码数量大，涉及的文件很多）是不合适的，容易引入 bug，而且不利于 review。因此，在上述步骤完成得差不多时，可以考虑拆分 PR，逐个提交 PR（PR 提交方式见【干货贴】手把手教你给 OpenMMLab 提 PR ）到 MMDetection。以 MaskFormer 为例，整个大 PR 可以拆分为 10 个小 PR （每个 PR 都要包含相应模块的单元测试）：

preprocess_panoptic_gt
DiceCost
FocalLossCost
MaskHungarianAssigner
MaskPseudoSampler
MaskSamplingResult
PixelDecoder, TransformerEncoderPixelDecoder
MaskFormerHead
MaskFormerFusionHead
MaskFormer

PR 提交后，会进行 license、lint、unit test 检查以及 docs 的生成。如果有哪一项检查没有通过，可以点进相应的 item 看一下问题出在哪里。

经过多轮 review 确保代码基本没有问题之后，我们会帮助训练模型。如果模型训练结果和论文结果一致，那我们就会把 PR 合入到 dev 分支。在每个月发布新版本之前，我们会对 dev 分支进行测试，如果通过测试，dev 分支将被合并到 master 分支，然后打上 tag ，发布新版本。

结语

本文以 MaskFormer 算法为例，和大家一起学习了在 MMDetection 复现算法的全流程，同时还分享了在 MMDetection 提交 PR 的一些经验，希望大家能有所收获。我们非常欢迎大家提交 PR 给 MMDetection 添加新的算法，共同打造更加优异的目标检测框架。

了解 PR 合入 MMDetection 的过程可参考：

MaskFormer
MaskFormer Refactor
Mask2Former

参考文献

https://arxiv.org/pdf/2107.06278
https://arxiv.org/pdf/1801.00868

ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
生成式 AI：从 “理解” 到 “创造” 的突破田园Coder 人工智能科普人工智能科普
1.生成式AI的定义：让AI从“识别”走向“创造”1.1什么是生成式AI生成式AI是一类能自主生成新内容（文本、图像、音频、视频等）的人工智能技术。与传统“判别式AI”（如人脸识别、垃圾邮件过滤，专注于分类和判断）不同，生成式AI的核心是“创造”——它能基于学习的规律，生成与训练数据相似但全新的内容。例如，判别式AI能判断“这是一幅梵高的画”，而生成式AI能模仿梵高的风格创作一幅全新的油画；判别式
青少年人工智能Python编程水平测试四级模拟试卷9 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法数据结构排序算法
1、以下选项中，说法正确的是？（）A、条件1and条件2，表示条件满足其中1个即可B、条件1or条件2，表示2个条件需要同时满足C、and和or不能在一个条件表达式中同时使用D、andor一般和if语句搭配使用正确答案：D试题解析：and是逻辑与，同时满足结果才满足；or是逻辑或，满足一个结果就是满足；
青少年人工智能Python编程水平测试四级模拟试卷5 试题解析编程小伙伴测评网 YCL 试题详解 python 开发语言少儿编程青少年编程算法推荐算法
【单选题】（每题2分）1、运行下列代码后，输入4，输出的结果是？（）num_1=input()num_2="3"print(num_1+num_2)A、7B
计算机视觉：人工智能的“眼睛” 人工智能教程人工智能计算机视觉机器学习算法 pytorch python 数据结构
前言在人工智能的众多领域中，计算机视觉（ComputerVision）无疑是其中最为引人注目的方向之一。它赋予了机器“看”的能力，使计算机能够像人类一样理解和解释视觉信息。从自动驾驶汽车到医疗影像诊断，从安防监控到虚拟现实，计算机视觉的应用场景无处不在，深刻地改变着我们的生活和工作方式。本文将深入探讨计算机视觉的核心技术、应用场景以及未来的发展趋势，帮助您全面了解这一充满活力的领域。一、计算机视觉
计算机视觉：打开机器之眼看世界 LeafyJee_ 人工智能人工智能深度学习计算机视觉
计算机视觉是人工智能领域中备受关注的一部分，它的目标是赋予计算机类似于人类眼睛的功能，让机器能够感知和理解周围的世界。通过图像和视频数据，计算机视觉技术将信息转化为可理解和可操作的数据，为各种应用领域提供了强大的支持。一、计算机视觉的起源和发展计算机视觉起源于20世纪50年代，当时科学家们开始研究如何让计算机能够识别和理解图像。随着技术的不断进步，计算机视觉逐渐发展成为一门独立的学科，并广泛应用于
如何使用 OpenCV 打开指定摄像头
在计算机视觉应用中，经常需要从特定的摄像头设备获取视频流。例如，在多摄像头环境中，当使用OpenCV的cv::VideoCapture类打开摄像头时，如果不指定摄像头的ID，可能会随机打开系统中的某个摄像头，或者按照设备连接的顺序打开第一个可用的摄像头。比如： //打开两个摄像头 cv::VideoCapture cap0(0); if (!cap0.isOpened()){ c
山东大学软件学院2024-2025人工智能导论期末复习简答题整理飘去数星星多元人工智能
写在前面给我的往年题整理引个流嘿嘿山东大学软件学院2024-2025人工智能导论期末回顾-CSDN博客个人观点：这次考试给我的感觉是意料之外又是意料之中，怎么说呢，意料之中的是这次的题跟往年题不一样，因为我们上一级的期末考试题就跟前几年的非常不一样，所以其实还是有所准备的，但是又是意料之外的，因为他考的也太不一样了，考的非常细节，还是招架不太住哈哈哈以下是我自己整理的一些知识点，仅供参考~需要的可
2024年第六届振我中华资金分仓方案毛振华低碳未来碳交易市场被骗无法出金,真相令人毛骨悚然! 法律咨询维权
日常生活中，经常有陌生电话号称免费拉人进股票群；网络平台上，也经常有各种股票讲课的广告。很多人抱着不花钱只是进群看看、听听课的心态，没想到却一步步陷入被骗的漩涡，损失惨重。这些股票群里所谓的“老师”首先推荐股票，取得信任后，就会推荐自行发行平台，来骗取投资者钱财。数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。若你
开源模型应用落地-OpenAI Agents SDK-集成多个MCP Servers与Qwen3-8B模型的创新应用探索（九）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术迅猛发展的今天，如何让AI代理更高效地理解和操作外部资源成为行业关注的焦点。模型上下文协议（MCP）应运而生，作为一项由Anthropic推出的开源标准，它为AI系统提供了一种统一的方式来发现、检索和理解数据。与此同时，OpenAIAgents通过支持多种MCP服务器的集成，为开发者提供了更大的灵活性和扩展性。结合强大的Qwen3-8B模型，其不仅具备快速响应的能力，还能在复
DeepSeek部署指南：从入门到精通 wujj_whut 热门应用 c++DeepSeek 嵌入式实时数据库
DeepSeek部署指南：从入门到精通引言在人工智能和深度学习领域，模型的部署是一个至关重要的环节。DeepSeek作为一款强大的深度学习框架，其部署过程不仅关系到模型的性能表现，还直接影响到实际应用的效果。本文将详细介绍DeepSeek的部署流程，涵盖从环境配置到实际应用的各个方面，旨在帮助读者全面掌握DeepSeek的部署技巧。一、DeepSeek简介DeepSeek是一款开源的深度学习框架，
【人工智能之深度学习】1. 深度学习基石：神经元模型与感知机的数学本质（附代码实现与收敛性证明） AI_DL_CODE 人工智能之深度学习人工智能深度学习神经元模型感知机赫布法则深度学习基础线性可分
摘要：作为深度学习的基础单元，神经元模型与感知机承载着从生物智能到人工神经网络的桥梁作用。本文从生物神经元的工作机制出发，系统剖析数学建模过程：详解赫布法则的权重更新原理（Δwi=η·xi·y），推导McCulloch-Pitts神经元模型的数学表达（y=Θ(∑wixi−b)），重点证明感知机在linear可分情况下的收敛性——通过Novikoff定理严格推导迭代次数上界，揭示间隔γ对收敛速度的影
女性职业新趋势：揭秘未来高薪热门行业氧惠爱高省
女生在职业选择上拥有广阔的空间，尤其是在当前快速发展的社会背景下，一些行业不仅成为了高薪热门，还提供了多样化的职业路径。以下是一些可能成为女生高薪热门选择的行业：➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。科技与互联网行业人工智能与大数据：随着人工智能和大数据技术的广泛应用，相
深度学习在环境感知中的应用：案例与代码实现
让机器学会“看”世界：深度学习如何赋能环境感知？关键词深度学习|环境感知|计算机视觉|传感器融合|语义分割|目标检测|自动驾驶摘要环境感知是机器与外界互动的“眼睛和耳朵”——从自动驾驶汽车识别行人，到智能机器人避开障碍物，再到城市监控系统检测异常，所有智能系统都需要先“理解”环境，才能做出决策。传统环境感知方法依赖手工特征提取，难以应对复杂场景；而深度学习通过数据驱动的方式，让机器从大量数据中自动
自编码器表征学习：重构误差与隐空间拓扑结构的深度解析码字的字节机器学习自编码器重构误差隐空间
自编码器基础与工作原理自编码器（Autoencoder）作为深度学习领域的重要无监督学习模型，其核心思想是通过模拟人类认知过程中的"压缩-解压"机制实现数据的表征学习。这种由GeoffreyHinton团队在2006年复兴的神经网络结构，本质上是一个试图通过编码-解码过程来复制其输入的系统，却在实现这一看似简单目标的过程中，意外地获得了强大的特征提取能力。基本架构与工作流程典型自编码器由对称的两部
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
交错并联Buck+LLC变换器的建模与控制优化研究
交错并联Buck+LLC变换器的建模与控制优化研究前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。摘要本文针对宽输入电压范围(200-450V)、多电压输出(12-48V)的高效DC-DC变换系统，提出了一种基于交错并联Buck预调节器和LLC谐振变换器的两级式拓扑结构。中间母线电压设定为200V，系统输出功率为1500W，要求电压和
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现神经网络15044 算法 python 分类矩阵人工智能数据挖掘深度学习
使用MMDetection中的Mask2Former和X-Decoder训练自定义数据集及结果复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言1.1研究背景实例分割是计算机视觉领域的重要任务，它要求模型不仅要检测图像中的对象，还要精确地分割出每个对象的像素级掩码。近年来，基于Transformer的模型在实例分割任务上取得
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
全球软件技术峰会 2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴向日葵也有悲伤运维架构推荐算法数据结构大数据数据库架构
全球软件技术峰会2025：聚焦大模型开发、智能运维与架构创新，共赴技术实战盛宴在软件定义未来的时代，人工智能与数字化技术正以颠覆性力量重塑全球产业格局。2025年8月15-16日，以"全球专家、卓越智慧"为宗旨的全球软件技术峰会将盛大启幕，特邀全球近50位来自微软、谷歌、亚马逊、字节跳动等企业的技术领袖及一线实战专家，围绕大模型智能应用开发、AI与ML智能运维、软件开发智能化、架构设计与演进四大核
AI产品经理面试宝典第42天：学习方法与产品流程解析 TGITCIC AI产品经理一线大厂面试题产品经理 AI面试大模型面试 AI产品经理面试大模型产品经理面试 AI产品大模型产品
具体问答：学习产品及AI知识的方法问：请谈谈您是如何学习产品及AI知识的，以及您认为哪些资源对您帮助最大答：我的学习体系包含三个维度：分层知识架构、实践验证闭环、资源筛选机制。在知识获取阶段，采用「理论-案例-工具」三级学习法：通过《人工智能：一种现代的方法》构建AI基础框架，用TensorFlow官方文档掌握工程实现，结合《启示录》《俞军产品方法论》理解产品逻辑。实践环节采用「项目反哺」模式，例
重磅！LM Studio AI编程全面免费
从今天起，LMStudio在家和工作中均可免费使用。查看更新后的条款了解详情。我们的隐私政策保持不变，您可以在此处阅读。在家免费使用，现在也可在工作场所使用LMStudio一直以来都免费供个人使用。这源于我们秉持的根本信念：人工智能应该让人们在自己的机器上轻松访问，无需依赖任何外部资源，并且完全保护隐私。此前，LMStudio应用条款规定，公司或组织若要使用LMStudio，必须联系我们并获得单独
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
Self-Consistency：跨学科一致性的理论与AI推理的可靠性基石大千AI助手人工智能 Python #Prompt 人工智能机器学习神经网络算法大模型幻觉 LLM
本文综合其在逻辑学、心理学及人工智能领域的核心定义、技术实现与前沿进展来对Self-Consistency（自洽性）进行系统性解析。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与跨学科内涵基础概念逻辑学定义：指理论或系统内部逻辑自洽，无矛盾或悖论。例如物理理论中，狭义相对论的速度变换
人工智能学习指南：从菜鸟到大神的进击之路橡晟人工智能深度学习计算机视觉算法学习 python
人工智能学习指南：从菜鸟到大神的进击之路前言：别慌，AI没那么可怕嘿！想学人工智能？恭喜你，你已经比90%的人更有眼光了！很多人一听到"人工智能"就开始头疼，仿佛这是什么高深莫测的巫术。其实不然，AI就像学做饭一样——刚开始可能会糊锅，但掌握了方法，你也能做出一桌好菜！目录第一章：认清现实，别被忽悠第二章：建立知识地图第三章：实战为王第四章：自检清单——你真的学会了吗？第五章：进阶之路结语：成为A
阴谋爆仓！社科院课堂朱民ST-balance节能风电被骗揭秘！受害者亲述不能出金真相！正义青天
随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁。因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局若你也不幸被骗遇到此类平台一定不要打草惊蛇，早期不
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

MaskFormer 在 MMDtection 中复现全流程解析

全景分割介绍

MaskFormer 介绍

准备工作

确定模型结构

设计并实现模型的基本结构

对齐 forward 结果

对齐 inference 精度

对齐 loss 部分

对齐其余部分

添加单元测试及文档

提交 PR

结语

你可能感兴趣的:(技术干货,计算机视觉,深度学习,人工智能)