baiyuwujia

CenterNet代码之datasets

CenterNet（Objects as points）开源代码：https://github.com/xingyizhou/CenterNet

源码的dataset结构如下：

datasets  
  |
  |---dataset  # 解析各数据集（CenterNet共用了下面的数据集）
        |---coco.py     # Coco数据集
        |---coco_hp.py  # Coco human pose
        |---kitti.py    # kitti
        |---pascal.py   # PascalVOC
  |
  |---sample   # 针对不同的网络 提取所需数据
        |---ctdet.py       # CenterNet
        |---ddd.py         # 3D Detection
        |---exdet.py       # ExtremeNet
        |---multi_pose.py  # 
  |
  |---data_factory.py  # 整合dataset和sample，构建完整的pipeline

该结构这样设计的目的是拆分和精细化每一个步骤，看过论文的知道，CenterNet可以很好地在目标检测、3D检测、人体姿态等任务上迁移，所以作者这样设计datasets更方便我们随意结合，同时，如果我们想使用自己的数据集也会很方便。

下文是详细解释，只想直接用懒得细看请移步：https://blog.csdn.net/weixin_43509263/article/details/100799415

我的任务是目标检测，采用Ccco数据集，使用CenterNet，所以简化文件结构，保留如下：

datasets  
  |---dataset  
        |---coco.py
  |---sample
        |---ctdet.py   # CenterNet
  |---data_factory.py  

'''
实际上，一般构建Dataset我们都会继承torch.utils.data.Dataset, 
       一般都会重写__init__ 、__getitem__ 和 __len__ 三个函数，
这里，__init__、__len__在dataset实现，而 __getitem__在sample中
'''

dataset中coco.py解析coco数据集：

"""
    对coco数据集进行解析
    
    def __init__(self, opt, split): 解析数据集中各属性
    def __len__(self): 返回样本数

    def run_eval(self, results, save_dir): eval接口
       \-- def save_results(self, results, save_dir): 保存结果
              \-- def convert_eval_format(self, all_bboxes): 将自己的结果 转换成coco要求的验证格式
"""
import pycocotools.coco as coco
import pycocotools.cocoeval as COCOeval
import numpy as np
import json
import os

import torch.utils.data as data

class COCO(data.Dataset): 

    num_classes = 80
    default_resolution = [512, 512]
    mean = np.array([0.40789654, 0.44719302, 0.47026115],
                    dtype=np.float32).reshape(1, 1, 3)
    std = np.array([0.28863828, 0.27408164, 0.27809835],
                   dtype=np.float32).reshape(1, 1, 3)

    def __init__(self, opt, split):
        '''
        :param opt: opt是传入的参数对象，在opt.py中
        :param split: train\val\test
        '''
        super(COCO, self).__init__()
        ## self.data_dir、img_dir、annot_dir
        self.data_dir = os.path.join(opt.data_dir, 'coco')
        self.img_dir = os.path.join(self.data_dir, '{}2017'.format(split))
        if split == 'test':
            self.annot_path = os.path.join(
                self.data_dir, 'annotations', 'image_info_test-dec2017.json')
        else:
            self.annot_path = os.path.join(
                    self.data_dir, 'annotations',
                    'instances_{}2017.json').format(split)

        ''' ???????????????????/ '''
        self.max_objs = 128
        # 类别名 加上__background__共81个
        self.class_name = [
            '__background__', 'person', 'bicycle', 'car', 'motorcycle', 'airplane',
            'bus', 'train', 'truck', 'boat', 'traffic light', 'fire hydrant',
            'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse',
            'sheep', 'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'backpack',
            'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis',
            'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove',
            'skateboard', 'surfboard', 'tennis racket', 'bottle', 'wine glass',
            'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple', 'sandwich',
            'orange', 'broccoli', 'carrot', 'hot dog', 'pizza', 'donut', 'cake',
            'chair', 'couch', 'potted plant', 'bed', 'dining table', 'toilet', 'tv',
            'laptop', 'mouse', 'remote', 'keyboard', 'cell phone', 'microwave',
            'oven', 'toaster', 'sink', 'refrigerator', 'book', 'clock', 'vase',
            'scissors', 'teddy bear', 'hair drier', 'toothbrush']
        # 类别id（共80个，中间有缺失）
        self._valid_ids = [
            1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13,
            14, 15, 16, 17, 18, 19, 20, 21, 22, 23,
            24, 25, 27, 28, 31, 32, 33, 34, 35, 36,
            37, 38, 39, 40, 41, 42, 43, 44, 46, 47,
            48, 49, 50, 51, 52, 53, 54, 55, 56, 57,
            58, 59, 60, 61, 62, 63, 64, 65, 67, 70,
            72, 73, 74, 75, 76, 77, 78, 79, 80, 81,
            82, 84, 85, 86, 87, 88, 89, 90]

        self.cat_ids = {v: i for i, v in enumerate(self._valid_ids)} # 给类别id编号1-80
        ''' ???????????????????/ '''
        self.voc_color = [(v // 32 * 64 + 64, (v // 8) % 4 * 64, v % 8 * 32) \
                          for v in range(1, self.num_classes + 1)]
        ''' ???????????????????/ '''
        self._data_rng = np.random.RandomState(123)
        ''' ???????????????????/ '''
        self._eig_val = np.array([0.2141788, 0.01817699, 0.00341571],
                                 dtype=np.float32)
        ''' ???????????????????/ '''
        self._eig_vec = np.array([
            [-0.58752847, -0.69563484, 0.41340352],
            [-0.5832747, 0.00994535, -0.81221408],
            [-0.56089297, 0.71832671, 0.41158938]
        ], dtype=np.float32)

        self.split = split
        self.opt = opt

        print('==> initializing coco 2017 {} data.'.format(split))
        self.coco = coco.COCO(self.annot_path)
        self.images = self.coco.getImgIds()  # list: image_id
        self.num_samples = len(self.images)

        print('Loaded {} {} samples'.format(split, self.num_samples))

    def _to_float(self, x):
        ''' 两位浮点数 '''
        return float("{:.2f}".format(x))

    def convert_eval_format(self, all_bboxes):
        ''' 转换成coco要求的验证格式 '''
        # import pdb; pdb.set_trace()
        detections = []
        for image_id in all_bboxes:
            for cls_ind in all_bboxes[image_id]:
                category_id = self._valid_ids[cls_ind - 1]
                for bbox in all_bboxes[image_id][cls_ind]:
                    bbox[2] -= bbox[0]
                    bbox[3] -= bbox[1]
                    score = bbox[4]
                    bbox_out = list(map(self._to_float, bbox[0:4]))

                    detection = {
                        "image_id": int(image_id),
                        "category_id": int(category_id),
                        "bbox": bbox_out,
                        "score": float("{:.2f}".format(score))
                    }
                    if len(bbox) > 5:
                        extreme_points = list(map(self._to_float, bbox[5:13]))
                        detection["extreme_points"] = extreme_points
                    detections.append(detection)
        return detections

    def __len__(self):
        return self.num_samples

    def save_results(self, results, save_dir):
        ''' 保存结果json为要求的格式 '''
        json.dump(self.convert_eval_format(results),
                  open('{}/results.json'.format(save_dir), 'w'))

    def run_eval(self, results, save_dir):
        ''' eval接口 '''
        # result_json = os.path.join(save_dir, "results.json")
        # detections  = self.convert_eval_format(results)
        # json.dump(detections, open(result_json, "w"))
        self.save_results(results, save_dir)
        coco_dets = self.coco.loadRes('{}/results.json'.format(save_dir))
        coco_eval = COCOeval(self.coco, coco_dets, "bbox")
        coco_eval.evaluate()
        coco_eval.accumulate()
        coco_eval.summarize()

sample中ctdet.py提取所需数据格式：


import torch.utils.data as data
import numpy as np
import torch
import json
import cv2
import os
from utils.image import flip, color_aug
from utils.image import get_affine_transform, affine_transform
from utils.image import gaussian_radius, draw_umich_gaussian, draw_msra_gaussian
from utils.image import draw_dense_reg
import math


class CTDetDataset(data.Dataset):
    def _coco_box_to_bbox(self, box):
        bbox = np.array([box[0], box[1], box[0] + box[2], box[1] + box[3]],
                        dtype=np.float32)
        return bbox

    def _get_border(self, border, size):
        i = 1
        while size - border // i <= border // i:
            i *= 2
        return border // i

    def __getitem__(self, index):
        img_id = self.images[index]
        file_name = self.coco.loadImgs(ids=[img_id])[0]['file_name']
        img_path = os.path.join(self.img_dir, file_name)
        ann_ids = self.coco.getAnnIds(imgIds=[img_id])
        anns = self.coco.loadAnns(ids=ann_ids)
        num_objs = min(len(anns), self.max_objs)

        img = cv2.imread(img_path)

        height, width = img.shape[0], img.shape[1]
        c = np.array([img.shape[1] / 2., img.shape[0] / 2.], dtype=np.float32)
        if self.opt.keep_res:
            input_h = (height | self.opt.pad) + 1
            input_w = (width | self.opt.pad) + 1
            s = np.array([input_w, input_h], dtype=np.float32)
        else:
            s = max(img.shape[0], img.shape[1]) * 1.0
            input_h, input_w = self.opt.input_h, self.opt.input_w

        flipped = False
        if self.split == 'train':
            if not self.opt.not_rand_crop:
                s = s * np.random.choice(np.arange(0.6, 1.4, 0.1))
                w_border = self._get_border(128, img.shape[1])
                h_border = self._get_border(128, img.shape[0])
                c[0] = np.random.randint(low=w_border, high=img.shape[1] - w_border)
                c[1] = np.random.randint(low=h_border, high=img.shape[0] - h_border)
            else:
                sf = self.opt.scale
                cf = self.opt.shift
                c[0] += s * np.clip(np.random.randn() * cf, -2 * cf, 2 * cf)
                c[1] += s * np.clip(np.random.randn() * cf, -2 * cf, 2 * cf)
                s = s * np.clip(np.random.randn() * sf + 1, 1 - sf, 1 + sf)

            if np.random.random() < self.opt.flip:
                flipped = True
                img = img[:, ::-1, :]
                c[0] = width - c[0] - 1

        trans_input = get_affine_transform(
            c, s, 0, [input_w, input_h])
        inp = cv2.warpAffine(img, trans_input,
                             (input_w, input_h),
                             flags=cv2.INTER_LINEAR)
        inp = (inp.astype(np.float32) / 255.)
        if self.split == 'train' and not self.opt.no_color_aug:
            color_aug(self._data_rng, inp, self._eig_val, self._eig_vec)
        inp = (inp - self.mean) / self.std
        inp = inp.transpose(2, 0, 1)

        output_h = input_h // self.opt.down_ratio
        output_w = input_w // self.opt.down_ratio
        num_classes = self.num_classes
        trans_output = get_affine_transform(c, s, 0, [output_w, output_h])

        hm = np.zeros((num_classes, output_h, output_w), dtype=np.float32)
        wh = np.zeros((self.max_objs, 2), dtype=np.float32)
        dense_wh = np.zeros((2, output_h, output_w), dtype=np.float32)
        reg = np.zeros((self.max_objs, 2), dtype=np.float32)
        ind = np.zeros((self.max_objs), dtype=np.int64)
        reg_mask = np.zeros((self.max_objs), dtype=np.uint8)
        cat_spec_wh = np.zeros((self.max_objs, num_classes * 2), dtype=np.float32)
        cat_spec_mask = np.zeros((self.max_objs, num_classes * 2), dtype=np.uint8)

        draw_gaussian = draw_msra_gaussian if self.opt.mse_loss else \
            draw_umich_gaussian

        gt_det = []
        for k in range(num_objs):
            ann = anns[k]
            bbox = self._coco_box_to_bbox(ann['bbox'])
            cls_id = int(self.cat_ids[ann['category_id']])
            if flipped:
                bbox[[0, 2]] = width - bbox[[2, 0]] - 1
            bbox[:2] = affine_transform(bbox[:2], trans_output)
            bbox[2:] = affine_transform(bbox[2:], trans_output)
            bbox[[0, 2]] = np.clip(bbox[[0, 2]], 0, output_w - 1)
            bbox[[1, 3]] = np.clip(bbox[[1, 3]], 0, output_h - 1)
            h, w = bbox[3] - bbox[1], bbox[2] - bbox[0]
            if h > 0 and w > 0:
                radius = gaussian_radius((math.ceil(h), math.ceil(w)))
                radius = max(0, int(radius))
                radius = self.opt.hm_gauss if self.opt.mse_loss else radius
                ct = np.array(
                    [(bbox[0] + bbox[2]) / 2, (bbox[1] + bbox[3]) / 2], dtype=np.float32)
                ct_int = ct.astype(np.int32)
                draw_gaussian(hm[cls_id], ct_int, radius)
                wh[k] = 1. * w, 1. * h
                ind[k] = ct_int[1] * output_w + ct_int[0]
                reg[k] = ct - ct_int
                reg_mask[k] = 1
                cat_spec_wh[k, cls_id * 2: cls_id * 2 + 2] = wh[k]
                cat_spec_mask[k, cls_id * 2: cls_id * 2 + 2] = 1
                if self.opt.dense_wh:
                    draw_dense_reg(dense_wh, hm.max(axis=0), ct_int, wh[k], radius)
                gt_det.append([ct[0] - w / 2, ct[1] - h / 2,
                               ct[0] + w / 2, ct[1] + h / 2, 1, cls_id])

        ret = {'input': inp, 'hm': hm, 'reg_mask': reg_mask, 'ind': ind, 'wh': wh}
        if self.opt.dense_wh:
            hm_a = hm.max(axis=0, keepdims=True)
            dense_wh_mask = np.concatenate([hm_a, hm_a], axis=0)
            ret.update({'dense_wh': dense_wh, 'dense_wh_mask': dense_wh_mask})
            del ret['wh']
        elif self.opt.cat_spec_wh:
            ret.update({'cat_spec_wh': cat_spec_wh, 'cat_spec_mask': cat_spec_mask})
            del ret['wh']
        if self.opt.reg_offset:
            ret.update({'reg': reg})
        if self.opt.debug > 0 or not self.split == 'train':
            gt_det = np.array(gt_det, dtype=np.float32) if len(gt_det) > 0 else \
                np.zeros((1, 6), dtype=np.float32)
            meta = {'c': c, 's': s, 'gt_det': gt_det, 'img_id': img_id}
            ret['meta'] = meta
        return ret

data_factory设计Dataset接口：

# from .sample.ddd import DddDataset
# from .sample.exdet import EXDetDataset
from .sample.ctdet import CTDetDataset
# from .sample.multi_pose import MultiPoseDataset

from .dataset.coco import COCO

# 参数名：类名， 通过传入参数，调用相应类
data_factory = {
    'coco': COCO,
    # 'pascal': PascalVOC,
    # 'kitti': KITTI,
    # 'coco_hp': COCOHP
}
_sample_factory = {
    # 'exdet': EXDetDataset,  # ExtremeNet Detector.
    'ctdet': CTDetDataset,  # CenterNet Detector
    # 'ddd': DddDataset,      # 3D Detection
    # 'multi_pose': MultiPoseDataset  # human pose
}

def get_dataset(dataset, task):
    '''
        Dataset继承了data_factory和sample_factory两类，可以调用父类的方法，合成了一个完整的dataset
        实际上，一般构建Dataset我们都会继承torch.utils.data.Dataset, 
               一般都会重写__init__ 、__getitem__ 和 __len__ 三个函数，
        这里，__init__、__len__在dataset实现，而 __getitem__在sample中
    :param dataset: 数据集名称
    :param task: 使用网络/目标任务
    :return:
    '''
    class Dataset(data_factory[dataset],_sample_factory[task]):
        pass
    return Dataset

调用方法：

''' 调用方法 '''
Dataset = get_dataset('coco','ctdet')
val_loader = torch.utils.data.DataLoader(
      Dataset(opt, 'val'), 
      batch_size=1, 
      shuffle=False,
      num_workers=1,
      pin_memory=True
  )

目标检测系列专栏：从基础到进阶，一步步掌握目标检测技术小厂程序猿目标检测专栏目标检测人工智能计算机视觉
引言目标检测（ObjectDetection）是计算机视觉领域的一个重要研究方向，它旨在识别和定位图像中的物体。随着深度学习技术的发展，目标检测技术取得了显著的进步，广泛应用于自动驾驶、智能监控、机器人视觉等领域。在这个专栏中，我们将从基础知识开始，逐步深入到目标检测的各个方向，帮助大家全面了解和掌握这一领域的技术。专栏内容安排第一部分：基础知识目标检测概述：介绍目标检测的基本概念、应用场景和发展
如何探索和可视化用于图像中物体检测的 ML 数据虚无火星车 python 深度学习人工智能
近年来，人们越来越认识到深入理解机器学习数据（ML-data）的必要性。不过，鉴于检测大型数据集往往需要耗费大量人力物力，它在计算机视觉（computervision）领域的广泛应用，尚有待进一步开发。通常，在物体检测（ObjectDetection，属于计算机视觉的一个子集）中，通过定义边界框，来定位图像中的物体，不仅可以识别物体，还能够了解物体的上下文、大小、以及与场景中其他元素的关系。同时，
怎么理解目标检测当中的mAP 少寨主的互联网洞察
最近在做目标检测和分类的一个任务，再别人的模型当中，看见人家总是使用mAP去衡量一个模型的好坏或者优劣，而且频次还不少，那这个到底是个什么东东呢？下面来看看mPA是ObjectDetection算法中衡量算法的精确度的指标，涉及两个概念：查准率Precision、查全率Recall。对于objectdetection任务，每一个object都可以计算出其Precision和Recall，多次计算/
Python中使用opencv-python进行人脸检测雪域迷影 OpenCV Python编程编程语言学习 opencv python 人工智能
Python中使用opencv-python进行人脸检测之前写过一篇VC++中使用OpenCV进行人脸检测的博客。以数字图像处理中经常使用的lena图像为例，如下图所示：使用OpenCV进行人脸检测十分简单，OpenCV官网给了一个Python人脸检测的示例程序，objectDetection.py代码如下：from__future__importprint_functionimportcv2as
Biu懂AI：Object Detection训练数据的Label格式 WPG大大通人工智能目标检测计算机视觉大大通智能家居汽车
Bui~新系列博文将专注AI相关领域，想要学习高通蓝牙相关知识请查看之前的系列或关注大博主声波电波就看今朝在CV（computervision）中，Objectdetection是其中的一个核心任务，它可以在输入图像或视频中识别并框出目标。这种应用在生活中应用很多，例如停车场的车牌识别，监控的物体识别，智能驾驶的车道车辆识别等等。平常我们不会看到它是怎么框出识别物的，但是在debug模式下我们经常
【大厂AI课学习笔记】1.5 AI技术领域（6）目标检测 giszz 人工智能学习笔记人工智能学习笔记
目标检测是CV中的重要场景。在图像中定位感兴趣的目标，准确判断每个目标的类别，并给出每个目标的边界框。上图是目标检测的典型应用案例。目标检测的难点是小目标的高精度检测。目前主要的应用领域是机器人导航、自动驾驶、智能视频监督、工业检测、人脸识别等。目标检测（ObjectDetection）在计算机视觉（CV）中的深入剖析一、定义目标检测是计算机视觉领域中的一个核心任务，旨在让计算机能够自动识别和定位
目标检测SSD：训练自己的数据集 BigCowPeking 目标检测算法安装 SSD
最近一直在搞objectdetection玩，之前用的是faster-rcnn，准确率方面73.2%，效果还不错，但是识别速度有点欠缺，我用的GPU是GTX980ti,识别速度大概是15fps.最近发现SSD(singleshotmultiboxdetector)这篇论文效果和速度都不错，我自己实验了一下，速度确实比faster-rcnn快不少。下面分两部分来介绍。第一部分介绍SSD的安装，第二部
小型目标检测模型调研 m0_73407633 目标检测目标跟踪人工智能
一、简介、概述1、目标检测：目标检测（ObjectDetection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域2最具有挑战性的问题。2、小型目标定义：相对尺度定义从目标与图像的相对比对小目标进行定义。Chen等提出了一个针对小目标的数据集，对
目标检测：1预备知识 proing AI 目标检测人工智能计算机视觉模型框架
开始涉及目标检测内容，总结一下学习记录1、目标检测的基本概念（一）什么是目标检测目标检测（ObjectDetection）的任务是找出图像中所有感兴趣的目标（物体），不同于分类和回归问题，目标检测还需要确定目标在图像中的位置（定位），而确定识别目标的类别和位置（分类和定位），是计算机视觉领域的核心问题之一。（二）目标检测的任务计算机视觉中关于图像识别有四大类任务：（1）分类-Classificat
Kai - Golang实现的目标检测云服务 yummy_bian
YOLO/Darknet是目前比较流行的ObjectDetection算法（后面统一称为Darknet），在GPU上的表现不但速度快而且准确率很高。但是使用起来不方便，只提供了命令行接口和简单的Python接口。所以我想用RESTful来实现一个云端的Darknet服务kai。选择用Go的原因不是考虑并发，而是goroutine之间的同步能方便的处理，适合实现Pipeline的功能。问题来了，Da
【深度学习每日小知识】Object Detection 目标检测 jcfszxc 深度学习术语表专栏深度学习目标检测人工智能
Objectdetection目标检测对象检测是计算机视觉中的一项任务，涉及识别和定位图像或视频中的对象。它对于许多应用来说都是一项重要功能，包括图像和视频分析、机器人和监控。计算机视觉中的目标检测如何工作？对象检测有多种方法，包括基于手工特征的传统方法和基于深度学习的最新方法。传统方法通常涉及从图像中提取一组手工制作的特征，例如颜色、纹理和形状，并使用这些特征来训练分类器来识别对象。最近基于深度
VC++中使用OpenCV进行人脸检测雪域迷影 OpenCV Visual C++和MFC QT编程学习 opencv c++人工智能
VC++中使用OpenCV进行人脸检测对于上面的图像，如何使用OpenCV进行人脸检测呢？使用OpenCV进行人脸检测十分简单，OpenCV官网给了一个Python人脸检测的示例程序，objectDetection.py代码如下：from__future__importprint_functionimportcv2ascvimportargparsedefdetectAndDisplay(fram
目标检测--01 普通研究者计算机视觉面试题深度学习目标检测人工智能计算机视觉
基本概念什么是目标检测？目标检测（ObjectDetection）的任务是找出图像中所有感兴趣的目标（物体），确定它们的类别和位置，是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态，加上成像时光照、遮挡等因素的干扰，目标检测一直是计算机视觉领域最具有挑战性的问题。计算机视觉中关于图像识别有四大类任务：分类-Classification：解决“是什么？”的问题，即给定一张图片或一
jetson-inference入门小豆包的小朋友0217 jeson nano部署嵌入式硬件
jetson-inference文章目录jetson-inference前言一、jetson-inference二、下载传输三、docker的安装使用总结前言jetson部署相关内容一、jetson-inference官方推出的体验套餐，提供了三种最常见的AI应用与计算机视觉的类型图像辨识（ImageRecognition)-----Imagenet对象辨识（ObjectDetection)---
将数据集转成COCO格式，单个文件夹转为单个json文件，例如.../images/train转为instance_train.json 孟孟单单深度学习项目经验tips json yolo转coco
写在前面参考链接：objectdetection-tricks/tricks_4.py相关视频教学：tricks_4用于yolov5和v7中的yolo格式转换coco格式的脚本.(如何在v5和v7中输出ap_small,ap_middle,ap_largecoco指标)代码效果：将数据集转成COCO格式，单个文件夹转为单个json文件，例如…/images/train转为instance_trai
YOLOv7-tiny，通过pycocotools包得到预测大中小尺寸目标的指标值孟孟单单深度学习项目经验tips YOLO 尺寸
文章目录参考链接步骤认识正确的instances_val2017.json文件格式代码（mogui_tococo.py，用于我自己的数据集）参考链接需要先在环境中安装pycocotoolspipinstallpycocotools魔鬼面具的代码：objectdetection-tricks/tricks_4.py相关视频教学：tricks_4用于yolov5和v7中的yolo格式转换coco格式的
yolov5详解与改进 cv-daily YOLO
参考：https://www.xjx100.cn/news/215104.html?action=onClickhttps://github.com/z1069614715/objectdetection_script
计算机视觉技术-目标检测和边界框白云如幻人工智能代码笔记计算机视觉目标检测人工智能
在图像分类任务中，我们假设图像中只有一个主要物体对象，我们只关注如何识别其类别。然而，很多时候图像里有多个我们感兴趣的目标，我们不仅想知道它们的类别，还想得到它们在图像中的具体位置。在计算机视觉里，我们将这类任务称为目标检测（objectdetection）或目标识别（objectrecognition）。目标检测在多个领域中被广泛使用。例如，在无人驾驶里，我们需要通过识别拍摄到的视频图像里的车辆
【深度学习】目标检测，实例分割，语义分割逐一对比 code bean 深度学习深度学习目标检测人工智能
提问：目标检测，实例分割，语义分割，有什么区别？目标检测（ObjectDetection），实例分割（InstanceSegmentation）和语义分割（SemanticSegmentation）是计算机视觉领域中三个相关但有着不同任务和目标的问题。下面是它们的简要区别：目标检测（ObjectDetection）：任务描述：目标检测的任务是在图像或视频中定位和识别多个对象，并为每个对象提供边界框
14、Numpy字符串函数 phinoo Numpy Numpy字符串字符串操作 Numpu字符串操作 Numpy.char
1、番外说明大家好，我是小P，本系列是本人对Python模块Numpy的一些学习记录，总结于此一方面方便其它初学者学习，另一方面害怕自己遗忘，希望大家喜欢。此外，对“目标检测/模型压缩/语义分割”感兴趣的小伙伴，欢迎加入QQ群813221712讨论交流，进群请看群公告！（可以点击如下连接直接加入！）点击链接加入群聊【ObjectDetection】：https://jq.qq.com/?_wv=1
人工智能与神经元的内容梳理（持续更新）妇男主任 AIGC
人工智能与神经元的内容梳理一、背景二、预备基础三、书籍1.《微积分》2.《线性代数》3.《统计学》4.《DeepLearning》四、社区与资源五、工具与框架六、学习路径1.逻辑回归,线性回归2.损失函数七、相关论文[^1]一.计算机视觉相关(ComputerVisionRelatedSurveys)A).物体检测(ObjectDetection)B).图像分割(ImageSegmentation
【YOLOv5入门】目标检测爱干饭的猿 yolo YOLO 目标检测目标跟踪
【大家好，我是爱干饭的猿，本文重点介绍YOLOv5入门-目标检测的任务、性能指标、yolo算法基本思想、yolov5网络架构图。后续会继续分享其他重要知识点总结，如果喜欢这篇文章，点个赞，关注一下吧】上一篇文章：《【python高级】asyncio并发编程》YOLOv5入门1.目标检测-任务目标检测(ObjectDetection)=What,andWhere类别标签（Categorylabel）
vscode权威指南 pdf_zotero+坚果云，免费跨平台文献管理最佳实践指南 weixin_39540018 vscode权威指南 pdf
zotero，文献管理工具中的VSCode作为“最佳实践”的忠实拥趸，在我发现电脑上的paper已经很难用层级文件夹进行存放的时候，便开始尝试寻找一个“完美”的文献管理软件。我希望心目中的ta有下面这几个特点（按重要性排序）：对文献进行有效归类：用层级文件夹进行管理的缺点在于检索、整理的困难。最好能够为文献打上不同的标签，并且根据标签进行检索。比如“objectdetection”、“GAN”、“
转　SSD论文解读 weixin_30371875
Preface这是今年ECCV2016的一篇文章，是UNCChapelHill（北卡罗来纳大学教堂山分校）的WeiLiu大神的新作，论文代码：https://github.com/weiliu89/caffe/tree/ssd有几点更新：1.看到一篇blog对检测做了一个总结、收集，强烈推荐：ObjectDetection2.还有，今天在微博上看到VOC2012的榜单又被刷新了，微博原地址为：这里
SSD安装及训练自己的数据集 zhang_shuai12 深度学习 ssd caffe
最近一直在搞objectdetection玩，之前用的是faster-rcnn，准确率方面73.2%，效果还不错，但是识别速度有点欠缺，我用的GPU是GTX980ti,识别速度大概是15fps.最近发现SSD(singleshotmultiboxdetector)这篇论文效果和速度都不错，我自己实验了一下，速度确实比faster-rcnn快不少。下面分两部分来介绍。第一部分介绍SSD的安装，第二部
django api_使用Django API Deeplabv3进行语义分割 weixin_26630173 python java
djangoapi介绍(Introduction)Imagesegmentationhasbeenahottopicforawhilenow.Varioususescasesinvolvingsegmentationhademergedinabunchofdifferentareas,machinevision,medicalimaging,objectdetection,recognitiont
【开放域目标检测】一：Open-Vocabulary Object Detection Using Captions论文讲解旅途中的宽~ 开放域目标检测目标检测经典论文导读目标检测计算机视觉 Open-Vocabulary
出发点是制定一种更加通用的目标检测问题，目的是借助于大量的image-caption数据来覆盖更多的objectconcept，使得objectdetection不再受限于带标注数据的少数类别，从而实现更加泛化的objectdetection，识别出更多novel的物体类别。文章目录一、背景&动机二、Open-Vocabulary的简单引入三、Open-Vocabulary/zero-shot/w
【计算机视觉】24-Object Detection 小白有颗大白梦计算机视觉计算机视觉目标检测人工智能
文章目录24-ObjectDetection1.Introduction2.Methods2.1SlidingWindow2.2R-CNN:Region-BasedCNN2.3FastR-CNN2.4FasterR-CNN:LearnableRegionProposals2.5Resultsofobjectsdetection3.SummaryReference24-ObjectDetection
【目标检测】可视化COCO数据集目标框&多边形标注 ericdiii 目标检测目标检测计算机视觉 opencv
1.ObjectDetection目标框可视化OpenCV:importjsonimportos,cv2train_json='C:/Users/wang/Desktop/train/train_33485.json'train_path='C:/Users/wang/Desktop/train/jpeg/'defvisualization_bbox1(num_image,json_path,im
2018目标检测算法总览迷人苏烟
转载自：https://blog.csdn.net/u014380165/article/details/80784147CVPR2018上关于目标检测（objectdetection）的论文比去年要多很多，而且大部分都有亮点。从其中挑了几篇非常有意思的文章，特来分享，每篇文章都有详细的博客笔记，可以点击链接阅读。1、CascadedRCNN论文：CascadeR-CNNDelvingintoHi
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

CenterNet代码之datasets

你可能感兴趣的:(#,ObjectDetection)