sugarkss

FairMOT训练kitti tracking数据集的汽车类（参考FairVehicle）

工作情况：
kitti数据集的标签（转换成FairMOT类似的gt）

以下是处理图片和gt文本的程序操作，仅做个人记录！！！

1.将原先kitti tracking数据集的标签修改去掉type用文本来表示改成数字代表同时将空格改成逗号

效果图

kitti tracking 标签含义：
The label files contain the following information, which can be read and
written using the matlab tools (readLabels.m) provided within this devkit. 
All values (numerical or strings) are separated via spaces, each row 
corresponds to one object. The 17 columns represent:

#Values    Name      Description
----------------------------------------------------------------------------
   1    frame        Frame within the sequence where the object appearers
   1    track id     Unique tracking id of this object within this sequence
   1    type         Describes the type of object: 'Car', 'Van', 'Truck',
                     'Pedestrian', 'Person_sitting', 'Cyclist', 'Tram',
                     'Misc' or 'DontCare'
   1    truncated    Integer (0,1,2) indicating the level of truncation.
                     Note that this is in contrast to the object detection
                     benchmark where truncation is a float in [0,1].
   1    occluded     Integer (0,1,2,3) indicating occlusion state:
                     0 = fully visible, 1 = partly occluded
                     2 = largely occluded, 3 = unknown
   1    alpha        Observation angle of object, ranging [-pi..pi]
   4    bbox         2D bounding box of object in the image (0-based index):
                     contains left, top, right, bottom pixel coordinates
   3    dimensions   3D object dimensions: height, width, length (in meters)
   3    location     3D object location x,y,z in camera coordinates (in meters)
   1    rotation_y   Rotation ry around Y-axis in camera coordinates [-pi..pi]
   1    score        Only for results: Float, indicating confidence in
                     detection, needed for p/r curves, higher is better.

附转换代码：

import os
import numpy as np
import pandas as pd
import os.path as osp


def replace(file, old_content, new_content):
    content = read_file(file)
    content = content.replace(old_content, new_content)
    rewrite_file(file, content)

# 读文件内容
def read_file(file):
    with open(file, encoding='UTF-8') as f:
        read_all = f.read()
        f.close()

    return read_all

# 写内容到文件
def rewrite_file(file, data):
    with open(file, 'w', encoding='UTF-8') as f:
        f.write(data)
        f.close()

src_data='/media/ckq/data/kitti/MOT/images/train'
seqs = [s for s in os.listdir(src_data)]
#print(seqs)
for seq in seqs:
    path=osp.join(src_data,seq,'gt/gt.txt')
    # seq_gt_path = osp.join(src_data, seq, 'gt/gt.txt')
    # print(seq_gt_path)
    # gt = np.loadtxt(seq_gt_path, dtype=np.str, delimiter=',')  # 加载成np格式
    # print(str(gt))
    replace(path, ' ', ',')
    replace(path, 'DontCare', '10')
    replace(path, 'Person', '1')
    replace(path, 'Pedestrian', '2')
    replace(path, 'Car', '3')
    replace(path, 'Person_sitting', '4')
    replace(path, 'Cyclist', '5')
    replace(path, 'Van', '6')
    replace(path, 'Truck', '7')
    replace(path, 'Tram', '8')
    replace(path, 'Misc', '9')

2.之后开始给每个数据及的每张图片进行标签：首先说一下我的需求是标注Car： kitti数据集标签生成 gen_lables_kitti_car.py：

附代码（对照FairMOT 和`FairVehicle的生成标签代码写）：

import os.path as osp
import os
import shutil
import numpy as np


def mkdirs(d):
    # if not osp.exists(d):
    if not osp.isdir(d):
        os.makedirs(d)

data_root = '/media/ckq/data/kitti/'
seq_root = data_root + 'MOT/images/train'
label_root = data_root + 'MOT/labels_with_ids/train'

if not os.path.isdir(label_root):
    mkdirs(label_root)
else:  # 如果之前已经生成过: 递归删除目录和文件, 重新生成目录
    shutil.rmtree(label_root)
    os.makedirs(label_root)


cls_map = {
    'Person=1'
    'Pedestrian=2'
    'Car=3'
    'Person_sitting=4'
    'Cyclist=5'
    'Van=6'
    'Truck=7'
    'Tram=8'
    'Misc=9'
    'DontCare=10'
}

print("Dir %s made" % label_root)
#seqs = [s for s in os.listdir(seq_root)]
#seqs=['0000']

seqs=['0000', '0001', '0002', '0003',
      '0004', '0005', '0006', '0007',
      '0008', '0009', '0010', '0011',
      '0012', '0014', '0015', '0018',
      '0019', '0020']
#打印序列
print(seqs)


tid_curr = 0
tid_last = -1
total_track_id_num = 0
for seq in seqs:  # 每段视频都对应一个gt.txt
    print("Process %s, " % seq, end='')

    seq_info_path = osp.join(seq_root, seq, 'seqinfo.ini')   #提取每个数据的info信息 /media/ckq/data/kitti/MOT/images/train
    #print(seq_info_path)
    with open(seq_info_path) as seq_info_h:  # 读取 *.ini 文件
        seq_info = seq_info_h.read()
        seq_width = int(seq_info[seq_info.find('imWidth=') + 8:seq_info.find('\nimHeight')])  # 视频的宽
        seq_height = int(seq_info[seq_info.find('imHeight=') + 9:seq_info.find('\nimExt')])  # 视频的高
        #print('seq_width:',seq_width)
        #print('seq_height:', seq_height)

    gt_txt = osp.join(seq_root, seq, 'gt', 'gt.txt')  # 读取GT文件
    #print(gt_txt)  #打印路径
    #gt = np.loadtxt(gt_txt, dtype=np.str, delimiter=',')  # 加载成np格式

    gt = np.loadtxt(gt_txt, dtype=np.float64, delimiter=',')  # 加载成np格式
    # print(gt)  #打印文本内容
    # print('gt.T')
    # print(gt.T) #也是打印文本内容
    idx = np.lexsort(gt.T[:2, :])  # 优先按照track id排序(对视频帧进行排序, 而后对轨迹ID进行排序)
    # print(idx)
    gt = gt[idx, :]

    tr_ids = set(gt[:, 1])
    print("%d track ids in seq %s" % (len(tr_ids), seq))
    total_track_id_num += len(tr_ids)  # track id统计数量如何正确计算？

    seq_label_root = osp.join(label_root, seq, 'img1')
    mkdirs(seq_label_root)

    # 读取GT数据的每一行(一行即一条数据)
    # for fid, tid, x, y, w, h, mark, cls, vis_ratio in gt:
    for fid, tid, type, truncated, occluded, alpha, \
        bbox_left, bbox_top, bbox_right ,bbox_bottom ,_,_,_,_,_,_,_ in gt:
        #height, width, length , location_x,location_y,location_z , rotation_y in gt:
        # frame_id, track_id, top, left, width, height, mark, class, visibility ratio
        #if cls != 3:  # 我们需要Car的标注数据
        if type != 3:  # 我们需要Car的标注数据
            continue

        # if mark == 0:  # mark为0时忽略(不在当前帧的考虑范围)
        #     continue

        # if vis_ratio <= 0.2:
        #     continue

        fid = int(fid)
        tid = int(tid)

        # 判断是否是同一个track, 记录上一个track和当前track
        if not tid == tid_last:  # not 的优先级比 == 高
            tid_curr += 1
            tid_last = tid
        #由于kitti标签与训练标签参数有点不同 需要自己计算 x y w h
        w=float(bbox_right-bbox_left)
        h=float(bbox_bottom-bbox_top)
        x=int(bbox_left+0.5)
        y=int(bbox_top+0.5)

        # bbox中心点坐标
        x += w / 2
        y += h / 2


        # 网label中写入track id, bbox中心点坐标和宽高(归一化到0~1)
        # 第一列的0是默认只对一种类别进行多目标检测跟踪(0是类别)
        label_str = '0 {:d} {:.6f} {:.6f} {:.6f} {:.6f}\n'.format(
            tid_curr,
            x / seq_width,   # center_x
            y / seq_height,  # center_y
            w / seq_width,   # bbox_w
            h / seq_height)  # bbox_h
        # print(label_str.strip())

        label_f_path = osp.join(seq_label_root, '{:06d}.txt'.format(fid))
        with open(label_f_path, 'a') as f:  # 以追加的方式添加每一帧的label
            f.write(label_str)

print("Total %d track ids in this dataset" % total_track_id_num)
print('Done')


kitti数据集标签生成 gen_lables_kitti_car.py：(Car Van Truck)
import os.path as osp
import os
import shutil
import numpy as np


def mkdirs(d):
    # if not osp.exists(d):
    if not osp.isdir(d):
        os.makedirs(d)

data_root = '/media/ckq/data/kitti/'
seq_root = data_root + 'MOT/images/train'
label_root = data_root + 'MOT/labels_with_ids/train'

if not os.path.isdir(label_root):
    mkdirs(label_root)
else:  # 如果之前已经生成过: 递归删除目录和文件, 重新生成目录
    shutil.rmtree(label_root)
    os.makedirs(label_root)


cls_map = {
    'Person=1'
    'Pedestrian=2'
    'Car=3'
    'Person_sitting=4'
    'Cyclist=5'
    'Van=6'
    'Truck=7'
    'Tram=8'
    'Misc=9'
    'DontCare=10'
}

print("Dir %s made" % label_root)
#seqs = [s for s in os.listdir(seq_root)]
#seqs=['0000']

seqs=['0000', '0001', '0002', '0003',
      '0004', '0005', '0006', '0007',
      '0008', '0009', '0010', '0011',
      '0012', '0014', '0015', '0018',
      '0019', '0020']
#打印序列
print(seqs)


tid_curr = 0
tid_last = -1
total_track_id_num = 0
for seq in seqs:  # 每段视频都对应一个gt.txt
    print("Process %s, " % seq, end='')

    seq_info_path = osp.join(seq_root, seq, 'seqinfo.ini')   #提取每个数据的info信息 /media/ckq/data/kitti/MOT/images/train
    #print(seq_info_path)
    with open(seq_info_path) as seq_info_h:  # 读取 *.ini 文件
        seq_info = seq_info_h.read()
        seq_width = int(seq_info[seq_info.find('imWidth=') + 8:seq_info.find('\nimHeight')])  # 视频的宽
        seq_height = int(seq_info[seq_info.find('imHeight=') + 9:seq_info.find('\nimExt')])  # 视频的高
        #print('seq_width:',seq_width)
        #print('seq_height:', seq_height)

    gt_txt = osp.join(seq_root, seq, 'gt', 'gt.txt')  # 读取GT文件
    #print(gt_txt)  #打印路径
    #gt = np.loadtxt(gt_txt, dtype=np.str, delimiter=',')  # 加载成np格式

    gt = np.loadtxt(gt_txt, dtype=np.float64, delimiter=',')  # 加载成np格式
    # print(gt)  #打印文本内容
    # print('gt.T')
    # print(gt.T) #也是打印文本内容
    idx = np.lexsort(gt.T[:2, :])  # 优先按照track id排序(对视频帧进行排序, 而后对轨迹ID进行排序)
    # print(idx)
    gt = gt[idx, :]

    tr_ids = set(gt[:, 1])
    print("%d track ids in seq %s" % (len(tr_ids), seq))
    total_track_id_num += len(tr_ids)  # track id统计数量如何正确计算？

    seq_label_root = osp.join(label_root, seq, 'img1')
    mkdirs(seq_label_root)

    # 读取GT数据的每一行(一行即一条数据)
    # for fid, tid, x, y, w, h, mark, cls, vis_ratio in gt:
    for fid, tid, type, truncated, occluded, alpha, \
        bbox_left, bbox_top, bbox_right ,bbox_bottom ,_,_,_,_,_,_,_ in gt:
        #height, width, length , location_x,location_y,location_z , rotation_y in gt:
        # frame_id, track_id, top, left, width, height, mark, class, visibility ratio
        #if cls != 3:  # 我们需要Car的标注数据
        #if type != 3:  # 我们需要Car的标注数据
        flag =(type == 3 or type == 6 or type == 7)  #只要一个符合要求就是真的
        #print("flag:")
        #print(flag)

        if flag==False:  # 我们需要Car Van Truck的标注数据
            continue

        # if mark == 0:  # mark为0时忽略(不在当前帧的考虑范围)
        #     continue

        # if vis_ratio <= 0.2:
        #     continue

        fid = int(fid)
        tid = int(tid)

        # 判断是否是同一个track, 记录上一个track和当前track
        if not tid == tid_last:  # not 的优先级比 == 高
            tid_curr += 1
            tid_last = tid
        #由于kitti标签与训练标签参数有点不同 需要自己计算 x y w h
        w=float(bbox_right-bbox_left)
        h=float(bbox_bottom-bbox_top)
        x=int(bbox_left+0.5)
        y=int(bbox_top+0.5)

        # bbox中心点坐标
        x += w / 2
        y += h / 2


        # 网label中写入track id, bbox中心点坐标和宽高(归一化到0~1)
        # 第一列的0是默认只对一种类别进行多目标检测跟踪(0是类别)
        label_str = '0 {:d} {:.6f} {:.6f} {:.6f} {:.6f}\n'.format(
            tid_curr,
            x / seq_width,   # center_x
            y / seq_height,  # center_y
            w / seq_width,   # bbox_w
            h / seq_height)  # bbox_h
        # print(label_str.strip())

        label_f_path = osp.join(seq_label_root, '{:06d}.txt'.format(fid))
        with open(label_f_path, 'a') as f:  # 以追加的方式添加每一帧的label
            f.write(label_str)

print("Total %d track ids in this dataset" % total_track_id_num)
print('Done')

效果图：

其实处理好的时候很奇怪就拿kitti的0000数据来说
在该数据集下其实有154张图片，尽管kitti提够了该数据集所有的标签（每一帧都有标签）但是实际上他所提供的标签有些不是我需要的汽车标签故导致0到108的标签没有（gt.txt）
备注：有几个数据集可能某几帧根本没有标签，在gt.txt标签文件里直接跳过！！

标注完的`效果图：
验证自己处理的标签是否标注正确：

参考链接：整一个生成标签过程https://blog.csdn.net/sinat_33486980/article/details/105684839

只有car:

最后用了这个转换代码生成识别车的种类多一点！！！
含有：Car Van Truck

附代码：（图片的路径下我只放一个数据集用来测试自己标注是否正确）

# -*- coding:utf-8 -*-
import os
import cv2
import os.path as osp
'''
显示跟踪训练数据集标注
'''
root_path = "/home/ckq/Desktop/MOT"
img_dir = "images/train"
label_dir = "labels_with_ids/train"

imgs = os.listdir(root_path + "/" + img_dir)  #遍历图片数据集列表  0000 0001........
imgs.sort()
for i, img in enumerate(imgs):  #一个一个遍历
    #img_name = img[:-1]   #img[:-1] -1代表从右往左 第一个不取
    #print(img)
    img_name=img #每个图片集名字
    print(img_name)
    label_path=osp.join(root_path,label_dir,img_name,'img1')
    print(label_path)
    label_gts_name=os.listdir(label_path)
    label_gts_name.sort()
    print(label_gts_name)
    for frame_gt in label_gts_name:
        #print(frame_gt)
        frame_gt_name=frame_gt[:6]
        #print(frame_gt_name)
        label_f = open(label_path + "/" +frame_gt_name+".txt", "r") #路劲标签名
        #print(label_f)
        lines = label_f.readlines()
        print(lines)
        #print(root_path + "/" + img_dir + "/" + img+"/img/"+frame_gt_name)
        img_data = cv2.imread(root_path + "/" + img_dir + "/" + img+"/img/"+frame_gt_name+".png") #gt对应的图片序号
        #print(img_data)
        H, W, C = img_data.shape
        # print(H)
        # print(W)
        # print(C)
        for line in lines:
            line_list = line.strip().split()
            class_num = int(line_list[0])  # 类别号
            obj_ID = int(line_list[1])  # 目标ID
            x, y, w, h = line_list[2:]  # 中心坐标，宽高（经过原图宽高归一化后）
            x = int(float(x) * W)
            y = int(float(y) * H)
            w = int(float(w) * W)
            h = int(float(h) * H)
            left = int(x - w / 2)
            top = int(y - h / 2)
            right = left + w
            bottom = top + h
            cv2.circle(img_data, (x, y), 1, (0, 0, 255))
            cv2.rectangle(img_data, (left, top), (right, bottom), (0, 255, 0), 2)
            cv2.putText(img_data, str(obj_ID), (left, top), cv2.FONT_HERSHEY_COMPLEX, 0.5, (0, 0, 255), 1)
        resized_img = cv2.resize(img_data, (800, 416))
        cv2.imshow("label", resized_img)
        cv2.waitKey(100)

3.接下来生成训练文件：

效果图：

附代码：

import os
import os.path as osp
image_flder = "/home/ckq/Desktop/MOT/images/train"
imgs = os.listdir(image_flder)
#print(imgs)
train_f = open("/home/ckq/Desktop/MOT/kitt_car.train", "w")

for img_name in imgs:
    image_path=osp.join(image_flder,img_name,'img')
    print(image_path)
    image_names=os.listdir(image_path)
    image_names.sort()
    print(image_names)
    for image_name in image_names:
        save_str = image_path + '/' + image_name +"\n"
        print(save_str)
        train_f.write(save_str)

train_f.close()

这里附加一个 png格式的图片转换成jpg格式图片：

效果图：

附代码：

import os
import sys
import os.path as osp
import shutil
from PIL import Image
import os.path as osp

def mkdirs(d):
    # if not osp.exists(d):
    if not osp.isdir(d):
        os.makedirs(d)
# input_folder = "/home/ckq/Desktop/MOT/images/train/0000/img"  # 源文件夹，包含.png格式图片
# output_folder = "/home/ckq/Desktop/MOT/images/train/0000/jpg"  # 输出文件夹
src_folder = "/media/ckq/data/kitti/MOT/images/train"  # 源文件夹，包含.png格式图片
dist_folder = "/media/ckq/data/kitti/MOT_new/images/train"  # 输出文件夹

src_folder_names=os.listdir(src_folder)
print(src_folder_names)
for src_folder_name in src_folder_names:
    input_folder = osp.join(src_folder,src_folder_name,'img1')
    #print(input_folder)
    output_folder = osp.join(dist_folder,src_folder_name,'img1')  # 输出文件夹
    if not os.path.isdir(output_folder):
        mkdirs(output_folder)
    else:  # 如果之前已经生成过: 递归删除目录和文件, 重新生成目录
        shutil.rmtree(output_folder)
        os.makedirs(output_folder)
    print(output_folder)
    a = []
    for root, dirs, files in os.walk(input_folder):
        for filename in (x for x in files if x.endswith('.png')):
            filepath = os.path.join(root, filename)

            object_class = filename.split('.')[0]
            a.append(object_class)
        print(a)

    for i in a:
        old_path = input_folder + "/" + str(i) + '.png'
        new_path = output_folder + "/" + str(i) + '.jpg'
        img = Image.open(old_path)
        img.save(new_path)

参考：转图片格式

结果发现我的第一帧是从00000开始而代码是从000001开始的
则图片重新命名

代码：

import re
import sys
import os
import os.path as osp

def renameall(path):
    fileList = os.listdir(path)  # 待修改文件夹
    print("修改前：" + str(fileList))  # 输出文件夹中包含的文件
    os.chdir(path)  # 将当前工作目录修改为待修改文件夹的位置
    num = 1  # 名称变量
    for fileName in fileList:  # 遍历文件夹中所有文件
        pat = ".+\.(jpg|jpeg|JPG)"  # 匹配文件名正则表达式
        pattern = re.findall(pat, fileName)  # 进行匹配
        print('pattern[0]:', pattern)
        print('num：', num, 'filename:', fileName)
        name = str(num).zfill(6)  # 设置宽度
        #name = num
        os.rename(fileName, ('img' + name +'.'+ pattern[0]))  # 文件重新命名
        num = num + 1  # 改变编号，继续下一项
    print("---------------------------------------------------")
    sys.stdin.flush()  # 刷新
    print("修改后：" + str(os.listdir(path)))  # 输出修改后文件夹中包含的文件


#path = '/home/ckq/Desktop/MOT/images/train/0000/img1'  #测试
src_path='/media/ckq/data/kitti/MOT/images/train'
imgs_name = os.listdir(src_path)
imgs_name.sort()
print(imgs_name)
for img_name in imgs_name:
    img_path=osp.join(src_path,img_name,'img1')
    print(img_path)
    renameall(img_path)

FairMOT构建DCNv2踩坑记录花卷呀花卷
报错1：error:MicrosoftVisualC++14.0isrequired.Getitwith"BuildToolsforVisualStudio":https://visualstudio.microsoft.com/downloads/1.png解决方案：visualc++buildtools的安装与使用https://blog.csdn.net/u012247418/article
windows平台FairMOT的实现 maohule windows
环境：python3.6+pytorch1.1.0+torchvision0.3.0+cuda9.2+vs2015该项目需要装3个c++库（dcn_v2，apex，cython_bbox）特别坑，各种环境不匹配，各种bug。本人c++小白，但是一路摸索总算成功了。下面总结一下：一、1.先把源码下下来，用git（自己手安）克隆或者直接下载zip文件都可：https://github.com/ifzh
FairMOT论文阅读笔记我在阳澄湖畔吃炸鸡 CV 深度学习深度学习计算机视觉
Abstract近些年目标检测和Re-ID有很大的发展，但是没有人在单个网络中联合这两个任务。由于re-ID任务没有公平的学习，这导致了大量id的转换。不公平之处在于两个方面:(1)他们将重新身份识别视为次要任务，其准确性在很大程度上取决于主要检测任务。所以训练很大程度上偏向于检测任务，而忽略了重识别任务；(2)它们使用感兴趣区域对齐来提取直接从对象检测中借用的重标识特征。然而，这在表征对象时引入
多目标跟踪算法（FairMOT）训练、测试过程 weixin_45774010 深度学习
多目标跟踪算法（FairMOT）训练、测试过程GitHub地址：https://github.com/ifzhang/FairMOT除GitHub上的步骤，还应做如下修改：①训练数据集仅采用CUHKSYSU（下载的原数据名称为CUHK-SYSU，需修改为CUHKSYSU）和PWM，在src/lib/cfg/data.json文件中更改root和train部分，下面的测试部分也根据数据集进行修改，这
FairMot代码解读 weixin_37958272 目标跟踪深度学习神经网络ＭＯＴ
FairMot代码解读项目地址先看src/demo.py:defdemo(opt):result_root=opt.output_rootifopt.output_root!=''else'.'mkdir_if_missing(result_root)logger.info('Startingtracking...')dataloader=datasets.LoadVideo(opt.input_
A Simple Baseline for multi-object Tracking(FairMOT)论文阅读笔记不知道叫啥好一点 anchor free目标检测 FairMOT论文阅读笔记 anchor-free Re-ID MOT
FairMOT论文笔记（一）Title（二）Summary（三）ResearchObejct（四）ProblemStatement（五）Method5.1backbone5.2ObjectDetectionBranch5.3IdentityEmbeddingBranch5.4LossFunctions5.5在线跟踪（六）Experiment6.1数据集6.2实现细节实验1实验2Multi-Laye
FairMOT 论文学习 calvinpaean 多目标追踪学习目标跟踪人工智能
1.解决了什么问题？现有的多目标跟踪方案将目标检测和reID任务放在一个网络里面优化学习，计算效率高。目标检测首先在每一帧中检测出兴趣目标，要么将其与现有的轨迹关联起来，要么创建一个新的轨迹。这两个任务会相互竞争，现有的方法都将reID任务列为次优先级任务，而检测任务为主优先级，reID的准确率受检测影响很大，这对reID不公平。当场景中目标很多时，先检测再跟踪的方式无法取得实时的效果，因为这两个
【多目标跟踪】 FairMOT 耗时三天！！！单句翻译小胡的博客号Aoife艺馨目标跟踪人工智能计算机视觉
多目标跟踪FairMOTAbstractMulti-objecttracking(MOT)isanimportantprob-lemincomputervisionwhichhasawiderangeofapplica-tions.FormulatingMOTasmulti-tasklearningofobjectde-tectionandre-IDinasinglenetworkisappeal
【学习笔记】目标跟踪领域SOTA方法比较 8倍学习笔记汇总目标跟踪人工智能计算机视觉
目录前言方法1TraDeS:2FairMOT:3SMILEtrack:4ByteTrack:前言常用于行人跟踪的多目标跟踪数据集包括：MOT15/16/17/20、PersonPath22等…为更好比较现有SOTA算法的检测性能，本博客将针对在各数据集上表现较优的算法模型进行介绍。（表中画粗数据表明对应算法为该数据集表现最优算法）数据集算法模型MOTA年份代码MOT15TraDeS66.52021
【目标跟踪】2、FairMOT | 平衡多目标跟踪中的目标检测和 Re-ID 任务 | IJCV2021 呆呆的猫目标跟踪目标跟踪目标检测人工智能
文章目录一、背景二、方法2.1Backbone2.2检测分支2.3Re-ID分支2.4训练FairMOT2.5OnlineInference三、效果3.1数据集3.2实现细节3.3消融实验3.4最终效果论文：FairMOT:OntheFairnessofDetectionandRe-IdentificationinMultipleObjectTracking代码：https://github.co
FairMOT训练kitti tracking数据集的汽车类（参考FairVehicle） sugarkss FairMOT
工作情况：kitti数据集的标签（转换成FairMOT类似的gt）以下是处理图片和gt文本的程序操作，仅做个人记录！！！1.将原先kittitracking数据集的标签修改去掉type用文本来表示改成数字代表同时将空格改成逗号效果图kittitracking标签含义：Thelabelfilescontainthefollowinginformation,whichcanbereadandwritt
已解决cython_bbox安装出现的问题 blueskyhpm 深度学习 python 神经网络机器学习
为了跑FairMOT代码，配置环境时遇到了该问题。我已经安装了cython，然后下载了压缩包，解压后打开cython_bbox-0.1.3文件夹打开文件setup.py将extra_compile_args=['-Wno-cpp'],修改为extra_compile_args={'gcc':['/Qstd=c99']}然后在setup.py文件的当前路径,打开命令行,执行pythonsetup.p
（日常搬砖）windows 11 安装cython_bbox时，遇到问题‘error: Microsoft Visual C++ 14.0 or greater is required. ’解决方案 Philharmy_Wang 日常搬砖 linux anaconda microsoft
windows11安装cython_bbox时，遇到问题‘error:MicrosoftVisualC++14.0orgreaterisrequired.’解决方案安装百度飞桨时，执行指令pipinstall-rrequirements.txt，报错。检查一下错误，发现无法用pip安装Cython和cython_bbox。参考FairMOT|win10下cython-bbox安装的心酸之路成功安装
论文精读：FairMOT: On the Fairness of Detection and Re-Identification in MultipleObject Tracking 樱花的浪漫目标追踪网络深度学习计算机视觉人工智能 cnn
1.提出背景以往的工作通常将re-ID视为次要任务，其准确性受到主要检测任务的严重影响。因此，网络偏向于主检测任务，这对re-ID任务不公平。2.核心思想将MOT表示为单个网络中目标检测和reid的多任务学习，因为它允许两个任务的联合优化，并且具有较高的计算效率。然而，我们发现这两个任务倾向于相互竞争，这需要仔细处理。特别是，以往的工作通常将re-ID视为次要任务，其准确性受到主要检测任务的严重影
论文笔记——FairMOT：A Simple Baseline for Multi-Object Tracking 汐梦聆海多目标追踪
论文题目：ASimpleBaselineforMulti-ObjectTracking论文链接：https://github.com/ifzhang/FairMOT以往的MOT大多是基于tracking-by-detection的，首先对每一个frame做检测，再用re-Id，各种匹配关联算法进行dataassociation，这两个步骤都是独立的。这篇文章提出了一个网络，可以将上述步骤进行结合，
A Simple Baseline for Multi-Object Tracking多目标跟踪算法 donkey_1993 深度学习多目标跟踪目标检测 Re-ID 深度学习人工智能
论文下载地址：https://arxiv.org/abs/2004.01888代码下载地址：https://github.com/ifzhang/FairMOT论文摘要：近几年目标检测算法和重识别算法发展迅速。这两个是多目标跟踪算法的重要组成部分。但是现在很少有人关注，将这两个算法合并在一个网络上，因为在初期的时候就有人尝试过这种方法但是重识别网络学习的特征并不好，从而造成跟踪精度大幅下降。论文作
A Simple Baseline for Multi-Object Tracking FengF2017 计算机视觉计算机视觉人工智能
ASimpleBaselineforMulti-ObjectTracking论文信息Paper：[CVPR2020]ASimpleBaselineforMulti-ObjectTrackingLink:https://arxiv.org/abs/2004.01888Code:https://github.com/ifzhang/FairMOT/背景多目标跟踪（MOT）是计算机视觉领域的一个重要问题
CVPR2020 平衡检测与跟踪的一阶段目标跟踪项目fairMOT 披荆斩棘的Jim pytorch 目标跟踪 python
目录CVPR2020平衡检测与跟踪的一步法多目标跟踪项目fairMOT一、背景二、关键性因素三、环境搭建1、系统环境和虚拟环境2、覆盖flat_hash_map.h3、安装DCNv24、手动下载Cython-bbox0.1.3并编译5、文件dla34-ba72cf86.pth手动放置6、下载ffmpeg7、下载权重文件四、运行demo五、遇到的问题CVPR2020平衡检测与跟踪的一步法多目标跟踪项
使用FairMOT训练好的模型自动下载预先训练模型 LBJ_wz python 深度学习人工智能 python
问题：今天想要使用FairMOT训练好的模型进行人的多目标跟踪。已经下载了fairmot_dla34.pth但是运行demo.py还是会自动下载dla34-ba72cf86.pth模型。环境：ubuntu，gtx1050ti，python3.6，CUDA10.0具体问题：在输入完执行命令之后，显示：Createingmodel……Downloading:“http://dl.yf.io/dla/m
多目标研究入门：从SORT到FairMOT 自动驾驶之心算法大数据 python 计算机视觉机器学习
作者|高毅鹏编辑|汽车人原文链接：https://zhuanlan.zhihu.com/p/260292966点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心技术交流群目标跟踪分为单目标跟踪(SOT)和多目标跟踪(MOT)。SOT一般在首帧给出目标，跟踪器(tracker)需要在后续帧定位出目标位置，可以看成目标重定位问题。MOT一般需要检测器(detect
使用OpenVINO 运行PPTracking下FairMOT多目标跟踪模型英特尔边缘计算社区 OpenVINO openvino 人工智能
图1MOT行人检测[1]多对象追踪(Multi-ObjectTracking,MOT)在计算机视觉领域有着广泛且重要的应用。大到可以用在多目标导弹跟踪、市中心人流统计,小到可以用在统计鱼池里的观赏鱼类等等。本篇文章将会带您了解百度飞桨目标检测套件PaddleDetection项目里的FairMOT模型,并通过OpenVINO™工具套件将其转换成ONNX通用模型，最终在计算机上运行此AI模型实现行人
2021-06-29 Zero｛｝计算机视觉
关于FairMOT模型环境搭建时遇到的一个问题报错：RuntimeError:NOTcompiledwithGPUsupport这种错误首先要排查cuda环境是否装对：版本对应，1.cmd后输入nvcc-V，2.C:\ProgramFiles\NVIDIAGPUComputingToolkit\CUDA\v10.0\extras\demo_suite路径找到bandwidthTest.exe与de
无root权限安装CUDA10.0以及gcc的降级+FairMOT构建DCNv2踩坑记录努力学习DePeng 笔记 ubuntu gcc/gdb编译调试目标跟踪
无root权限安装CUDA10.0+FairMOT构建DCNv2踩坑记录首先介绍一下环境情况因为比赛CUDA版本要求是10.0，所以本文是在Ubuntu20.04下安装CUDA10.0实现FairMOT的复现；但是Ubuntu20.04自带的gcc版本是9.3，创建虚拟环境创建出来的gcc版本根据python版本各异，而在CUDA10.0编译DCNv2要求gcc版本在7以下，所以还需要做一个gcc
FairMOT训练测试自定义数据集碳水大炸弹计算机视觉学习笔记 python
1、将自己的数据集（视频需转为一帧一帧的图片，转换工具ConverttoJPG-Convertimages,documentsandvideostoJPG(img2go.com)）用labelImage打标签，标记需要追踪的部分，标记完成后生成每张图片对应的xml文件，即voc格式2、根据xml文件（voc格式）生成整个数据集的gt.txt文件，gt的数据格式：,,,,,,其中，表示目标出现在哪一
FairMOT多目标跟踪 myh12138 目标跟踪目标跟踪
讲的比较细，可以好好看一看理解与实现复现讲的比较详细复现也可以应用于摄像头实时连接特点：1、以往的模型大多是两阶段，detection一阶段，reid一阶段这篇论文是一阶段的，提出了一个更公平的策略对于检测和追踪2、Objdetection需要deep信息，如果reid之前的方法也是高纬度则不利于两个同时达到最优。低纬度学习reid有利于减少与高纬度的竞争、对小目标好、速度快3、DLA34（更好的
Windows10 DCNv2编译一步一步HH 目标检测 pytorch cuda python
我的环境是,cuda10.1，python3.7,pytorch1.7.1，为了跑FairMOT模型，需要编译DCNv2，在windows上编译报错，最后成功解决。错误：RuntimeError:Errorcompilingobjectsforextension1.下载DCNv2模型https://github.com/jinfagang/DCNv2_latest2.下载安装vs2017，测试了2
FairMOT训练自己的数据集及学习笔记努力学习DePeng 笔记深度学习计算机视觉目标跟踪
https://codechina.csdn.net/mirrors/ifzhang/FairMOT一、FairMOT的复现https://www.zhouchen1998.cn/2020/10/24/fairmot-realtime/cannotimportname‘amp‘原因：1.只有PyTorch1.6版本以上才可以从torch.cuda中importamp；解决措施：https://bl
跟踪算法总结 Mirinda_cjy 跟踪算法
目前业内公认效果比较好的跟踪算法：Deep-sort和FairMOT，二者主要区别在于：FairMOT是一个集成检测、跟踪的端到端算法，检测部分基于centerNet，跟踪部分类似deep-sort。个人认为跟踪算法性能的优劣取决于两方面：（1）检测器的性能；（2）跟踪策略。常用的检测网络：单阶检测：（1）YOLOv3/YOLOv4;（2）centerNet；（3）RefineDet；两阶检测：（
多目标跟踪MOT入门 weixin_40245131 目标跟踪目标跟踪人工智能计算机视觉
摘自：一线算法工程师整理！超实用的3大多目标跟踪算法一线算法工程师整理！超实用的3大多目标跟踪算法https://mp.weixin.qq.com/s/LkfFY5PXzek-KRblo2gKGA另推荐参考多目标研究入门-从SORT到FairMOT多目标研究入门-从SORT到FairMOT-知乎目标跟踪分为单目标跟踪(SOT)和多目标跟踪(MOT)。SOT一般在首帧给出目标，跟踪器(tracker
【目标跟踪】多目标跟踪的评价工具motmetrics怎么使用？聿默目标跟踪人工智能目标跟踪
写完这篇，多目标跟踪基本的就完整了。写这篇文章主要是从复现、训练自己的数据、以及不同算法对比，还有一个评价，基本这个方向的专题就完整了。之前也有很多人，让我出deepsort的评价指标的代码。一直到前一段时间才找出点时间把代码写好，所以将整好的一个demo开源一下。这个脚本也是参考FairMOT里面写的。后面我会先按照从标注、推理结果，指标测试讲下。1.环境ubuntu20.04python3.6
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不

FairMOT训练kitti tracking数据集的汽车类（参考FairVehicle）

1.将原先kitti tracking数据集的标签 修改 去掉type用文本来表示 改成数字代表 同时将空格改成逗号

2.之后开始给每个数据及的每张图片进行标签： 首先说一下 我的需求是标注Car： kitti数据集标签生成 gen_lables_kitti_car.py：

3.接下来生成训练文件：

你可能感兴趣的:(FairMOT)

1.将原先kitti tracking数据集的标签修改去掉type用文本来表示改成数字代表同时将空格改成逗号

2.之后开始给每个数据及的每张图片进行标签：首先说一下我的需求是标注Car： kitti数据集标签生成 gen_lables_kitti_car.py：