laizi_laizi

siamfc-pytorch代码讲解（三）：demo&track

一、demo.py
二、track

2.1 init(self, img, box)
2.2 update(self, img)

三、checkpoint and demo
四、test results

OTB2013
OTB2015

五、matlab官方评测
六、上下篇

我之前的两篇博客：

siamfc-pytorch代码讲解（一）：backbone&head
siamfc-pytorch代码讲解（二）：train&siamfc
代码来自:https://github.com/huanglianghua/siamfc-pytorch

今天主要看一下demo的部分，也就是涉及到测试tracking的部分。
直接上代码：

一、demo.py

from __future__ import absolute_import

import os
import glob
import numpy as np

from siamfc import TrackerSiamFC


if __name__ == '__main__':
    seq_dir = os.path.expanduser('D:\\OTB\\Crossing\\')
    img_files = sorted(glob.glob(seq_dir + 'img/*.jpg'))
    anno = np.loadtxt(seq_dir + 'groundtruth_rect.txt', delimiter=',')
    
    net_path = 'pretrained/siamfc_alexnet_e50.pth'
    tracker = TrackerSiamFC(net_path=net_path)
    tracker.track(img_files, anno[0], visualize=True)

上面的第11行路径自己该，我这次是windows测试的，所以这样写了（看着有点不规范）。
13行我多加了一点代码：, delimiter=','，不加这个会报这样的错：

ValueError: could not convert string to float

下面几行就是用训练好的siamfc_alexnet_e50.pth模型进行tracking，给定的是img_files：视频序列；anno[0]就是第一帧中的ground truth bbox。

二、track

现在就来看一下类TrackerSiamFC下的track方法。这个函数的作用就是传入video sequence和first frame中的ground truth bbox，然后通过模型，得到后续帧的目标位置，可以看到主要有两个函数实现：init和update，这也是继承Tracker需要重写的两个方法：

init：就是传入第一帧的标签和图片，初始化一些参数，计算一些之后搜索区域的中心等等
update：就是传入后续帧，然后根据SiamFC网络返回目标的box坐标，之后就是根据这些坐标来show，起到一个demo的效果。

def track(self, img_files, box, visualize=False):
    frame_num = len(img_files)
    boxes = np.zeros((frame_num, 4))
    boxes[0] = box
    times = np.zeros(frame_num)

    for f, img_file in enumerate(img_files):
        img = ops.read_image(img_file)

        begin = time.time()
        if f == 0:
            self.init(img, box)
        else:
            boxes[f, :] = self.update(img)
        times[f] = time.time() - begin

        if visualize:
            ops.show_image(img, boxes[f, :])

    return boxes, times

2.1 init(self, img, box)

我强烈建议可以用两个设备，一个看代码，一个用来看我下边的长图，对照着分析

def init(self, img, box):
    # set to evaluation mode
    self.net.eval()

    # convert box to 0-indexed and center based [y, x, h, w]
    box = np.array([
        box[1] - 1 + (box[3] - 1) / 2,
        box[0] - 1 + (box[2] - 1) / 2,
        box[3], box[2]], dtype=np.float32)
    self.center, self.target_sz = box[:2], box[2:]

    # create hanning window
    self.upscale_sz = self.cfg.response_up * self.cfg.response_sz  # 272
    self.hann_window = np.outer(
        np.hanning(self.upscale_sz),
        np.hanning(self.upscale_sz))
    self.hann_window /= self.hann_window.sum()

    # search scale factors
    self.scale_factors = self.cfg.scale_step ** np.linspace(
        -(self.cfg.scale_num // 2),
        self.cfg.scale_num // 2, self.cfg.scale_num)  # 1.0375**(-2,-0.5,1)

    # exemplar and search sizes
    context = self.cfg.context * np.sum(self.target_sz)
    self.z_sz = np.sqrt(np.prod(self.target_sz + context))
    self.x_sz = self.z_sz * \
                self.cfg.instance_sz / self.cfg.exemplar_sz

    # exemplar image
    self.avg_color = np.mean(img, axis=(0, 1))
    z = ops.crop_and_resize(
        img, self.center, self.z_sz,
        out_size=self.cfg.exemplar_sz,
        border_value=self.avg_color)

    # print(z.shape) # [127,127,3]
    # exemplar features [H,W,C]->[C,H,W]
    z = torch.from_numpy(z).to(
        self.device).permute(2, 0, 1).unsqueeze(0).float()
    self.kernel = self.net.backbone(z)  # torch.Size([1, 256, 6, 6])

一开始，就是把输入的ltwh格式的box转变为[y, x, h, w]格式的，这个看过我第二篇的就很清楚了，然后记录bbox的中心和宽高size信息，以备后用（如下图黑色字体表示的）
这里计算了响应图上采样后的大小upscale_sz，因为论文中有这样一句话：
We found that upsampling the score map using bicubic interpolation, from 17 × 17 to 272 × 272, results in more accurate localization since the original map is relatively coarse.也就是17×16=272
然后创建了一个汉宁窗(hanning window)，也叫余弦窗【可以看这里】，论文中说是增加惩罚：Online, ... and a cosine window is added to the score map to penalize large displacements
论文中提到两个变体，一个是5个尺度的，一个是3个尺度的（这里就是），5个尺度依次是 $1.025^{[-2,-1,0,1,2]}$ ，代码中3个尺度是 $1.0375^{[-2,-0.5,1]}$
context 就是边界的语义信息，为了计算z_sz和x_sz，最后送入crop_and_resize去抠出搜索区域【我第二篇博客有讲这个函数】， z_sz大小可以看下面蓝色方形框， x_sz大小可以看下面粉色方形框，最后抠出z_sz大小的作为exemplar image，并送入backbone，输出embedding，也可以看作是一个固定的互相关kernel，为了之后的相似度计算用，如论文中提到：We found that updating (the feature representation of) the exemplar online through simple strategies, such as linear interpolation, does not gain much performance and thus we keep it fixed
关于一些tensor的shape可以看代码里的注释，下面是我当时的笔记：

2.2 update(self, img)

我强烈建议可以用两个设备，一个看代码，一个用来看我下边的长图，对照着分析

def update(self, img):
    # set to evaluation mode
    self.net.eval()

    # search images
    x = [ops.crop_and_resize(
        img, self.center, self.x_sz * f,
        out_size=self.cfg.instance_sz,
        border_value=self.avg_color) for f in self.scale_factors]
    x = np.stack(x, axis=0)  # [3, 255, 255, 3]
    x = torch.from_numpy(x).to(
        self.device).permute(0, 3, 1, 2).float()

    # responses
    x = self.net.backbone(x)  # [3, 256, 22, 22]
    responses = self.net.head(self.kernel, x)  # [3, 1, 17, 17]
    responses = responses.squeeze(1).cpu().numpy()  # [3, 17, 17]

    # upsample responses and penalize scale changes
    responses = np.stack([cv2.resize(
        u, (self.upscale_sz, self.upscale_sz),
        interpolation=cv2.INTER_CUBIC)
        for u in responses])  # [3, 272, 272]
    responses[:self.cfg.scale_num // 2] *= self.cfg.scale_penalty
    responses[self.cfg.scale_num // 2 + 1:] *= self.cfg.scale_penalty

    # peak scale
    scale_id = np.argmax(np.amax(responses, axis=(1, 2)))  # which channel is max

    # peak location
    response = responses[scale_id]
    response -= response.min()
    response /= response.sum() + 1e-16
    response = (1 - self.cfg.window_influence) * response + \
               self.cfg.window_influence * self.hann_window
    loc = np.unravel_index(response.argmax(), response.shape)

    # locate target center: disp stand for displacement
    disp_in_response = np.array(loc) - (self.upscale_sz - 1) / 2
    disp_in_instance = disp_in_response * \
                       self.cfg.total_stride / self.cfg.response_up
    disp_in_image = disp_in_instance * self.x_sz * \
                    self.scale_factors[scale_id] / self.cfg.instance_sz
    self.center += disp_in_image

    # update target size
    scale = (1 - self.cfg.scale_lr) * 1.0 + \
            self.cfg.scale_lr * self.scale_factors[scale_id]
    self.target_sz *= scale
    self.z_sz *= scale
    self.x_sz *= scale

    # return 1-indexed and left-top based bounding box
    box = np.array([
        self.center[1] + 1 - (self.target_sz[1] - 1) / 2,
        self.center[0] + 1 - (self.target_sz[0] - 1) / 2,
        self.target_sz[1], self.target_sz[0]])

    return box

update顾名思义就是对后续的帧更新出bbox来，因为是tracking phase，所以把模型设成eval mode。然后在这新的帧里抠出search images，根据之前init里生成的3个尺度，然后resize成255×255，特别一点，我们可以发现search images在resize之前的边长x_sz大约为target_sz的4倍，这也印证了论文中的：we only search for the object within a region of approximately four times its previous size
然后将这3个尺度的patch（也就是3个搜索范围）拼接一起，送入backbone，生成emdding后与之前的kernel进行互相关，得到score map，这些tensor的shape代码里都有标注，得到3个17×17的responses，然后对每一个response进行上采样到272×272
上面的24,25行就是对尺度进行惩罚，我是这样理解的，因为中间的尺度肯定是接近于1，其他两边的尺度不是缩一点就是放大一点，所以给以惩罚，如论文中说：Any change in scale is penalized
之后就选出这3个通道里面最大的那个，并就行归一化和余弦窗惩罚，然后通过numpy.unravel_index找到一张response上峰值点(peak location)【关于这个函数可以看这里】
接下来的问题就是：在response图中找到峰值点，那这在原图img中在哪里呢？所以我们要计算位移(displacement)，因为我们原本都是以目标为中心的，认为最大峰值点应该在response的中心，所以39行就是峰值点和response中心的位移。
因为之前在img上crop下一块instance patch，然后resize，然后送入CNN的backbone，然后score map又进行上采样成response，所以要根据这过程，逆回去计算对应在img上的位移，所以上面的39-43行就是在做这件事，也可以看下面的图
根据disp_in_image修正center，然后update target size，因为论文有一句：update the scale by linear interpolation with a factor of 0.35 to provide damping，但是似乎参数不太对得上，线性插值可以看下面蓝色的图，因为更新后的scale还是很接近1，所以bbox区域不会变化很大
最后根据ops.show_image输入的需要，又得把bbox格式改回ltwh的格式

三、checkpoint and demo

我的模型存在这里，但是只训练了GOT-10k的前500个序列，但感觉效果也还行：

之后在全部训练序列上训练出来的模型（到49轮的时候电脑卡死了，感觉训练过程中cpu占用率很高）：siamfc_alexnet_e49.zip

四、test results

这里放一下测试结果，当然和代码提供者结果，论文中的结果都是有距离的：

OTB2013

	success OPE
我的	0.466/0.520
代码提供者的	0.589
siamfc论文中的	0.612

注意：我的OPE那栏里，前面那个是训了一部分的结果，下面也是一样的

OTB2015

	success OPE
我的	0.469/0.529
代码提供者的	0.578
siamfc论文中的	0.582

注意：siamfc论文中的没有OTB2015的success OPE，我摘抄自SiamRPN论文，不过可以去官方地址有matlab结果文件，有机会用official toolkit评估一下，再来放个结果

上面的结果更新了一下，原因之前的OTB数据集没整理好，导致实际评估的序列数少了。我看过OTB benchmark官方评测代码python版本，里面评测和画图的方法和GOT-10k里面的ExperimentOTB是一样的，可以放心使用。

五、matlab官方评测

2020/05/20 情人节更新一下结果，这个是SiamFC官方project的结果：我使用的是
results_SiamFC-3s_OTB-100.zip，然后用OTB official MATLAB toolkit的代码tracker_benchmark_v1.0.zip

具体的做法如下：

去这篇博客下载包含otb全部序列的anno，tracker_benchmark_v1.0里面只有CVPR2013的序列注释（注意新加的序列名字不再都是小写的），把anno覆盖掉原来的，把configSeqs复制替换掉原来的configSeqs.m文件，在configTrackers.m中最后改成如下：

trackersSiamfc={struct('name','siamfc3s','namePaper','SiamFC')};
trackers = trackersSiamfc;

在tracker_benchmark_v1.0的results文件夹下新建results_TRE_OTB100，并把上面下载的结果文件results_SiamFC-3s_OTB-100.zip里面的.mat文件拷贝其中，并把genPerfMat.m的13行改成rpAll=['.\results\results_TRE_OTB100\'];（这个结果文件是TRE的，但是TRE的第一次就是OPE）
因为结果.mat文件跟我们configSeqs.m里面的seq.name不完全一样，所以得重命名，可用下面的python脚本重命名：

import os

tracker_name = 'siamfc3s'
location = len(tracker_name) + 1
# replace to your own path
anno_seqs_path = 'D:\\tracker_benchmark_v1.0\\anno'
anno_seqs = os.listdir(anno_seqs_path)
anno_seqs.remove('att')
assert len(anno_seqs) == 100, 'otb must have 100 seqs!'
anno_seqs = [anno_seq[:-4] for anno_seq in anno_seqs]
lower_anno_seqs = [i.lower() for i in anno_seqs]
# print(anno_seqs)
# replace to your own path
res_seqs_path = 'D:\\tracker_benchmark_v1.0\\results\\results_TRE_OTB100'
res_seqs = os.listdir(res_seqs_path)
assert len(res_seqs) == len(anno_seqs), \
    'otb result must have equal length with anno'
# remove .mat
res_seqs = [res_seq[:-4] for res_seq in res_seqs]
lower_res_no_tracker_name = [seq[:-location].lower() for seq in res_seqs]
# print(lower_res_no_tracker_name)
# different naming methods
diff = []
for res_seq in lower_res_no_tracker_name:
    if res_seq not in lower_anno_seqs:
        diff.append(res_seq)

print('different naming methods:', diff)
assert not diff, 'before rename, should rename diff name seqs!'

# rename res file name
for res_seq in lower_res_no_tracker_name:
    anno_idx = lower_anno_seqs.index(res_seq)
    res_idx = lower_res_no_tracker_name.index(res_seq)
    old_name = os.path.join(res_seqs_path, res_seqs[res_idx]+'.mat')
    new_name = os.path.join(res_seqs_path, anno_seqs[anno_idx]+'_'+tracker_name+'.mat')
    os.rename(old_name, new_name)

这样运行perfPlot.m文件就能出结果了，其中105行的rankingType = 'AUC’时能得到success plot；rankingType = 'threshold’时能得到precision plot【这时得到的成功图不是0-1阈值下的，所以只有准确率图能用】

六、上下篇

上一篇：siamfc-pytorch代码讲解（二）：train&siamfc
下一篇：OTB官方评估代码python版本–评估自己跟踪器，对比其他跟踪器

yolov5单目测距+速度测量+目标跟踪 cv_2025 YOLO 目标跟踪人工智能计算机视觉机器学习图像处理 opencv
要在YOLOv5中添加测距和测速功能，您需要了解以下两个部分的原理：单目测距算法单目测距是使用单个摄像头来估计场景中物体的距离。常见的单目测距算法包括基于视差的方法（如立体匹配）和基于深度学习的方法（如神经网络）。基于深度学习的方法通常使用卷积神经网络（CNN）来学习从图像到深度图的映射关系。单目测距代码单目测距涉及到坐标转换，代码如下：defconvert_2D_to_3D(point2D,R,
PaddleDetection多目标跟踪报错MCMOTEvaluator is not exist, so the MOTA will be -INF ATM006 目标检测
ppdet.metrics.mcmot_metricsWARNING:gt_filename'{}'ofMCMOTEvaluatorisnotexist,sotheMOTAwillbe-INFPaddleDetection/ppdet/metrics/mcmot_metrics.pyclassMCMOTEvaluator(object):def__init__(self,data_root,seq
计算机设计大赛深度学习交通车辆流量分析 - 目标检测与跟踪 - python opencv iuerfee python
文章目录0前言1课题背景2实现效果3DeepSORT车辆跟踪3.1DeepSORT多目标跟踪算法3.2算法流程4YOLOV5算法4.1网络架构图4.2输入端4.3基准网络4.4Neck网络4.5Head输出层5最后0前言优质竞赛项目系列，今天要分享的是**基于深度学习得交通车辆流量分析**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工
互联网加竞赛多目标跟踪算法实时检测 - opencv 深度学习机器视觉 Mr.D学长 python java
文章目录0前言2先上成果3多目标跟踪的两种方法3.1方法13.2方法24TrackingByDetecting的跟踪过程4.1存在的问题4.2基于轨迹预测的跟踪方式5训练代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习多目标跟踪实时检测该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：4分更多资料,项目分享：ht
【目标跟踪】提供一种简单跟踪测距方法（c++）读书猿目标跟踪 c++人工智能
文章目录一、前言二、c++代码2.1、Tracking2.2、KalmanTracking2.3、Hungarian2.4、TrackingInfo三、调用示例四、结果一、前言在许多目标检测应用场景中，完完全全依赖目标检测对下游是很难做出有效判断，如漏检。检测后都会加入跟踪进行一些判断或者说补偿。而在智能驾驶中，还需要目标位置信息，所以还需要测距。往期博客介绍了许多处理复杂问题的，而大部分时候我们
利用YOLOv8 pose estimation 进行人的头部等马赛克 shiter 大数据+AI 赋能行业助力企业数字化转型最佳实践案例 YOLO
文章大纲马赛克几种OpenCV实现马赛克的方法高斯模糊poseestimation定位并模糊：三角形的外接圆与膨胀系数实现实现代码实现效果参考文献与学习路径之前写过一个文章记录，怎么对人进行目标检测后打码，但是人脸识别有个问题是，很多人的背影，或者侧面无法识别出来人脸，那么我们就可以用姿态估计中的关键点信息进行补充，对人头进行打码，从而进一步的保护隐私信息。目标跟踪与检测后进行OpenCV人脸识别
吉格勒定理：你是一个有目标的人吗 Garey_8132
心理学家对哈佛大学的一批毕业生进行过一次人生目标跟踪调查。在调查中，研究人员发现：这些毕业生中有3%的人曾经确立了远大的目标；有10%的人有明确的短期目标；有60%的人目标不清晰，只求过好眼下的生活；还有27%的人几乎没有目标，完全是随遇而安。20年后，研究人员惊奇地发现：曾经树立过远大目标的3%的人，大都完成了自己的既定目标，事业有成；那10%的人虽没有卓尔不群，但也是社会中的上层人士；那60%
互联网加竞赛基于深度学习的视频多目标跟踪实现 Mr.D学长 python java
文章目录1前言2先上成果3多目标跟踪的两种方法3.1方法13.2方法24TrackingByDetecting的跟踪过程4.1存在的问题4.2基于轨迹预测的跟踪方式5训练代码6最后1前言优质竞赛项目系列，今天要分享的是基于深度学习的视频多目标跟踪实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postg
第九篇【传奇开心果系列】Python的OpenCV技术点案例示例：目标跟踪传奇开心果编程 Python库OpenCV 技术点案例示例短博文 python opencv 目标跟踪
传奇开心果短博文系列系列短博文目录Python的OpenCV技术点案例示例系列短博文目录前言二、常用的目标跟踪功能、高级功能和增强跟踪技术介绍三、常用的目标跟踪功能示例代码四、OpenCV高级功能示例代码五、OpenCV跟踪目标增强技术示例代码六、归纳总结系列短博文目录Python的OpenCV技术点案例示例系列短博文目录前言目标跟踪：包括多目标跟踪、运动目标跟踪等功能。OpenCV是一个流行的计
【Visual Object Tracking】Learning notes bryant_meng CNN /Transformer 读书笔记深度学习人工智能单目标跟踪 VOT
DenseOpticalTracking:ConnectingtheDots参考学习来自：单目标跟踪Siamese系列网络：SiamFC、SiamRPN、one-shot跟踪、one-shotting单样本学习、DaSiamRPN、SiamRPN++、SiamMask单目标跟踪：跟踪效果/单目标跟踪：数据集处理/单目标跟踪：模型搭建/单目标跟踪：模型训练/单目标跟踪：模型测试单目标跟踪SiamMa
开源计算机视觉库OpenCV详解和实际运用案例黑夜照亮前行的路计算机视觉
开源计算机视觉库OpenCV是一个功能强大的工具，广泛应用于图像处理和计算机视觉领域。它包含许多优化算法，涵盖了图像处理、特征检测、目标跟踪等多个方面的功能。以下是对OpenCV的详细解释和一些实际应用案例。一、OpenCV的模块和功能OpenCV主要包含以下几个模块：核心功能模块：包含基本的图像处理和计算机视觉功能，如图像读取、显示、保存、变换等。图像处理模块：提供一系列图像处理算法，如滤波、边
室内定位系列 _49_
室内定位系列（一）——WiFi位置指纹（译）室内定位系列（二）——仿真获取RSS数据室内定位系列（三）——位置指纹法的实现（KNN）室内定位系列（四）——位置指纹法的实现（测试各种机器学习分类器）室内定位系列（五）——目标跟踪（卡尔曼滤波）室内定位系列（六）——目标跟踪（粒子滤波）
【目标跟踪】相机运动补偿读书猿目标跟踪自动驾驶目标检测
文章目录一、前言二、简介三、改进思路3.1、状态定义3.2、相机运动补偿3.3、iou和ReID融合3.4、改进总结四、相机运动补偿一、前言目前MOT(MultipleObjectTracking)最有效的方法仍然是Tracking-by-detection。今天给大家分享一篇论文BoT-SORT。论文地址，论文声称很牛*，各种屠榜，今天我们就来一探究竟。主要是分享论文提出的改进点以及分享在自己的
计算机视觉中的目标跟踪小北的北计算机视觉目标跟踪人工智能机器学习
从保护我们城市的监控系统到自动驾驶车辆在道路上行驶，目标跟踪已经成为计算机视觉中的一项基础技术。本文深入探讨了目标跟踪，探索了其基本原理、多样化的方法以及在现实世界中的应用。什么是目标跟踪？目标跟踪是深度学习在计算机视觉中广泛应用的重要应用之一。它指的是在动态环境中通过分析轨迹自动识别和跟踪物体，一旦初始位置已知。目标跟踪隐式地使用技术来识别和分类帧中的对象，并为每个对象关联一个唯一的标识。通常，
计算机视觉实战项目4（单目测距与测速+摔倒检测+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A_路径规划+行人车辆计数+动物识别等）阿利同学计算机视觉目标检测单目测距目标跟踪姿态识别实力分割摔倒检测
基于YOLOv5的无人机视频检测与计数系统摘要：无人机技术的快速发展和广泛应用给社会带来了巨大的便利，但也带来了一系列的安全隐患。为了实现对无人机的有效管理和监控，本文提出了一种基于YOLOv5的无人机视频检测与计数系统。该系统通过使用YOLOv5目标检测算法，能够准确地检测无人机，并实时计数其数量，提供给用户可视化的监控界面。原文链接：https://blog.csdn.net/ALiLiLiY
【目标跟踪】3D点云跟踪读书猿目标跟踪 3d 人工智能
文章目录一、前言二、代码目录三、代码解读3.1、文件描述3.2、代码框架四、关联矩阵计算4.1、ComputeLocationDistance4.2、ComputeDirectionDistance4.3、ComputeBboxSizeDistance4.4、ComputePointNumDistance4.5、ComputePointNumDistance4.6、result_distance五
计算机视觉实战项目3（图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等）毕设阿力计算机视觉目标检测目标跟踪
车辆跟踪及测距该项目一个基于深度学习和目标跟踪算法的项目，主要用于实现视频中的目标检测和跟踪。该项目使用了YOLOv5目标检测算法和DeepSORT目标跟踪算法，以及一些辅助工具和库，可以帮助用户快速地在本地或者云端上实现视频目标检测和跟踪！教程博客_传送门链接------->yolov5单目测距+速度测量+目标跟踪（算法介绍和代码）-CSDN博客yolov5deepsort行人/车辆（检测+计数
DeepSORT算法实现车辆和行人跟踪计数和是否道路违规检测（代码＋教程）毕设阿力算法
DeepSORT算法是一种用于目标跟踪的算法，它可以对车辆和行人进行跟踪计数，并且可以检测是否存在道路违规行为。该算法采用深度学习技术来提取特征，并使用卡尔曼滤波器来估计物体的速度和位置。DeepSORT算法通过首先使用目标检测算法来识别出场景中的车辆和行人，然后使用卷积神经网络（CNN）来提取物体的特征。接着，该算法使用余弦相似度来计算物体之间的相似度，并使用匈牙利算法来匹配跟踪器和检测器之间的
yolov5 deepsort 行人/车辆（检测 +计数+跟踪+测距+测速）毕设阿力 YOLO 目标跟踪目标检测
YOLOv5和DeepSORT是两种常用的计算机视觉技术，它们可以结合使用以实现行人和车辆的目标检测和跟踪。这种技术在交通监控、智慧城市等领域中具有广泛的应用。YOLOv5是一种基于深度学习的目标检测算法，它可以实现高效的目标检测和分类。与传统的目标检测算法相比，YOLOv5具有更快的检测速度和更高的准确率。而DeepSORT则是一种基于多目标跟踪的算法，它可以对相邻帧之间的目标进行跟踪，并输出目
[MOT Challenge]官方生成多目标跟踪算法性能评价指标结果，解决test数据集没有gt文件和官网注册问题 Bartender_Jill 目标跟踪人工智能计算机视觉
文章目录⭐⭐⭐内容修正前言一、账号注册1.不要用QQ或163或gmail邮箱2.正常注册流程二、上传测试结果的流程1.使用步骤总结⭐⭐⭐内容修正我先前于2023/4/5日的时候在文章里提到：“提交到官网的文件需要包含测试后的训练集结果和测试后的测试集结果”，该结论经过测试后发现有误。个人于2023/12/8日在评论区的提醒下对MOTChallenge的内容提交进行了重新测试，发现提交到官网的文件并
数字信号处理7——点到向量的距离注释远方数字信号处理算法
目录一、前言二、点到线段的最短距离——向量法三、点到直线的最短距离——直线法四、点到直线最短距离——向量法一、前言其实在工程应用中很多情况下计算点到直线或者点到线段的距离，比如在unity3d游戏软件设计中计算任意形状路径起点和终点连线距离最远的点，比如用于雷达聚类后在多目标跟踪算法中计算哪个sensor距离track最近，另外还需要知道要计算的点位于直线的哪一侧，这些计算在游戏开发或者数字信号后
深度视觉目标跟踪进展综述-论文笔记 pzb19841116 计算机视觉目标跟踪人工智能计算机视觉
中科大学报上的一篇综述，总结得很详细，整理了相关笔记。1引言目标跟踪旨在基于初始帧中指定的感兴趣目标(一般用矩形框表示)，在后续帧中对该目标进行持续的定位。基于深度学习的跟踪算法，采用的框架包括相关滤波器、分类式网络、双路网络等。处理跟踪任务的角度，分为基于匹配思路的双路网络和基于二分类的辨别式跟踪器。最初的深度跟踪算法聚焦于相关滤波器，通过深度学习的特征+相关滤波器实现。基于双路网络跟踪算法那，
FastDeploy项目简介，使用其进行（图像分类、目标检测、语义分割、文本检测|orc部署）万里鹏程转瞬至深度学习python库使用目标检测深度学习模型部署
FastDeploy是一款全场景、易用灵活、极致高效的AI推理部署工具，支持云边端部署。提供超过160+Text，Vision，Speech和跨模态模型开箱即用的部署体验，并实现端到端的推理性能优化。包括物体检测、字符识别（OCR）、人脸、人像扣图、多目标跟踪系统、NLP、StableDiffusion文图生成、TTS等几十种任务场景，满足开发者多场景、多硬件、多平台的产业部署需求。1、FastD
基于卡尔曼滤波的平面轨迹优化点PY 机器人导航定位 c++卡尔曼滤波
文章目录概要卡尔曼滤波代码主函数代码CMakeLists.txt概要在进行目标跟踪时，算法实时测量得到的目标平面位置，是具有误差的，连续观测，所形成的轨迹如下图所示，需要对其进行噪声滤除。这篇博客将使用卡尔曼滤波，对轨迹进行优化。优化的结果为黄色线。卡尔曼滤波代码#include
RT-DETR原理与简介（干翻YOLO的最新目标检测项目）毕设阿力 YOLO 目标检测人工智能
RT-DETR（Real-TimeDetection,Embedding,andTracking）是一种基于Transformer的实时目标检测、嵌入和跟踪模型。它通过结合目标检测、特征嵌入和目标跟踪三个任务，实现了高效准确的实时目标识别和跟踪。RT-DETR的核心思想是将目标检测和目标跟踪这两个传统独立的任务进行统一建模，并利用Transformer网络进行特征提取和关联学习。相比于传统的两阶段
基于多传感器的后融合的目标跟踪如何实现？都有哪些基本流程？自动驾驶之心目标跟踪人工智能计算机视觉机器学习
点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取讲师：Edison课程内容：基于多传感器后融合的目标跟踪(0.课前导学1.自动驾驶中的融合跟踪)笔记作者：王汝嘉0.课前导学0.1主讲人介绍0.2课程关键词0.3学习资料推荐1.自动驾驶中的融合跟踪1.1自动驾驶中的感知任务1.2多传感器融合的主要方法1.3多传感器融合跟踪的基本流程1.4多目标跟踪的数据集与性能指标以上内容均出自《
【目标跟踪】多相机环视跟踪读书猿目标跟踪人工智能自动驾驶
文章目录一、前言二、流程图三、实现原理3.1、初始化3.2、输入3.3、初始航迹3.4、航迹预测3.5、航迹匹配3.6、输出结果四、c++代码五、总结一、前言多相机目标跟踪主要是为了实现360度跟踪。单相机检测存在左右后的盲区视野。在智能驾驶领域，要想靠相机实现无人驾驶，相机必须360度无死角全覆盖。博主提供一种非深度学习方法，采用kalman滤波+匈牙利匹配方式实现环视跟踪。有兴趣可以参考往期【
互联网加竞赛基于机器视觉的车道线检测 Mr.D学长 python java
文章目录1前言2先上成果3车道线4问题抽象(建立模型)5帧掩码(FrameMask)6车道检测的图像预处理7图像阈值化8霍夫线变换9实现车道检测9.1帧掩码创建9.2图像预处理9.2.1图像阈值化9.2.2霍夫线变换最后1前言优质竞赛项目系列，今天要分享的是基于深度学习的视频多目标跟踪实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/d
Unity之Cinemachine教程 passionyxt Unity unity 游戏引擎 Timeline Cinemachine 相机跟随轨迹相机拍摄相机
前言Cinemachine是Unity引擎的一个高级相机系统，旨在简化和改善游戏中的相机管理。Cinemachine提供了一组强大而灵活的工具，可用于创建令人印象深刻的视觉效果，使开发人员能够更轻松地掌控游戏中的摄像机行为。主要功能和特性包括：1.虚拟摄像机系统：Cinemachine引入了虚拟摄像机的概念，允许开发人员使用相机组件的虚拟实例，而不必直接操作实际摄像机。2.目标跟踪：Cinemac
『论文阅读|2024 WACV 多目标跟踪Deep-EloU|纯中文版』 Dymc 论文深度学习深度学习
论文题目：IterativeScale-UpExpansionIoUandDeepFeaturesAssociationforMulti-ObjectTrackinginSports论文特点：作者提出了一种迭代扩展的ExpansionIoU和深度特征关联方法Deep-EIoU，用于体育场景中的多目标跟踪，旨在解决非线性、不规则运动、相似外观的在线短时多目标跟踪问题，实验表明，提出的方法对于提高跟踪
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

siamfc-pytorch代码讲解（三）：demo&track