_helen_520

Yolov5_DeepSort_Pytorch代码学习与修改记录

参考博客：多目标跟踪之数据关联算法——匈牙利算法
Yolov5_DeepSort_Pytorch仓库: https://github.com/mikel-brostrom/Yolov5_DeepSort_Pytorch.git

Deepsort的重点是：（我关注的是级联匹配这部分，重点分析casecade_matching，non-global assignment的特点和优缺点）

级联匹配 casecade_matching，non-global assignment。
指的是，每次只匹配几个track。按照since_time_update，就是连续多少帧没有匹配到dectect bbox的顺序来进行优先匹配。
联匹配完了，用IOU去打补丁。

Deepsort Paper原文重点：

参考博客：Deep SORT论文阅读总结
DeepSORT论文翻译（SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC）_alex1801的博客-CSDN博客_deepsort论文翻译
Deep SORT多目标跟踪算法代码解析 - pprp - 博客园

0. Abstract:

本方法加入了外观信息来提高SORT的性能，用余弦距离来度量 tracks 和 detection 的相似度以减少 SORT算法中ID switch的次数
并使用Kalman预测和实际detection间的平方马氏距离来滤除可能性小的匹配。

加入Reid提取的外观特征，对目标进行深度关联度量，ID switch减少了45%，外观距离减少ID交换；马氏距离滤除不大可能的匹配。

1. Introduction:

This is, because the employed association metric is only accurate when state estimation uncertainty is low. 翻译过来就是kalman的covariance小，costMatric才准确！
只有在状态估计的残差协方差的值较小(估计不确定性小，就是估计的方差小)时，关联的Metric才是准确的。
翻译一下就是：只有kf.covariance较小时，pos_cost_matrix的值才是靠谱的，准确的。 SORT的ID切换太多，都是因为kalman filter预测的mean的模型存在缺陷，其kf.covariance鲁棒性较差。

SORT算法ID switch次数高是因为采用的关联矩阵只在状态预测不确定性较小的时候准确（状态估计模型存在缺陷）

mark: 是啊，一直predict，不update，covariance就是一直累加累加。可不就变大了。costMatrix可不就变小了，然后unAssignedTrack就更容易匹配上Detect，因为它的Covariance太大了。————导致的后果就是：这个未指定的Track容易误匹配其他的detect。矩阵的横向，容易被匹配。

翻译一下：所以，Deepsort的作者怎么解决这个问题呢？——对metric打补丁！加入新的metric

因此，SORT在遮挡场景下存在缺陷。解决遮挡问题的办法：关联metric改为新的metric，新的metric结合了运动信息和外观信息。

2 SORT with deep association metric:

We adopt a conventional single hypothesis tracking methodology with recursive Kalman fifiltering and frame-by-frame data association.
我们采用了传统的单一假设跟踪方法，逐帧数据关联。

A conventional way to solve the association between the predicted Kalman states and newly arrived measurements is to build an assignment problem that can be solved using the Hungarian algorithm. Into this problem formulation we integrate motion and appearance information through combination of two appropriate metrics.
运动模型、外观模型，两个metric的组合（翻译一下：~~但绝非相加之类的metric处理，因为两个metric的意义和量纲绝非一致，无法融合再一起。~~不不不，后面还是靠权重加在一起了！！！！！）

mark:

① The Mahalanobis distance takes state estimation uncertainty into account by measuring how many standard deviations the detection is away from the mean track location. Further, using this metric it is possible to exclude unlikely associations by thresholding the Mahalanobis distance at a 95% confifidence interval computed from the inverse
χ 2 distribution.
马氏距离通过测算检测与平均轨迹位置的距离，超过多少标准差，来考虑状态估计的不确定性。此外，可以通过从逆chi^2分布计算95% 置信区间的阈值，排除可能性小的关联。

翻译一下：用公式表示就是： $dist|detection - track| < \chi^2(2)$ ，才是置信度范围内的马氏距离。
② While the Mahalanobis distance is a suitable association metric when motion uncertainty is low, in our image-space problem formulation the predicted state distribution obtained from the Kalman filtering framework provides only a rough estimate of the object location. In particular, unaccounted camera motion can introduce rapid displacements in the image plane, making the Mahalanobis distance a rather uninformed metric for tracking through occlusions. Therefore, we integrate a second metric into the assignment problem.

当运动不确定性较低时 运动协方差covariance较小时，马氏距离是一个合适的关联度量，但在我们的图像空间问题公式中，从卡尔曼滤波框架获得的预测状态分布 mean只提供了物体位置的粗略估计。特别是，未计算的摄像机运动可以在图像平面上引入快速位移， 使马氏距离成为通过遮挡跟踪的一个相当未知的度量。因此，我们在分配问题中集成了第二个度量。
翻译一下：kalman的估计是粗略的，因为有相机移动等没考虑进去。所以在遮挡的情况下，马氏距离的信息量就不够了，uninformed metric

翻译一下：这个描述说没问题也没问题，比如在动态camera中，确实是这样。Kalman的预测有它的模型假设，模型失配了就存在较大的问题。但是静态camera中，马氏距离要是计算对了，可没有那么脆弱！！！
③ 外观距离的计算：存储历史最近的100个样本的CNN特征，CNN128个维度；然后检测去挨个跟100个128的向量计算余弦距离，每一个距离都有一个阈值。在平方和100个阈值化后的[0-1]的值。作为cost的内容。这第二个阈值t(2)，我们可是在单独的另外的训练集上找到的经验值。

实际上，我们是预训练了一个CNN网络，来计算bbox的外观描述子（特征提取），这在2.4节中进一步详细解释。
④ 有了上面2个距离之后，大家都在[0-1]中取值，马氏距离pos_matrix是靠卡方距离来进行阈值化的，大于阈值的截断，同时用阈值来归一化，就是每行保证都是[0-1]之间，但是加起来的和可不是1。外观距离appearance_matrix是余弦距离，阈值化后的和。每一行∈[0,1]，加起来也不是1。就这样的两个矩阵，用权重加权起来，得到最后的代价矩阵。

马氏距离提供了有关基于运动的可能物体位置的信息，这对于短期预测特别有用

余弦距离考虑外观信息，这对于在长期遮挡之后找回ID特别有用，此时运动不那么具有辨别力

最终的使用效果是：当相机运动时，lambda=0，不适用kalman距离了，使用外观距离；但用kalman来滤除完全不可能的匹配！！！
关联成本中仅使用外观信息。关联结果仍受两方面的约束。仅当关联在两个度量的选通区域内时，称其为可接受关联：
The influence of each metric on the combined association cost can be controlled through hyperparameter λ. During our experiments we found that setting λ = 0 is a reasonable choice when there is substantial camera motion. In this setting, only appearance information are used in the association cost term. However, the Mahalanobis gate is still used to disregarded infeasible assignments based on possible object locations inferred by the Kalman filter.
每个度量对联合关联成本的影响可以通过超参数λ来控制。在我们的实验中，我们发现，当有大量的摄像机运动时，设置λ=0是一个合理的选择。在此设置中，在关联代价项中只使用外观信息。然而，阈值化之后的马氏距离仍然被用于忽略基于卡尔曼滤波器推断出的可能的对象位置的不可行的分配。
- 相应的代码如下面所示：（代码为：_fuull_cost_metric函数中，下图所示）
```
        app_gate = app_cost > self.metric.matching_threshold
        # Now combine and threshold
        cost_matrix = self._lambda * pos_cost + (1 - self._lambda) * app_cost
        cost_matrix[np.logical_or(pos_gate, app_gate)] = linear_assignment.INFTY_COST
        # Return Matrix
        return cost_matrix
```

马氏距离是二维联合高斯分布，取log后的值，可以认为是概率分布。

但是卡方分布是两个i.i.d.的高斯分布的平方相加： $Z_1^2+Z_2^2 \sim \chi^2(n)$ ，n=2, α=95%的阈值

私以为，二者的概念都不一样，为什么要放在一起讨论？???

找到原因了：The Relationship between the Mahalanobis Distance and the Chi-Squared Distribution – ML & Stats

马氏距离同卡方分布的关系：作者证明了，马氏距离（不开根号），马氏距离的随机随机变量，是服从卡方分布的。卡方分布的自由度，就是马氏距离随机变量的维度。

如在此案例中，pos_matrix里面只有x,y两个坐标信息的话（中心点坐标），那么就是自由度为2的卡方分布。这里面表示的是这个马氏距离去除5%的outliers，剩下95%的置信度值。基本上，帮助有限。

同时这里的马氏距离是没有像二元高斯分布那样，加入log det|E|的部分的。没有协方差阵的行列式。

同时mark：注意到pos_cost只是除以了卡方的GATTING_THRESHOLD，并没有做normalization。所以pos_cost里面是马氏距离的原生的值。
然后 pos_cost * λ + （1-λ）* app_cost， app_cost是∈[0,1]。------------------------（两个metric直接相加，总让我无法理解！ ）
（私以为）两个metric能够相加的前提是：两个metric被正确消除了量纲的影响，两个metric才能被等值的考虑。

超过5%的数据都不要，只要95%置信度内的数据。计算的cost矩阵不符合卡方分布啊！！！

卡方分布知识补充：

卡方分布_百度百科

此处自由度为2. 因为只有posx, posy两个维度的变量。所以是自由度为2的卡方分布。若是8，就是自由度为8的卡方分布。

这个代码里面：还对kalman计算的距离进行开根号处理！！！马氏距离的原本含义是：二元联合高斯分布，即两个标准高斯分布的联合分布。不是标准高斯的，可以正交化为标准高斯的，公式自带标准化过程(去相关、正交化、去量纲…… 类似PCA，都一个意思）。

$d=measurement - mean, {\color{Red} pos cost }= \sqrt{\frac{d*d^T}{covariance}} < \chi^2(2) or \chi^2(8)$

马氏距离的计算值，跟卡方距离对不上啊？？？？！！！！无论是原理上，还是计算过程上！！
实际的计算数值之后将贴出来，还要同样证明，每一行的track的数值相加不为1 ！！！！总的概率为1才行吧？

cost Matrix < thresh 的含义，是建立在costMatrix的值，服从卡方分布的情况下。然后斩断底部5%的数据为outliers。

补充：卡方分布临界值表 统计分布临界值表 - 豆丁网

卡方分布知识补充：卡方分布的概率密度函数和它的一些衍生问题 - 知乎

3 匹配级联：Matching Cascade

Instead of solving for measurement-to-track associations in a global assignment problem, we introduce a cascade that solves a series of subproblems. To motivate this approach, consider the following situation: When an object is occluded for a longer period of time, subsequent Kalman filter predictions increase the uncertainty associated with the object location. Consequently, probability mass spreads out in state space and the observation likelihood becomes less peaked. Intuitively, the association metric should account for this spread of probability mass by increasing the measurement-to-track distance. Counterintuitively, when two tracks compete for the same detection, the Mahalanobis distance favors larger uncertainty, because it effectively reduces the distance in standard deviations of any detection towards the projected track mean. This is an undesired behavior as it can lead to increased track fragmentations and unstable tracks. Therefore, we introduce a matching cascade that gives priority to more frequently seen objects to encode our notion of probability spread in the association likelihood.
我们没有采用全局分配问题的求解方式，（解决全局分配问题就是以全局的方式解决检测-跟踪的关联问题)，而是引入了解决一系列子问题的级联。为了激发这种方法，请考虑以下情况：当一个物体被遮挡较长时间时，随后的卡尔曼滤波预测增加了与物体位置相关的不确定性。因此，概率质量（概率密度分布函数会变平坦，没有尖峰）在状态空间中扩散，观测似然值降低（观察似然性变得不那么尖锐）。直观地说，关联度量应该通过增加测量到轨道的距离来解释概率质量的扩散。与直觉相反，当两条轨道竞争同一检测时，马氏距离倾向于更大的不确定性covariance，因为它有效地减少了任何检测对投影轨道均值的标准差距离。这是一种不希望出现的行为，因为它可能导致增加的轨道碎片和不稳定的轨道。因此，我们引入了一个匹配级联，优先考虑更常见的对象，以编码关联可能性中概率扩散的概念。

(翻译一下：我们为什么使用级联方式解决，而不是全局方式解决呢？
试想一下：当目标长时间被遮挡后，kalman预测的目标位置的误差/不确定性/covariance是会增加的。
因此，直观上来讲，我们的这个马氏距离/外观距离的metric度量应该通过增加检测-轨迹的距离值distance来将长时间遮挡导致的概率密度分布变平坦/概率下降/covariance增加，给考虑进metric中。
但是，当给一个检测框bbox分配track的时候，总是covariance大的那个track更容易被匹配。马氏距离偏爱covariance大的/也是就不确定性大的那个track。——这个是对的，没毛病
所以，这个就不合理，就会增加track碎片和不稳定的track/乱匹配的track。
所以，我们设计了一个匹配级联，优先保障频繁出现的目标匹配（先做概率高的目标匹配））

道理上是没错的！ 级联匹配跟全局匹配是出于完全不同的考虑的。

说明一下（翻译一下）：
① 为啥deepsort会出现遮挡后，covariance一直在增加的情况。——因为遮挡后就没有检测框了，就没有匹配了。deepsort只做kalman predict，协方差只做加法。deepsort不做kalman correct，就没有covariance协方差误差迭代的步骤。所以covariance一直在加加加，加到好几万了。『见：② 现象——kf.predict() 预测环节中的不合理之处 里面的covariance一直在加weight * mean』。所以covariance一直在predict，没有correct。
而在， https://github.com/Smorodov/Multitarget-tracker 的代码逻辑中，对于unAssignedTrack是会用predict自己预测的值去correct自己的卡尔曼的。那么covariance也会被迭代，总体来看，每一个track的covariance都是会像正常的kalman过程收敛的。根据过程噪声和观测噪声的噪声水平差异，会收敛在不同的水平。

参考：kalman简单例子——初始化参数对kalman性能的影响__helen_520的博客-CSDN博客_kalman 可以看到Pn+1|n+1的收敛图。

② 按照正常来说，kalman如果在unAssignedTrack也做correct的情况下，其track的covariance是会持续降低的。
对于马氏距离的cost matrix而言，covariance降低，相当于cost Matrix除以了一个小一点的值，这一行的数值都会比上一轮改行的数值大一些。
这个收敛的变化是微小的，慢慢的，趋于平稳的。所以更重要的是，需要靠马氏距离的分母，也就是空间位置/欧氏距离的部分的区分度来进行一个补偿。协方差是为了消除x,y量纲不匹配的问题。covariance的变化不能吃掉了/淹没了/覆盖了欧氏距离远近的这样一个差异/不能改变太多。这样才能让马氏距离这个metric在长时间遮挡的情况下，也能保证其距离metric的鲁棒性！

这个图是理解级联匹配算法的关键。第5行：先让上一帧匹配过的track去挑检测框，占着坑。

def _match(self, detections):
        # Split track set into confirmed and unconfirmed tracks.
        confirmed_tracks = [i for i, t in enumerate(self.tracks) if t.is_confirmed()]
        unconfirmed_tracks = [i for i, t in enumerate(self.tracks) if not t.is_confirmed()]

        # Associate confirmed tracks using appearance features.
        matches_a, unmatched_tracks_a, unmatched_detections = linear_assignment.matching_cascade(
            self._full_cost_metric,
            linear_assignment.INFTY_COST - 1,  # no need for self.metric.matching_threshold here,
            self.max_age,
            self.tracks,
            detections,
            confirmed_tracks,
        )

        # Associate remaining tracks together with unconfirmed tracks using IOU.
        iou_track_candidates = unconfirmed_tracks + [
            k for k in unmatched_tracks_a if self.tracks[k].time_since_update == 1
        ]
        unmatched_tracks_a = [
            k for k in unmatched_tracks_a if self.tracks[k].time_since_update != 1
        ]
        matches_b, unmatched_tracks_b, unmatched_detections = linear_assignment.min_cost_matching(
            iou_matching.iou_cost,
            self.max_iou_distance,
            self.tracks,
            detections,
            iou_track_candidates,
            unmatched_detections,
        )

        matches = matches_a + matches_b
        unmatched_tracks = list(set(unmatched_tracks_a + unmatched_tracks_b))
        return matches, unmatched_tracks, unmatched_detections

补充SORT部分：

sort最大的问题，是IOU的costMatrix不可靠。导致大量的ID switch。

4 Deep Appearance Descripter 深度外观描述子

我们没做metric learning，而是使用了简单的最近邻查询 nearest neighbor queries。先得离线训练一个特征提取网络。我们采用的是在一个大规模的行人重识别数据集上训练的CNN网络，这个数据集包含了超过110万张图像，其中行人有1261个。这个数据集就非常适合在行人跟踪的上下文环境中进行deep metric learning。

行人重识别的CNN网络，128维度的特征图；有280W个参数，计算32个bboxs在GTX1050的显卡上，花了30ms，所以只要是现代的GPU，非常适合online tracking。

5 Experiment 实验部分

MOT16数据集，参数设置：检测的阈值为0.3， λ= 0和Amax = 30帧。

评价指标：参考：多目标跟踪MOT16数据集和评价指标 - 知乎

MOTA Multi-object tracking accuracy 多目标跟踪准确度：结合了误报、漏检、和ID切换三个考虑因素，得到的总的跟踪精度。这个值越高越好。
定义为：
MOTP(Multiple Object Tracking Precision）多目标跟踪精确度：

与SORT相比， ID switches从1423减少到781，减少了约45％的ID切换。由于通过遮挡和遗漏来保持对象的身份，轨迹碎片会稍微增加。
还有就是MT的值增加了，就是80%的时间内track都匹配到自己的detect bbox的比例增加了。Mostly lost减少了。

我们的方法的ID交换是最少的，同时还能保持较高的MOTA分数、FM碎片率和FN 漏匹配。
如果调高了检测的置信度进行筛选，漏检增加（trick），能够大幅度提高我们算法的这些指标。（漏检对提高指标有好处！！！！我去！）

但是呢，我们观察发现，这些错误的误匹配都是由于静态场景中的零星的检测导致的。由于我们跟踪age比较大，这些静态的目标通常会加入我们的轨迹维护中。
同时呢，我们也观察到，我们的算法不存在频繁的在误报中跳来跳去的轨迹。我们的轨迹都是比较平稳的，不会有太多跳来跳去的折线轨迹。

（完）

一、Yolov5有检测输出，deepsort无track输出，原因

测试视频：MOT_trackingDemo/test_MOT16-01.avi，MOT challenge，MOT16中的test_MOT16-01.avi。把img序列压成一个avi格式的视频。

① 现象：有检测输出，无轨迹输出

原因：第68帧为止，新建了491个ID了。（代码丝毫无改动的情况下）——基本上毫无匹配

video 1/1 (66/450) /home/zhr/zhr_file/MOT_trackingDemo/test_MOT16-01.avi: 384x640 7 persons, Done. YOLO:(0.018s), DeepSort:(0.136s)
video 1/1 (67/450) /home/zhr/zhr_file/MOT_trackingDemo/test_MOT16-01.avi: 384x640 8 persons, Done. YOLO:(0.019s), DeepSort:(0.139s)
video 1/1 (68/450) /home/zhr/zhr_file/MOT_trackingDemo/test_MOT16-01.avi: 384x640 8 persons, Done. YOLO:(0.018s), DeepSort:(441.283s)

② 现象——kf.predict() 预测环节中的不合理之处：这些track基本上只出现过一次，没有过匹配，也没有被删除。且track的残差协方差巨大。
残差协方差的predict过程中，过程噪声processNoiseCov Qn与状态变量强相关，不符合kalman的基本假设！————『作者设计意图&根据未知』

同时，由于track.mean的速度部分只有第一次初始化为0，所以mean一直原地踏步，没有速度增量。一旦不被匹配，一直不会被update更新，将一直停留在原地。

③ 级联匹配逻辑：cascade_depth为max_age

由于time_since_update即，目标连续XXX帧无匹配，就不进入cost Matrix计算。

def matching_cascade(
        distance_metric, max_distance, cascade_depth, tracks, detections,
        track_indices=None, detection_indices=None):
   # cascade_depth = self.max_age   # 30
    if track_indices is None:
        track_indices = list(range(len(tracks)))
    if detection_indices is None:
        detection_indices = list(range(len(detections)))

    unmatched_detections = detection_indices
    matches = []
    for level in range(cascade_depth):
        if len(unmatched_detections) == 0:  # No detections left
            break

        track_indices_l = [
            k for k in track_indices
            if tracks[k].time_since_update == 1 + level
        ]
        if len(track_indices_l) == 0:  # Nothing to match at this level
            continue

        matches_l, _, unmatched_detections = \
            min_cost_matching(
                distance_metric, max_distance, tracks, detections,
                track_indices_l, unmatched_detections)
        matches += matches_l
    unmatched_tracks = list(set(track_indices) - set(k for k, _ in matches))
    return matches, unmatched_tracks, unmatched_detections

命令行参数设置：

 parser = argparse.ArgumentParser()
    # 检测模型：模型位置，放在当前 Yolov5_DeepSort_Pytorch 目录下就可以了
    parser.add_argument('--yolo_model', nargs='+', type=str, default='yolov5m.pt', help='model.pt path(s)')
    # ReID模型
    parser.add_argument('--deep_sort_model', type=str, default='osnet_ibn_x1_0_MSMT17')
    # 视频输入：img/video、camera
    parser.add_argument('--source', type=str, default='0', help='source')  # file/folder, 0 for webcam
    # 输出文件地址，推理output
    parser.add_argument('--output', type=str, default='inference/output', help='output folder')  # output folder
    # 推理图像尺寸设置
    parser.add_argument('--imgsz', '--img', '--img-size', nargs='+', type=int, default=[640], help='inference size h,w')
    # 目标置信度阈值筛选
    parser.add_argument('--conf-thres', type=float, default=0.5, help='object confidence threshold')
    # NMS的IOU阈值设置
    parser.add_argument('--iou-thres', type=float, default=0.5, help='IOU threshold for NMS')
    # 输出视频格式设置
    parser.add_argument('--fourcc', type=str, default='mp4v', help='output video codec (verify ffmpeg support)')
    # GPU/CPU设置
    parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
    # 是否展示tracking结果
    parser.add_argument('--show-vid', action='store_true', help='display tracking video results')
    # 是否存储视频跟踪结果
    parser.add_argument('--save-vid', action='store_true', help='save video tracking results')
    # 是否保存跟踪结果
    parser.add_argument('--save-txt', action='store_true', help='save MOT compliant results to *.txt')
    # 检测类别筛选：class 0 is person, 1 is bycicle, 2 is car... 79 is oven
    parser.add_argument('--classes', nargs='+', type=int, help='filter by class: --class 0, or --class 16 17')
    # 
    parser.add_argument('--agnostic-nms', action='store_true', help='class-agnostic NMS')
    parser.add_argument('--augment', action='store_true', help='augmented inference')
    parser.add_argument('--evaluate', action='store_true', help='augmented inference')
    parser.add_argument("--config_deepsort", type=str, default="deep_sort/configs/deep_sort.yaml")
    parser.add_argument("--half", action="store_true", help="use FP16 half-precision inference")
    parser.add_argument('--visualize', action='store_true', help='visualize features')
    parser.add_argument('--max-det', type=int, default=1000, help='maximum detection per image')
    # 使用opencv dnn for ONNX 推理
    parser.add_argument('--dnn', action='store_true', help='use OpenCV DNN for ONNX inference')
    # 工程保存到runs/track/文件夹下
    parser.add_argument('--project', default=ROOT / 'runs/track', help='save results to project/name')
    parser.add_argument('--name', default='exp', help='save results to project/name')
    # 就在已有的目录下，不要新建目录
    parser.add_argument('--exist-ok', action='store_true', help='existing project/name ok, do not increment')

# 模型位置，yolov5m.pt放在当前 Yolov5_DeepSort_Pytorch 目录下就可以了，其余参数设置如下
--source ../../MOT_trackingDemo/test_MOT16-03.avi --show-vid --exist-ok --class 0

输出结果如下：（模型读入成功）

# 输出的结果如下：
Available ReID models for automatic download
['resnet50_market1501', 'resnet50_dukemtmcreid', 'resnet50_msmt17', 'resnet50_fc512_market1501', 'resnet50_fc512_dukemtmcreid', 'resnet50_fc512_msmt17', 'mlfn_market1501', 'mlfn_dukemtmcreid', 'mlfn_msmt17', 'hacnn_market1501', 'hacnn_dukemtmcreid', 'hacnn_msmt17', 'mobilenetv2_x1_0_market1501', 'mobilenetv2_x1_0_dukemtmcreid', 'mobilenetv2_x1_0_msmt17', 'mobilenetv2_x1_4_market1501', 'mobilenetv2_x1_4_dukemtmcreid', 'mobilenetv2_x1_4_msmt17', 'osnet_x1_0_market1501', 'osnet_x1_0_dukemtmcreid', 'osnet_x1_0_msmt17', 'osnet_x0_75_market1501', 'osnet_x0_75_dukemtmcreid', 'osnet_x0_75_msmt17', 'osnet_x0_5_market1501', 'osnet_x0_5_dukemtmcreid', 'osnet_x0_5_msmt17', 'osnet_x0_25_market1501', 'osnet_x0_25_dukemtmcreid', 'osnet_x0_25_msmt17', 'resnet50_MSMT17', 'osnet_x1_0_MSMT17', 'osnet_x0_75_MSMT17', 'osnet_x0_5_MSMT17', 'osnet_x0_25_MSMT17', 'osnet_ibn_x1_0_MSMT17', 'osnet_ain_x1_0_MSMT17']
YOLOv5  v6.1-38-g7c6a335 torch 1.11.0+cu102 CUDA:0 (NVIDIA GeForce RTX 2060, 5926MiB)

Model: osnet_ibn_x1_0
- params: 2,194,640
- flops: 978,878,352
Successfully loaded pretrained weights from "deep_sort/deep/checkpoint/osnet_ibn_x1_0_MSMT17.pth"
** The following layers are discarded due to unmatched keys or layer size: ['classifier.weight', 'classifier.bias']
YOLOv5  v6.1-38-g7c6a335 torch 1.11.0+cu102 CUDA:0 (NVIDIA GeForce RTX 2060, 5926MiB)

二、MOT eval

模型文件，百度网盘链接：链接: https://pan.baidu.com/s/11I2QNucxdFAa1UWePyUrmg 密码: kqck

下载模型：参考 https://github.com/mikel-brostrom/Yolov5_DeepSort_OSNet/wiki/Evaluation，下载地址为：https://drive.google.com/file/d/1gglIwqxaH2iTvy6lZlXuAcMpd_U0GCUb/view谷歌网盘地址。如果有需要，我之后可以放在百度云盘里面。
下载crowdhuman_yolov5m.pt到yolov5/weights的文件夹中。
git clone https://github.com/JonathonLuiten/TrackEval
下载data.zip到Yolov5_Deepsort_Pytorch主文件夹中，data.zip的下载地址为：https://omnomnom.vision.rwth-aachen.de/data/TrackEval/data.zip
下载MOT16.zip到Yolov5_Deepsort_Pytorch主文件夹中，MOT16.zip的下载地址为：https://motchallenge.net/data/MOT16.zip
在Yolov5_DeepSort_Pytorch文件夹下：运行命令 ./MOT_eval/eval.sh

MOT16 评估中：

继续跑，最后看结果和效果。是否有result统计，以及参数统计的结果。

遇到的傻问题：运行完了之后，该存的数据不知道存到哪里去了。郁闷了好久。

结果发现是脚本的问题，MOT16_eval/eval.sh，仔细看里面的脚本，里面的路径是作者设置好了的！！！！

所以最后去了作者事先设置好了的路径下面了。

$ python ~/Yolov5_DeepSort_OSNet/MOT16_eval/TrackEval/scripts/run_mot_challenge.py --BENCHMARK MOT16  --TRACKERS_TO_EVAL ch_yolov5m_deep_sort --SPLIT_TO_EVAL train --METRICS CLEAR Identity  --USE_PARALLEL False --NUM_PARALLEL_CORES 4

Eval Config:
USE_PARALLEL         : False                         
NUM_PARALLEL_CORES   : 4                             
BREAK_ON_ERROR       : True                          
RETURN_ON_ERROR      : False                         
LOG_ON_ERROR         : /home/zhr/Yolov5_DeepSort_OSNet/MOT16_eval/TrackEval/error_log.txt
PRINT_RESULTS        : True                          
PRINT_ONLY_COMBINED  : False                         
PRINT_CONFIG         : True                          
TIME_PROGRESS        : True                          
DISPLAY_LESS_PROGRESS : False                         
OUTPUT_SUMMARY       : True                          
OUTPUT_EMPTY_CLASSES : True                          
OUTPUT_DETAILED      : True                          
PLOT_CURVES          : True                          

MotChallenge2DBox Config:
PRINT_CONFIG         : True                          
GT_FOLDER            : /home/zhr/Yolov5_DeepSort_OSNet/MOT16_eval/TrackEval/data/gt/mot_challenge/
TRACKERS_FOLDER      : /home/zhr/Yolov5_DeepSort_OSNet/MOT16_eval/TrackEval/data/trackers/mot_challenge/
OUTPUT_FOLDER        : None                          
TRACKERS_TO_EVAL     : ['ch_yolov5m_deep_sort']      
CLASSES_TO_EVAL      : ['pedestrian']                
BENCHMARK            : MOT16                         
SPLIT_TO_EVAL        : train                         
INPUT_AS_ZIP         : False                         
DO_PREPROC           : True                          
TRACKER_SUB_FOLDER   : data                          
OUTPUT_SUB_FOLDER    :                               
TRACKER_DISPLAY_NAMES : None                          
SEQMAP_FOLDER        : None                          
SEQMAP_FILE          : None                          
SEQ_INFO             : None                          
GT_LOC_FORMAT        : {gt_folder}/{seq}/gt/gt.txt   
SKIP_SPLIT_FOL       : False                         

CLEAR Config:
METRICS              : ['CLEAR', 'Identity']         
THRESHOLD            : 0.5                           
PRINT_CONFIG         : True                          

Identity Config:
METRICS              : ['CLEAR', 'Identity']         
THRESHOLD            : 0.5                           
PRINT_CONFIG         : True                          

Evaluating 1 tracker(s) on 7 sequence(s) for 1 class(es) on MotChallenge2DBox dataset using the following metrics: CLEAR, Identity, Count


Evaluating ch_yolov5m_deep_sort

    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-02)     0.2778 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.2561 sec
    CLEAR.eval_sequence()                                                  0.0542 sec
    Identity.eval_sequence()                                               0.0127 sec
    Count.eval_sequence()                                                  0.0000 sec
1 eval_sequence(MOT16-02, ch_yolov5m_deep_sort)                          0.6029 sec
    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-04)     1.1343 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.5486 sec
    CLEAR.eval_sequence()                                                  0.1355 sec
    Identity.eval_sequence()                                               0.0331 sec
    Count.eval_sequence()                                                  0.0000 sec
2 eval_sequence(MOT16-04, ch_yolov5m_deep_sort)                          1.8559 sec
    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-05)     0.1684 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.3186 sec
    CLEAR.eval_sequence()                                                  0.0646 sec
    Identity.eval_sequence()                                               0.0176 sec
    Count.eval_sequence()                                                  0.0000 sec
3 eval_sequence(MOT16-05, ch_yolov5m_deep_sort)                          0.5716 sec
    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-09)     0.1236 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.2047 sec
    CLEAR.eval_sequence()                                                  0.0442 sec
    Identity.eval_sequence()                                               0.0105 sec
    Count.eval_sequence()                                                  0.0000 sec
4 eval_sequence(MOT16-09, ch_yolov5m_deep_sort)                          0.3847 sec
    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-10)     0.1991 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.2612 sec
    CLEAR.eval_sequence()                                                  0.0573 sec
    Identity.eval_sequence()                                               0.0138 sec
    Count.eval_sequence()                                                  0.0000 sec
5 eval_sequence(MOT16-10, ch_yolov5m_deep_sort)                          0.5336 sec
    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-11)     0.1906 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.3497 sec
    CLEAR.eval_sequence()                                                  0.0705 sec
    Identity.eval_sequence()                                               0.0178 sec
    Count.eval_sequence()                                                  0.0000 sec
6 eval_sequence(MOT16-11, ch_yolov5m_deep_sort)                          0.6315 sec
    MotChallenge2DBox.get_raw_seq_data(ch_yolov5m_deep_sort, MOT16-13)     0.2175 sec
    MotChallenge2DBox.get_preprocessed_seq_data(pedestrian)                0.2918 sec
    CLEAR.eval_sequence()                                                  0.0607 sec
    Identity.eval_sequence()                                               0.0149 sec
    Count.eval_sequence()                                                  0.0000 sec
7 eval_sequence(MOT16-13, ch_yolov5m_deep_sort)                          0.5873 sec

All sequences for ch_yolov5m_deep_sort finished in 5.17 seconds

CLEAR: ch_yolov5m_deep_sort-pedestrianMOTA      MOTP      MODA      CLR_Re    CLR_Pr    MTR       PTR       MLR       sMOTA     CLR_TP    CLR_FN    CLR_FP    IDSW      MT        PT        ML        Frag      
MOT16-02                           33.034    77.764    33.78     37.251    91.476    16.667    37.037    46.296    24.751    6643      11190     619       133       9         20        25        245       
MOT16-04                           63.698    76.456    63.97     72.023    89.943    42.169    40.964    16.867    46.741    34252     13305     3830      129       35        34        14        387       
MOT16-05                           58.17     78.043    59.695    71.003    86.262    36        52        12        42.579    4841      1977      771       104       45        65        15        154       
MOT16-09                           61.975    83.36     63.23     76.431    85.272    60        36        4         49.256    4018      1239      694       66        15        9         1         76        
MOT16-10                           52.874    76.762    54.067    59.19     92.035    25.926    50        24.074    39.119    7291      5027      631       147       14        27        13        308       
MOT16-11                           66.296    85.093    66.721    78.777    86.727    50.725    33.333    15.942    54.553    7227      1947      1106      39        35        23        11        66        
MOT16-13                           38.262    74.881    39.17     45.197    88.235    16.822    45.794    37.383    26.909    5175      6275      690       104       18        49        40        260       
COMBINED                           54.692    77.905    55.346    62.901    89.277    33.075    43.907    23.017    40.794    69447     40960     8341      722       171       227       119       1496      

Identity: ch_yolov5m_deep_sort-pedestrianIDF1      IDR       IDP       IDTP      IDFN      IDFP      
MOT16-02                           31.815    22.385    54.971    3992      13841     3270      
MOT16-04                           63.189    56.894    71.049    27057     20500     11025     
MOT16-05                           57.49     52.405    63.667    3573      3245      2039      
MOT16-09                           51.6      48.925    54.584    2572      2685      2140      
MOT16-10                           54.536    44.804    69.667    5519      6799      2403      
MOT16-11                           62.204    59.353    65.343    5445      3729      2888      
MOT16-13                           44.828    33.895    66.172    3881      7569      1984      
COMBINED                           55.303    47.134    66.898    52039     58368     25749     

Count: ch_yolov5m_deep_sort-pedestrianDets      GT_Dets   IDs       GT_IDs    
MOT16-02                           7262      17833     62        54        
MOT16-04                           38082     47557     118       83        
MOT16-05                           5612      6818      103       125       
MOT16-09                           4712      5257      40        25        
MOT16-10                           7922      12318     84        54        
MOT16-11                           8333      9174      107       69        
MOT16-13                           5865      11450     74        107       
COMBINED                           77788     110407    588       517       

Timing analysis:
MotChallenge2DBox.get_raw_seq_data                                     2.3113 sec
MotChallenge2DBox.get_preprocessed_seq_data                            2.2309 sec
CLEAR.eval_sequence                                                    0.4870 sec
Identity.eval_sequence                                                 0.1204 sec
Count.eval_sequence                                                    0.0000 sec
eval_sequence                                                          5.1675 sec
Evaluator.evaluate                                                     5.1695 sec

https://github.com/mikel-brostrom/Yolov5_DeepSort_OSNet/wiki/Evaluation

作者给出的结果是：

数据基本上对应的上，我跑出来的指标略有下降。

2.1 指标分析

参考博客：多目标跟踪MOT16数据集和评价指标 - 知乎

三、新版本的代码阅读分析

GitHub - mikel-brostrom/Yolov5_DeepSort_OSNet: Real-time multi-camera multi-object tracker using YOLOv5 and Deep SORT with OSNet

源码仓库地址： https://github.com/mikel-brostrom/Yolov5_DeepSort_OSNet

大体架构如此所示：

track的构成：

预测阶段：对track的mean和covariance进行更新。

mean=Fn * mean, $X_{n+1|n}=F_nX_n$ ， $P_{n+1|n}=F_nP_{n|n}F_n^T+Q_n$ ，[x_pos, y_pos, width, height, v_x, v_y, v_wid, v_hei] = [x_pos+v_x, y_pos+v_y, width+v_wid, height+v_hei, v_x, v_y, v_wid, v_hei]

3.1 新建track时，kalman filter的初始化 covariance跟bbox本身息息相关

3.2 kalman filter predict 所有的track的kf都会predict

预测：残差协方差的迭代过程——就是越加越多。

3.3 kalman filter的update，即correct()步骤，covariance小了很多。

~~这里的correct的校正公式，并不跟传统的kalman校正公式吻合。~~

原因是python的求逆的代码的理解： $x=A^{-1}b, K=P_{n+1|n}H_{n+1}^T(H_{n+1}P_{n+1|n}H_{n+1}^T+R_{n+1})^{-1}$ ，所以就是求 $K(H_{n+1}P_{n+1|n}H_{n+1}^T+R_{n+1}) =P_{n+1|n}H_{n+1}^T$ 的解x(K)。

所以这样求得的就是K，kalman_gain，卡尔曼增益。projected_conv == $(H_{n+1}P_{n+1|n}H_{n+1}^T+R_{n+1})$ ,projected_conv是取左上角部分，projected_mean也是取前半部分。

这样的话，covariance衰减的速度更慢了。————————主要是投影的projected_cov为4×4，但covariance为8×8，所以要转换矩阵size。没有用Hn-update_mat来转换，而是使用了KPK^T的格式来进行的转换。

这里的covariance是（）

① projected_convariance的理解：Hn*Convariace*Hn^T = 取出covariance的左上角的4×4的矩阵块。

② projected_cov对角加载上Qn，过程噪声的协方差，就变成了kalman gain中的求逆部分。===projected_cov ，加的是Rn，是观测噪声。

所以 $(H_{n+1}P_{n+1|n}H_{n+1}^T+R_{n+1})$ 中Rn的作用，就是对角加载了（目前而言的作用）。取出covariance的左上角，再对角加载。

你可能感兴趣的:(deepsort)

YOLO系列目标检测数据集大全_yolo数据集(1) 2401_84187537 程序员 YOLO 目标检测人工智能
Darknet版YOLOv4猫狗识别训练好的权重文件：https://download.csdn.net/download/zhiqingAI/85541214Darknet版YOLOv3猫狗识别训练好的权重文件：https://download.csdn.net/download/zhiqingAI/85541209DeepSORT-YOLOv5猫狗检测和跟踪+可视化目标运动轨迹yolov7猫狗
计算机设计大赛深度学习交通车辆流量分析 - 目标检测与跟踪 - python opencv iuerfee python
文章目录0前言1课题背景2实现效果3DeepSORT车辆跟踪3.1DeepSORT多目标跟踪算法3.2算法流程4YOLOV5算法4.1网络架构图4.2输入端4.3基准网络4.4Neck网络4.5Head输出层5最后0前言优质竞赛项目系列，今天要分享的是**基于深度学习得交通车辆流量分析**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工
Ubuntu16.04搭建YOLOv5+DeepSORT及训练自己的数据集小白兔555
具体参考：（如果侵权，速删）https://zhuanlan.zhihu.com/p/354945895https://blog.csdn.net/qq_44703886/article/details/1213276433.https://blog.csdn.net/weixin_50008473/article/details/1223475824.https://zhuanlan.zhihu
计算机视觉实战项目3（图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等）毕设阿力计算机视觉目标检测目标跟踪
车辆跟踪及测距该项目一个基于深度学习和目标跟踪算法的项目，主要用于实现视频中的目标检测和跟踪。该项目使用了YOLOv5目标检测算法和DeepSORT目标跟踪算法，以及一些辅助工具和库，可以帮助用户快速地在本地或者云端上实现视频目标检测和跟踪！教程博客_传送门链接------->yolov5单目测距+速度测量+目标跟踪（算法介绍和代码）-CSDN博客yolov5deepsort行人/车辆（检测+计数
DeepSORT算法实现车辆和行人跟踪计数和是否道路违规检测（代码＋教程）毕设阿力算法
DeepSORT算法是一种用于目标跟踪的算法，它可以对车辆和行人进行跟踪计数，并且可以检测是否存在道路违规行为。该算法采用深度学习技术来提取特征，并使用卡尔曼滤波器来估计物体的速度和位置。DeepSORT算法通过首先使用目标检测算法来识别出场景中的车辆和行人，然后使用卷积神经网络（CNN）来提取物体的特征。接着，该算法使用余弦相似度来计算物体之间的相似度，并使用匈牙利算法来匹配跟踪器和检测器之间的
yolov5 deepsort 行人/车辆（检测 +计数+跟踪+测距+测速）毕设阿力 YOLO 目标跟踪目标检测
YOLOv5和DeepSORT是两种常用的计算机视觉技术，它们可以结合使用以实现行人和车辆的目标检测和跟踪。这种技术在交通监控、智慧城市等领域中具有广泛的应用。YOLOv5是一种基于深度学习的目标检测算法，它可以实现高效的目标检测和分类。与传统的目标检测算法相比，YOLOv5具有更快的检测速度和更高的准确率。而DeepSORT则是一种基于多目标跟踪的算法，它可以对相邻帧之间的目标进行跟踪，并输出目
【Deepsort-yolov5实现无人机视觉检测和跟踪】 XTX_AI 学习专区无人机视觉检测深度学习
Deepsort-yolov5无人机视觉检测和跟踪1.YOLOv5无人机视觉检测1.1训练无人机数据集1.2无人机检测结果2.Deepsort跟踪2.1算法原理2.2无人机跟踪实现2.3无人机运动轨迹可视化2.4目标质心点保存2.5目标重识别模型要注意的问题3.飞机目标检测无人机视觉检测和跟踪系列数据集一数据集二数据集三数据集四数据集五数据集六数据集七数据集八无人机视频段YOLOv5无人机训练权重
Jetson TX2安装编译pytorch 啊啊啊啊啊1231
工作需要将deepsort移植到TX2上面，从网上搜集了教程。安装教程：1.最好是重新安装一个jetpack系统，3.2及以上都可以。2.首先安装环境依赖：因为是在python3下面安装pytorch，所以使用pip3。sudoaptinstalllibopenblas-devlibatlas-base-devliblapack-dev#ForOpenCVsudoaptinstallliblapa
基于Yolov5+Deepsort+SlowFast算法实现视频目标识别、追踪与行为实时检测爱编码的小陈 Python YOLO
前言前段时间打算做一个目标行为检测的项目，翻阅了大量资料，也借鉴了不少项目，最终感觉Yolov5+Deepsort+Slowfast实现实时动作检测这个项目不错，因此进行了实现。一、核心功能设计总的来说，我们需要能够实现实时检测视频中的人物，并且能够识别目标的动作，所以我们拆解需求后，整理核心功能如下所示：yolov5实现目标检测，确定目标坐标deepsort实现目标跟踪，持续标注目标坐标slow
YOLOv8自带的追踪算法简单使用教程万里不留行 YOLO YOLO 算法 opencv
YOLOv8自带的追踪算法使用的是BoT-SORT和ByteTrack，默认是BoT-SORT算法，总体效果感觉不如deepsort。下面是官方提供的运行代码fromcollectionsimportdefaultdictimportcv2importnumpyasnpfromultralyticsimportYOLO#加载YOLOv8模型model=YOLO('yolov8s.pt')#这里填写
目前目标跟踪算法研究202308 爱吃油淋鸡的莫何目标跟踪算法人工智能
目标跟踪算法综述——附各算法源码和论文概述TBD（two-shot）：SORT、DeepSORT、StrongSORT、ByteTrack、OC-SORTJDE（one-shot）：BoT-SORT、0MutiSORT(多目标跟踪策略)0.1track+detection训练一个网络使它最小化类内误差，最大化类间误差。1DeepSORT1.1原理1.1.1SORT(2016)SORT论文：SIMP
大创项目推荐深度学习疫情社交安全距离检测算法 - python opencv cnn laafeer python
文章目录0前言1课题背景2实现效果3相关技术3.1YOLOV43.2基于DeepSort算法的行人跟踪4最后0前言优质竞赛项目系列，今天要分享的是**基于深度学习疫情社交安全距离检测算法**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https://gitee.com/dancheng-se
YOLO+SlowFast+DeepSORT 简单实现视频行为识别 AAI机器之心 YOLO 音视频云计算 openstack 大数据深度学习 python
前段时间刷短视频看到过别人用摄像头自动化监控员工上班状态，比如标注员工是不是离开了工位，在位置上是不是摸鱼。虽然是段子，但是这个是可以用识别技术实现一下，于是我在网上找，知道发现了SlowFast，那么下面就用SlowFast简单测试一下视频的行为识别。工具简介YOLOYOLO是一个基于深度学习神经网络的对象识别和定位算法，前面我也用v5s训练了标注的扑克牌，实现了图片或视频中的点数识别，这里就跳
技术分享 | 吊舱目标追踪---deepsort原理讲解阿木实验室
file一、多目标追踪的主要步骤获取原始视频帧利用目标检测器对视频帧中的目标进行检测将检测到的目标的框中的特征提取出来，该特征包括表观特征（方便特征对比避免IDswitch）和运动特征（运动特征方便卡尔曼滤波对其进行预测）计算前后两帧目标之前的匹配程度（利用匈牙利算法和级联匹配），为每个追踪到的目标分配ID。二、sort流程Deepsort的前身是sort算法，sort算法的核心是卡尔曼滤波算法和
运行yolov5_deepsort报错AttributeError: ‘Detect‘ object has no attribute ‘m‘ 李小晨同学机器学习 pytorch
我自己训练的模型在自己的代码里面能进行预测，但是在运行yolov5_deepsort的时候报错AttributeError:'Detect'objecthasnoattribute'm'报错详情：Traceback(mostrecentcalllast):File"L:/chen/yolov5_material/unbox_yolov5_deepsort_counting-main/main.py
YOLO+SlowFast+DeepSORT 简单实现视频行为识别北桥苏 YOLO python 人工智能
前言前段时间刷短视频看到过别人用摄像头自动化监控员工上班状态，比如标注员工是不是离开了工位，在位置上是不是摸鱼。虽然是段子，但是这个是可以用识别技术实现一下，于是我在网上找，知道发现了SlowFast，那么下面就用SlowFast简单测试一下视频的行为识别。工具简介YOLOYOLO是一个基于深度学习神经网络的对象识别和定位算法，前面我也用v5s训练了标注的扑克牌，实现了图片或视频中的点数识别，这里
大创项目推荐深度学习交通车辆流量分析 - 目标检测与跟踪 - python opencv laafeer python
文章目录0前言1课题背景2实现效果3DeepSORT车辆跟踪3.1DeepSORT多目标跟踪算法3.2算法流程4YOLOV5算法4.1网络架构图4.2输入端4.3基准网络4.4Neck网络4.5Head输出层5最后0前言优质竞赛项目系列，今天要分享的是**基于深度学习得交通车辆流量分析**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工
基于YOLOv5+Deepsort 的PCB缺陷检测及计数系统 code2035 OpenCV从入门到精通 Deepsort yolo从入门到精通 YOLO deepsort opencv
背景：PCB（PrintedCircuitBoard，印刷电路板）是电子产品中至关重要的组成部分，它承载着电子元器件并提供电气连接。在PCB制造过程中，由于工艺、材料或设备等因素的影响，可能会引入各种缺陷，例如短路、开路、焊接不良等。这些缺陷可能导致电路功能失效、性能下降甚至严重的安全隐患。传统的PCB缺陷检测方法主要依赖于人工目视检查，存在以下问题：人工检查速度慢、容易疲劳和出错，对于大规模生产
多目标跟踪算法原理（Sort&DeepSort&ByteTrack) 幸运的的飞起目标跟踪算法人工智能
目录前言：主要步骤：一、Sort算法流程图：算法步骤：知识掌握：IOU匹配：卡尔曼滤波算法：匈牙利算法：具体流程：算法步骤（假设矩阵为NxN方阵）：举个实例：假设有3个工人和3个任务，每个工人可以完成每项任务的不同工作量。我们的目标是将工人分配到任务上，使得总工作量最小。二、DeepSort算法流程图：算法步骤：必备知识：级联匹配：三、ByteTrack算法主要思想：BYTE流程图：BYTE步骤：
YOLOv8+DeepSORT多目标车辆跟踪（车辆检测+跟踪+车辆计数）（内附免费资源+部署讲解） -嘟囔着拯救世界- YOLOv8 YOLO python 人工智能 yolov8 深度学习 pytorch
目录一、前言二、开发环境（前提条件）三、环境搭建教程3.1、创建虚拟环境3.2、选择虚拟环境并安装所需要的包3.3、运行代码步骤3.3.1、克隆git储存库3.3.2、转到克隆库的文件夹下3.3.3、安装依赖项3.3.4、转到检测目录下3.3.5、用于yolov8物体检测+跟踪+车辆计数四、效果图一、前言欢迎阅读本篇博客！今天我们深入探索YOLOv8+deepsort视觉跟踪算法。结合YOLOv8
Python+Yolov8+onnx-deepsort方法物体人流量识别统计荷塘月色2 python YOLO 开发语言
程序示例精选Python+Yolov8+onnx-deepsort方法物体人流量识别统计如需安装运行环境或远程调试，见文章底部个人QQ名片，由专业技术人员远程协助！前言这篇博客针对《Python+Yolov8+onnx-deepsort方法物体人流量识别统计》编写代码，代码整洁，规则，易读。学习与应用推荐首选。运行结果文章目录一、所需工具软件二、使用步骤1.主要代码2.运行结果三、在线协助一、所需
DeepSORT（特点和核心） New___dream 深度学习 YOLO YOLO 笔记 python
DeepSORT是一种基于深度学习的目标跟踪算法，它结合了卡尔曼滤波和匈牙利算法，可以在视频中对目标进行跟踪。DeepSORT的主要优点是可以在多个帧之间跟踪目标，即使目标在某些帧中消失或重新出现。它还可以处理多个目标之间的交叉和遮挡。以下是DeepSORT的一些关键特点：1.使用卷积神经网络（CNN）进行目标检测，以识别视频帧中的目标。2.使用卡尔曼滤波进行目标跟踪，以预测目标的位置和速度。3.
英特尔深度相机D455实现YOLOv5+deeepsort行人车辆测速、测距、追踪 code2035 yolo从入门到精通 Deepsort 机器视觉从入门到精通 YOLO deepsort 结构光
目录1，YOLOv5+deepsort原理简介2，项目介绍3，结果展示编辑IntelRealSenseD435、D455等D4系列：IntelD4系列深度相机是由英特尔（Intel）公司推出的一款深度感知摄像头，专为实现计算机视觉和深度学习应用而设计。这款相机使用了英特尔的深度感知技术，结合了摄像头和红外（IR）传感器，可以提供高质量的深度图像和RGB彩色图像，为开发者提供了丰富的数据源，用于各种
006yolov5加deepsort进行目标跟踪 bbfbdfbfghfh 深度学习 YOLO 目标跟踪人工智能深度学习机器学习
直接上效果图代码仓库和视频演示b站视频006期：到此一游7758258的个人空间-到此一游7758258个人主页-哔哩哔哩视频代码展示：YOLOv5DeepSORT介绍YOLOv5DeepSORT是一个结合了YOLOv5和DeepSORT算法的目标检测与多目标跟踪系统。让我为您详细解释一下这两个部分：YOLOv5：YOLO（YouOnlyLookOnce）是一种实时目标检测算法，YOLOv5是其第
yolov5 deepsort-船舶目标检测+目标跟踪+单目测距+速度测量从懒虫到爬虫 YOLO 目标检测目标跟踪
目标跟踪是一种计算机视觉技术，通过分析图像或视频数据中的目标，实时追踪目标的位置和运动轨迹。在本文中，我们将详细介绍目标跟踪的原理、方法和应用，并探讨其在各个领域中的潜在价值。1.目标跟踪技术的基本原理目标跟踪技术的基本原理是通过提取目标特征，通过计算机算法实现目标在图像或视频序列中的连续追踪。目标特征可以包括颜色、纹理、形状等方面的信息。基于特征的跟踪方法通常包括卡尔曼滤波器、粒子滤波器等。此外
yolov8实时推理目标识别、区域分割、姿态识别 Qt GUI LittroInno YOLO qt 开发语言
介绍一个GUI工具，可以实时做yolov8模型推理，包括目标检测、姿态识别、跟踪、区域分割等操作。可以接入图像、视频或者RTSP视频流进行验证。推理模型用的是yolov8转onnx之后的。用ultralytics自带的转换即可，不用带NMS。框架用的是Qt任务可以分为：目标识别、区域分割、姿态识别。模型输入支持yolov8n,s,m,l,x。跟踪器支持deepsort和bytetrack两种。输入
YOLOv8-DeepSort/ByteTrack-PyQt-GUI：全面解决方案，涵盖目标检测、跟踪和人体姿态估计从懒虫到爬虫 YOLO pyqt 目标检测
YOLOv8-DeepSort/ByteTrack-PyQt-GUI是一个多功能图形用户界面，旨在充分发挥YOLOv8在目标检测/跟踪和人体姿态估计/跟踪方面的能力，与图像、视频或实时摄像头流进行无缝集成。支持该应用的Python脚本使用ONNX格式的YOLOv8模型，确保各种人工智能（AI）任务的高效和准确执行。全面的AI任务该应用支持一系列AI任务，包括：目标检测：使用YOLOv8模型在图像或
目标检测、目标跟踪、重识别从懒虫到爬虫目标检测目标跟踪人工智能
文章目录环境前言项目复现特征提取工程下载参考资料环境ubuntu18.0464位yolov5deepsortfastreid前言基于YOLOv5和DeepSort的目标跟踪介绍过针对行人的检测与跟踪。本文介绍另一个项目，结合FastReid来实现行人的检测、跟踪和重识别。作者给出的2个主要实例，也是非常的实用，包括行人流量的统计、人群中特定目标的查找与跟踪。项目复现首先，创建个全新的虚拟环境con
029yolov5_deepsort目标跟踪行人统计数量 hlalfsf 深度学习 YOLO 目标跟踪人工智能
本次是基于yolov5_deepsort的目标跟踪行人统计数量，demo演示观看bilibili029期到此一游7758258的个人空间_哔哩哔哩_bilibili上效果图会自动统计视频或摄像头中行人通过自定义的碰撞区的人数有多少。demo展示：主要运行demo只有01main.py它会读取video下的视频文件进行识别。
基于姿态估计的3D动画生成新缸中之脑 3d
在本文中，我们将尝试通过跟踪2D视频中的动作来渲染人物的3D动画。在3D图形中制作人物动画需要大量的运动跟踪器来跟踪人物的动作，并且还需要时间手动制作每个肢体的动画。我们的目标是提供一种节省时间的方法来完成同样的任务。我们对这个问题的解决方案包括以下步骤：2D姿态估计：人体至少需要17个标志点才能完整描述其姿态。DeepSORT+FaceReID：跟踪姿势的运动。将2D提升到3D：我们从上一步获得
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc