PaperWeekly

浅谈多目标跟踪中的相机运动

©PaperWeekly 原创 · 作者｜黄飘

学校｜华中科技大学硕士生

研究方向｜多目标跟踪

之前的文章中我介绍了 Kalman 滤波器，这个算法被广泛用于多目标跟踪任务中的行人运动模型。然而实际场景中存在有很多相机运动，仅仅依赖行人运动模型是不够的。这次我主要介绍下相机运动模型，以对极几何和 ECC 为主。完整的代码和示例我都放在了 Github：

https://github.com/nightmaredimple/libmot

多目标跟踪中的相机运动

在多目标跟踪场景中往往存在有复杂的运动模式，这些模式除了行人这类非刚性运动，还有相机这类刚性运动。以 MOT Challenge 数据集为例，其中就存在大量相机运动场景，甚至超过了静态相机场景数。

比如 MOT17-13 号视频中车载相机在车辆转弯时对于两个运动速度较慢行人的视角：

我们从示意图可以看到，由于车辆转弯速度很快，上一帧的行人位置映射到下一帧就变成了另一个的位置。因此相机运动对于多目标跟踪的影响很大，尤其是仅依赖运动信息的模型，相机的运动会严重干扰运动模型。

对极几何

2.1 对极几何模型

关于相机运动方面的知识，我在之前介绍单目深度估计中的无监督模型时介绍过，即将变化差异不剧烈的两帧画面近似看作不同相机视角下同一场景的画面，也就是对极几何，这一点可以看看《计算机视觉中的多视几何》中关于相机几何方面的知识：

不过这里我需要先解释一下一些概念，以方便后续模型的讲解：

1. 基线 [baseline]：直线 CC'为基线。

2. 对极平面束 [epipolar pencil]：以基线为轴的平面束。

3. 对极平面 [epipolar plane]：任何包含基线的平面都称为对极平面。

4. 对极点 [epipole]：摄像机的基线与每幅图像的交点。比如，上图中的点 x 和 x'。

5. 对极线 [epipolar line]：对极平面与图像的交线。

6. 5点共面：点 x，x'，摄像机中心 C、C'，空间点 X 是 5 点共面的。

7. 极线约束：两极线上点的对应关系。

接下来，我们首先看一篇 ACM MM2019 的论文 TNT [1]，这是一篇研究端到端运动信息和表观信息结合框架的论文：

不过这里我们要讲的是其提出来的相机运动模型：

我们可以看到，作者将行人运动和相机运动结合了，其中目标函数的第一部分是利用了对极几何中本质矩阵 F 的性质，相关的理论推导可以看下图：

其中 x 表示的目标框的四个顶点的坐标信息，第二部分中作者则是假设两帧中的同一目标的形状近似不变。因此我们只需要求得本质矩阵 F，即可根据上一帧目标框信息，利用最小二乘法求得下一帧目标框信息。

关于本质矩阵 F 的求解，作者提到基于 SURF 特征点提取和 Ransac 采样进行估计。

不过作者也没有给出详细的实现过程，我这里试着做一下理论推导。首先由于作者在目标函数中要求了目标框形状的一致性，那么我们不妨直接把下一帧目标框的形状信息看做已知的。

其次，我们先假设本质矩阵 F 已经被估计出来了，这个矩阵是 3x3 的形状，那么为了推导方便，我这里做一个假设：

对于第 t 帧的任意一个目标框的每一个节点，这里由于是三维的几何信息，所以添加一个 z 轴坐标，令为一个已知的三维向量，那么一个目标框就存在四个这样的三维向量，不妨看作一个 4x3 的矩阵 M。

那么就可以将目标函数展开，这里面的 (w,h) 为已知信息，(x,y) 为下一帧目标框的左上角坐标：

很明显这就是一个典型的 Ax=b 问题，后面的问题就迎刃而解了。

2.2 实验分析

为了保证效率，我这里采用 ORB 特征提取策略，然后采用 brute force 的匹配策略：

class Epipolar(object):
    def __init__(self, feature_method = 'orb', match_method = 'brute force',
                 metric = cv2.NORM_HAMMING, n_points = 50, nfeatures = 500,
                 scaleFactor = 1.2, nlevels = 8):
        """Using Epipolar Geometry to Estimate Camara Motion

        Parameters
        ----------
        feature_method : str
            the method of feature extraction, the default is ORB, more methods will be added in the future
        match_method : str
            the method of feature matching, the default is brute force, more methods will be added in the future
        metric: metrics in cv2
            distance metric for feature matching
        n_points: int
            numbers of matched points to be considered
        nfeatures: int
            numbers of features to be extract
        scaleFactor: float
            scale factor for orb
        nlevels: float
            levels for orb
        """
        self.metric = metric
        if feature_method == 'orb':
            self.feature_extractor = cv2.ORB_create(nfeatures = nfeatures,
                                                    scaleFactor = scaleFactor, nlevels = nlevels)
        if match_method == 'brute force':
            self.matcher = cv2.BFMatcher(metric, crossCheck=True)

        self.n_points = n_points


    def FeatureExtract(self, img):
        """Detect and Compute the input image's keypoints and descriptors

        Parameters
        ----------
        img : ndarray of opencv
            An HxW(x3) matrix of img

        Returns
        -------
        keypoints : List of cv2.KeyPoint
            using keypoint.pt can see (x,y)
        descriptors: List of descriptors[keypoints, features]
            keypoints: keypoints which a descriptor cannot be computed are removed
            features: An Nx32 ndarray of unit8 when using "orb" method
        """
        if img.ndim == 3:
            img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        # find the keypoints with ORB
        keypoints = self.feature_extractor.detect(img, None)
        # compute the descriptors with ORB
        keypoints, descriptors = self.feature_extractor.compute(img, keypoints)
        return keypoints, descriptors

‍

那么对于本质矩阵的估计和最小二乘法的应用，都可以直接利用已有的工具箱 opencv 和 numpy 搞定：

 def GetFundamentalMat(self, keypoints1, descriptors1, keypoints2, descriptors2):
        """Estimate FunfamentalMatrix using BF matcher and ransac
            [p2;1]^T K^(-T) E K^(-1) [p1;1] = 0, T means transpose, K means the intrinsic matrix of camera
            F = K^(-T) E K^(-1)

        Parameters
        ----------
        keypoints : List of cv2.KeyPoint
            using keypoint.pt can see (x,y)
        descriptor : ndarray
            An Nx32 matrix of descriptors

        Returns
        -------
        F: ndarray
            A 3x3 Matrix of Fundamental Matrix
        mask: ndarray
            A Nx1 Matrix of those inline points
        pts1: List of cv2.KeyPoint
            keypoints matched
        pts2: List of cv2.KeyPoint
            keypoints matched
        matches : List of matches
            distance - distance of two points,
            queryIdx - query image's descriptor id, default is the second image
            trainIdx - train image's descriptor id, default is the second image
            imageIdx - train image's id, default is 0
        """
        # matching points
        matches = self.matcher.match(descriptors1, descriptors2)
        matches = sorted(matches, key=lambda x: x.distance)

        pts1 = []
        pts2 = []
        for i, match in enumerate(matches):
            if i >= self.n_points:
                break
            pts1.append(keypoints1[match.queryIdx].pt)
            pts2.append(keypoints2[match.trainIdx].pt)

        pts1 = np.int32(pts1)
        pts2 = np.int32(pts2)
        matches = matches[:self.n_points]

        ## Estimate Fundamental Matrix by ransac, distance_threshold = 1, confidence_threshold = 0.99
        F, mask = cv2.findFundamentalMat(pts1, pts2, cv2.FM_RANSAC, 1, 0.99)

        return F, mask, pts1, pts2, matches


    def EstimateBox(self, boxes, F):
        """Estimate box in target image by Fundamental Matrix

        Parameters
        ----------
        boxes : array like
            A Nx4 matrix of boxes in source images (x,y,w,h)
        F : ndarray
            A 3x3 Fundamental Matrix

        Returns
        -------
        aligned_boxes: ndarray
            A Nx4 matrix of boxes in source images (x,y,w,h)

        Method
        -------
            L = ||Bi^T F Ai||2 + ||(A2-A0)+(B2-B0)||2
            A is the four corner of box in source image
            B is the four corner of aligned box in target image
            A0,B0:top left corner of box, [x;y;1]
            A1,B1:top right corner of box
            A2,B2:bottom left corner of box
            A3,B3:bottom right corner of box
            the height and width of boxes and aligned boxes are assumed to be same
            we can use greedy strategy: make M = A^T F^T
            then:
                M11   x1   +   M12  y1   + M13 = 0
                M21 (x1+w) +   M22  y1   + M23 = 0
                M31   x1   +   M32 y1+h  + M33 = 0
                M41 (x1+w) +  M42 (y1+h) + M43 = 0
            =>
                M[:2][x;y] + M[:3]+[0;M21w;M32h;M41w+M42h] = 0 ->Ax = b
                x = (pseudo inverse of A )b

        """
        boxes = np.asarray(boxes)
        if boxes.ndim == 1:
            boxes = boxes[np.newaxis, :]
        aligned_boxes = np.zeros(boxes.shape)

        for i, bbox in enumerate(boxes):
            w = bbox[2]
            h = bbox[3]
            AT = np.array([[bbox[0]   , bbox[1]    , 1],
                          [bbox[0] + w, bbox[1]    , 1],
                          [bbox[0]    , bbox[1] + h, 1],
                          [bbox[0] + w, bbox[1] + h, 1]])
            M = AT @ F.T
            b = -M[:, 2] - np.array([0, M[1][0]*w, M[2][1]*h, M[3][0]*w+M[3][1]*h])
            aligned_tl = np.linalg.pinv(M[:,:2]) @ b

            aligned_boxes[i, 0] = aligned_tl[0]
            aligned_boxes[i, 1] = aligned_tl[1]
            aligned_boxes[i, 2] = w
            aligned_boxes[i, 3] = h

        return aligned_boxes.astype(np.int32)

具体效果如下：

上面极线的法线也正好是车载相机的方向所在，可以看到第一章的示例问题被很大缓解了：

ECC

3.1 原理介绍

第二章所介绍的对极几何方法，由于我们只是根据二维信息对三维信息的估计，所以也会存在误差。这一张我们也讲一个简单有效的方案，那就是“仿射变换”。当然，并不是我们所理解的那种仿射变换，具体细节我将慢慢介绍。

第一次看到 ECC 算法，我是在 ICCV 2019 的 Tracktor++ [3] 中，不过作者只是一笔带过，没有提及如何实现。ECC 算法全名是增强相关系数算法 [2]，来自于 PAMI2008 的一篇论文，这个算法适用于图像配准任务的：

也就是对于两张内容差异小，但是存在光照、尺度、颜色、平移等变换影响的图像，将二者对齐。ECC 算法本质是一个目标函数：

当然这只是一个原始形式，在求解过程中有所调整，我就不细讲这里的理论了。可以注意到的是 y=warp(x) 这个函数，所以这个算法假设两帧图像之间存在某种变换，不一定是仿射变换，可能有以下几种：

其中最后一种透视变换的矩阵形式是：

前三种变换则不考虑最后一行信息，即 2x3 的矩阵形式。

3.2 实验分析

opencv 中正好提供了 ECC 相关的功能函数，这里我们只需要再次封装，以方便多目标跟踪。可以知道的是 ECC 算法的核心在于变换矩阵的求解：

def ECC(src, dst, warp_mode = cv2.MOTION_EUCLIDEAN, eps = 1e-5,
        max_iter = 100, scale = None, align = False):
    """Compute the warp matrix from src to dst.

    Parameters
    ----------
    src : ndarray
        An NxM matrix of source img(BGR or Gray), it must be the same format as dst.
    dst : ndarray
        An NxM matrix of target img(BGR or Gray).
    warp_mode: flags of opencv
        translation: cv2.MOTION_TRANSLATION
        rotated and shifted: cv2.MOTION_EUCLIDEAN
        affine(shift,rotated,shear): cv2.MOTION_AFFINE
        homography(3d): cv2.MOTION_HOMOGRAPHY
    eps: float
        the threshold of the increment in the correlation coefficient between two iterations
    max_iter: int
        the number of iterations.
    scale: float or [int, int]
        scale_ratio: float
        scale_size: [W, H]
    align: bool
        whether to warp affine or perspective transforms to the source image

    Returns
    -------
    warp matrix : ndarray
        Returns the warp matrix from src to dst.
        if motion model is homography, the warp matrix will be 3x3, otherwise 2x3
    src_aligned: ndarray
        aligned source image of gray
    """
    assert src.shape == dst.shape, "the source image must be the same format to the target image!"

    # BGR2GRAY
    if src.ndim == 3:
        # Convert images to grayscale
        src = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)
        dst = cv2.cvtColor(dst, cv2.COLOR_BGR2GRAY)

    # make the imgs smaller to speed up
    if scale is not None:
        if isinstance(scale, float) or isinstance(scale, int):
            if scale != 1:
                src_r = cv2.resize(src, (0, 0), fx = scale, fy = scale,interpolation =  cv2.INTER_LINEAR)
                dst_r = cv2.resize(dst, (0, 0), fx = scale, fy = scale,interpolation =  cv2.INTER_LINEAR)
                scale = [scale, scale]
            else:
                src_r, dst_r = src, dst
                scale = None
        else:
            if scale[0] != src.shape[1] and scale[1] != src.shape[0]:
                src_r = cv2.resize(src, (scale[0], scale[1]), interpolation = cv2.INTER_LINEAR)
                dst_r = cv2.resize(dst, (scale[0], scale[1]), interpolation=cv2.INTER_LINEAR)
                scale = [scale[0] / src.shape[1], scale[1] / src.shape[0]]
            else:
                src_r, dst_r = src, dst
                scale = None
    else:
        src_r, dst_r = src, dst

    # Define 2x3 or 3x3 matrices and initialize the matrix to identity
    if warp_mode == cv2.MOTION_HOMOGRAPHY :
        warp_matrix = np.eye(3, 3, dtype=np.float32)
    else :
        warp_matrix = np.eye(2, 3, dtype=np.float32)

    # Define termination criteria
    criteria = (cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, max_iter, eps)

    # Run the ECC algorithm. The results are stored in warp_matrix.
    (cc, warp_matrix) = cv2.findTransformECC (src_r, dst_r, warp_matrix, warp_mode, criteria, None, 1)

    if scale is not None:
        warp_matrix[0, 2] = warp_matrix[0, 2] / scale[0]
        warp_matrix[1, 2] = warp_matrix[1, 2] / scale[1]

    if align:
        sz = src.shape
        if warp_mode == cv2.MOTION_HOMOGRAPHY:
            # Use warpPerspective for Homography
            src_aligned = cv2.warpPerspective(src, warp_matrix, (sz[1],sz[0]), flags=cv2.INTER_LINEAR)
        else :
            # Use warpAffine for Translation, Euclidean and Affine
            src_aligned = cv2.warpAffine(src, warp_matrix, (sz[1],sz[0]), flags=cv2.INTER_LINEAR)
        return warp_matrix, src_aligned
    else:
        return warp_matrix, None

这里面我添加了一个技巧，由于 ECC 算法针对的是两幅图，所以图像的尺寸对于算法求解速度的影响很大。因此这里我根据变换矩阵的形式，设计了一种可以根据尺度放缩自动调节的简易算法。效果如下：

效果也很好，值得一提的是，ECC 算法只需要大约几毫秒的时间，但是由于它的求解效率跟变换的难度相关，所以间隔越久越慢，而对极几何的方法效率比较稳定，不过就很慢了。

其他近似方案

4.1 光流

上面我介绍的都是近两年关于相机运动的针对性解决方案，那么实际上在有一些算法模型中，如果场景变化不剧烈，并不特别需要用到运动模型。比如基于光流法的多目标跟踪算法，这里众所周知的就是 ICCV2015 的 NOMT [5] 算法。

作者用的是一种简化版的快速光流法，那么更形象的可以看今年刚出的一篇论文《Multiple Object Tracking by Flowing and Fusing》，具体我就不说了，就是简单的在 Tracktor++ 框架上加了一个光流预测分支：

可以看到的是，光流也是在捕捉相邻帧中相似的像素信息，这一点跟第二章中提出的两种相机运动模型有点类似，所以不需要显式使用相机运动模型。

4.2 SOT

而基于 SOT 的方法，无论是使用传统的相关滤波算法还是使用 Siamese 类深度学习框架，都会在上一帧目标周围 1.5~2.5 倍区域搜索下一帧的目标，这里面会显式或者隐式用到特征的比对。只不过不同于上面的像素比对，这里是更加高层的特征比对。

参考资料

[1] Wang G, Wang Y, Zhang H, et al. Exploit the connectivity: Multi-object tracking with trackletnet[C]. in: Proceedings of the 27th ACM International Conference on Multimedia. 2019. 482-490.

[2] Evangelidis G D, Psarakis E Z. Parametric image alignment using enhanced correlation coefficient maximization[J]. IEEE transactions on pattern analysis and machine intelligence, 2008, 30(10): 1858-1865.

[3] Bergmann P, Meinhardt T, Leal-Taixe L. Tracking without bells and whistles[C]. in: Proceedings of the IEEE International Conference on Computer Vision. 2019. 941-951.

[4] Choi W. Near-online multi-target tracking with aggregated local flow descriptor[C]. in: Proceedings of the IEEE international conference on computer vision. 2015. 3029-3037.

[5] Feng W, Hu Z, Wu W, et al. Multi-object tracking with multiple cues and switcher-aware classification[J]. arXiv preprint arXiv:1901.06129, 2019.

[6] https://blog.csdn.net/ssw_1990/article/details/53355572

点击以下标题查看更多往期内容：

对抗训练浅谈：意义、方法和思考
一文读懂领域迁移与领域适应的常见方法
借助注意力机制实现特征软阈值化
CVPR 2020 三篇有趣的论文解读
NAS+目标检测：AI设计的目标检测模型
图神经网络时代的深度聚类

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

python中vars()的作用 m0_45093979 python 开发语言
在Python中，vars()是一个内置函数，用于返回对象的属性和属性值的字典。它可以用于获取一个对象的命名空间中的所有变量和属性，然后以字典的形式返回这些变量和属性的名称及其对应的值。如果没有提供参数给vars()，它会返回当前作用域（scope）的变量和属性。通常在函数内部调用vars()，它将返回函数的局部命名空间中的所有变量和属性。在模块级别调用vars()，它将返回当前模块的全局命名空间
Python vars() 函数：探索对象的内部程序员喵哥 Python python 开发语言
更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
【题解-Acwing】1057. 股票买卖 IV X CODE 算法练习题解算法动态规划状态机模型
题目：1057.股票买卖IV题目描述给定一个长度为NNN的数组，数组中的第iii个数字表示一个给定股票在第iii天的价格。设计一个算法来计算你所能获取的最大利润，你最多可以完成kkk笔交易。注意：你不能同时参与多笔交易（你必须在再次购买前出售掉之前的股票）。一次买入卖出合为一笔交易。输入格式第一行包含整数NNN和kkk，表示数组的长度以及你可以完成的最大交易笔数。第二行包含NNN个不超过10000
Redis 分布式锁实现与实践佑瞻数据库与知识图谱 redis 分布式数据库
在分布式系统架构中，多个独立进程对共享资源的并发访问控制是常见需求，分布式锁作为解决这一问题的关键技术，在缓存更新、任务调度、库存管理等场景中发挥着重要作用。本文将从基础原理出发，详细阐述基于Redis的分布式锁实现方案，包括单实例模式与Redlock算法，并探讨其在实际应用中的关键考量。分布式锁核心概念分布式锁是一种跨进程、跨机器的同步机制，用于保证多个分布式节点对共享资源的互斥访问。一个可靠的
布隆过滤器详解及使用：解决缓存穿透问题豪宇刘缓存哈希算法散列表
在现代应用开发中，缓存技术被广泛应用于提升系统性能和响应速度。然而，缓存系统也带来了一些新的挑战，如缓存穿透、缓存击穿和缓存雪崩等问题。一、什么是布隆过滤器？布隆过滤器是一种空间效率很高的概率型数据结构，用于判断一个元素是否在一个集合中。它的优点是高效且占用内存少，但有一定的误判率（即可能会错误地认为某个不在集合中的元素存在于集合中），不过它不会漏报（即如果一个元素确实不在集合中，布隆过滤器一定能
Linux 中的 .bashrc 是什么？配置详解 vvw& 技术文章 Linux linux chrome 运维服务器 ubuntu 后端 centos
如果你使用过Linux终端，那么你很可能接触过.bashrc文件。这个功能强大的脚本是个性化命令行环境并使其更高效运行的关键。在本文中，我们将向你介绍这个文件是什么，在哪里可以找到它，以及如何安全地编辑它。你还将学到一些实用技能，如创建省时的命令别名、编写强大的shell函数，以及自定义终端提示的外观。最后，我们还将介绍基本的最佳实践和常见错误，帮助你建立更高效、更强大的命令行工作流程。准备强烈简
使用工厂模式和策略模式实现布隆过滤器小菜0-o 策略模式
使用工厂模式和策略模式实现布隆过滤器的大概流程如下：定义布隆过滤器接口：首先定义一个布隆过滤器接口，包括添加元素和判断元素是否存在两个基本操作。实现具体的布隆过滤器类：创建一个具体的布隆过滤器类，实现布隆过滤器接口中的方法。在这个类中，需要定义布隆过滗器的数据结构（比如位数组）、大小等属性。定义哈希策略接口：定义一个哈希策略接口，包含计算哈希值的方法。实现具体的哈希策略类：创建多个具体的哈希策略类
深度解码：企业级 AI 选型中 Gemini 与 DeepSeek 的架构对决 charles666666 人工智能架构语言模型深度学习产品经理机器学习
开篇：技术选型会议中的认知困局当技术团队尝试评估基于MoE（专家混合）架构的Gemini1.5Pro和DeepSeek-V3时，决策者往往陷入认知混乱。尽管两者同属MoE架构，实际测试表现却大相径庭。这种混乱源于对参数规模的盲目崇拜。Gemini1.5Pro拥有1.5万亿参数，而DeepSeek-V3参数规模仅为前者的一半。但在实际企业场景测试中，DeepSeek在中文语义理解任务中的准确率却高出
大小不足5M，轻量级PDF阅读工具
“你是否也遇见过这样的窘境：明明只需要打开查看几页内容，却要安装一个几十兆甚至上百兆的软件，等待半天才能加载完成，老旧电脑更是卡顿得让人失去耐心。直到我发现了SmartPDF，才明白原来一款纯粹的PDF阅读器可以如此轻巧高效。它像一把精准的手术刀，剔除了所有冗余功能，只留下最核心的阅读体验，却解决了日常使用中的诸多痛点。4.7M的体积，装得下所有阅读需求第一次看到SmartPDF的安装包时，我简直
如何使用Ora2Pg迁移Oracle数据库到openGauss openGauss小助手 openGauss技术分享数据库 oracle postgresql
Ora2Pg介绍Ora2Pg是一个将Oracle迁移至PostgreSQL的开源工具，通过连接Oracle数据库，自动扫描并提取其中的对象结构及数据，产生SQL脚本，通过手动或自动的方式将其应用到PostgreSQL。官方网站：https://ora2pg.darold.net/Ora2Pg优秀特性支持导出数据库绝大多数对象类型，包括表、视图、序列、索引、外键、约束、函数、存储过程等。提供PL/S
C++ 内存泄漏排查全攻略：万字实战宝典 TravisBytes 编程问题档案 c++开发语言 linux ubuntu
写在前面本文定位为“从入门到精通”的深度教程，全文超过12,000字，结合作者多年在Qt框架、游戏引擎、服务器端及高并发协程框架中的一线经验，系统梳理C++内存泄漏的原理、检测、定位与修复方案。示例代码均可在GCC/Clang/MSVC（C++20标准）下编译通过，并特别对Windows、Linux、macOS三大平台的差异化工具与坑点进行说明。欢迎评论区互动交流～目录1.序章：为什么你迟早会遇到
C语言初阶-ASCII表以及各种C语言的操作符
目录一、ASCII表二、C语言中的操作符观看之前记得先点赞谢谢大家啦一、ASCII表它的全称是“美国信息交换标准代码”。为保证人类和设备，设备和计算机之间能进行正确的信息交换，人们编制的统一的信息交换代码。二、C语言中的操作符
大型语言模型中的提示工程系统综述：技术与应用 AI专题精讲 Paper阅读语言模型人工智能自然语言处理
摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。prompt可以是提供上下文以引导模型的自然语言指令，也可以是激活相关知识的学习向量表示。这一新兴领域已
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个
专栏导读本专栏收录于《华为OD机试（JAVA）真题（B卷+A卷+C卷+D卷+E卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷专题】华为OD机试2025B卷统一考试题库清单，时间紧张就刷这个（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 华为OD机试 2025B卷
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华为OD往常的操作，B卷题目是由往
【全网首发】华为OD机试 2025B卷机考真题库清单（全真题库）含考点说明哪吒搬砖工逆袭Java架构师华为od java 2025B卷华为OD机试
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
【2025B卷首发】华为OD机试真题+全流程解析+备考攻略+经验分享+Java最佳实现
专栏导读本专栏收录于《华为OD机试（JAVA）真题（E卷+D卷+A卷+B卷+C卷）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。2025年5月12日，华为官方已经将华为OD机试（A卷）切换为B卷。目前正在考的是B卷，按照华
GNSS+INS：揭秘导航技术中的“黄金组合“奥秘 EriccoShaanxi 技术文章无人机自动驾驶机器人
在导航技术领域，GNSS（全球导航卫星系统）和INS（惯性导航系统）的结合，一直被业界誉为"黄金搭档"。它们优势互补，克服了单一系统的局限性，为高精度、高可靠性的导航提供了完美解决方案。而ER-GNSS/MINS-05低成本组合导航系统的出现，更是让这一"黄金组合"走进了更广泛的应用场景，让高性能导航不再昂贵。GNSS与INS：天生互补的"最佳拍档"GNSS的强项与短板GNSS（如GPS、北斗、G
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
【图像处理基石】如何检测到画面中的ppt并对其进行增强？
1.入门版ppt检测增强工具我们介绍一个使用Python进行PPT检测并校正画面的实现方案。这个方案主要利用OpenCV进行图像处理，通过边缘检测和透视变换技术来识别并校正PPT画面。importcv2importnumpyasnpfromPILimportImageimportmatplotlib.pyplotaspltclassPPTDetector:def__init__(self):#初始
Conda安装与使用
目录一、软件安装及conda管理1.conda下载2.miniconda安装二、环境配置1.配置镜像：2.创建环境、移除环境：3.查看小环境4.进入、退出小环境5.查找并安装软件三、一步到位其他：参考资料：一、软件安装及conda管理conda可以来管理大量的生物信息学软件，或者想要复现一些文章中的实验结果需要不同环境的切换。1.conda下载（1）anacondaanaconda|镜像站使用帮助
富集分析——GO、KEGG ersanshi055 生信小菜鸟富集分析 GO kegg
一、富集分析的基础认知在生物信息学研究领域，基因功能解析及通路阐释是众多分析流程中的关键环节，富集分析（EnrichmentAnalysis）是将基因或蛋白列表按照功能进行分类的统计方法，目的是找出在特定基因集中显著富集的功能类别或通路。通过这种方法，研究人员可以理解一组基因（如差异表达基因）在哪些生物学过程、分子功能或通路中代表。1.富集分析分类基因本体论富集分析（GeneOntologyEnr
【Bluedroid】BLE 地址解析列表的初始化与清除机制（btm_ble_resolving_list_init） byte轻骑兵 Android C++Android Bluedroid
本文深入分析Android蓝牙协议栈中BLE地址解析列表的核心管理流程，涵盖从主机协议栈初始化到控制器硬件操作的全链路实现。重点解析可解析私有地址（RPA）处理机制、隐私保护技术实现，探讨标准HCI命令与厂商特定命令在地址解析中的协同工作方式，揭示了BLE隐私机制的底层实现原理。一、概述1.BLE隐私机制基础可解析随机地址(RPA)与身份解析密钥(IRK)解析列表(ResolvingList)的作
TDengine 集群节点管理 TDengine （老段） TDengine SQL 手册 tdengine 数据库时序数据库大数据物联网 iotdb iot
简介组成TDengine集群的物理实体是dnode(datanode的缩写)，它是一个运行在操作系统之上的进程。在dnode中可以建立负责时序数据存储的vnode(virtualnode)，在多节点集群环境下当某个数据库的replica为3时，该数据库中的每个vgroup由3个vnode组成；当数据库的replica为1时，该数据库中的每个vgroup由1个vnode组成。如果要想配置某个数据库为
Python中的高阶函数---便捷的语法书写！！！！，可以简化一些函数的书写！！！似乎很简单 Python学习日记 python 开发语言学习笔记
目录1.map()函数示例1：单可迭代对象（平方运算）示例2：多可迭代对象（元素相加）2.mapvs列表推导式什么是列表推导式（ListComprehension）？对比示例列表推导式的优势map的优势5.实际应用场景场景1：批量转换数据类型场景2：多列数据处理场景3：链式操作6.性能与注意事项总结3.sorted()函数1.语法：sorted(iterable,*,key=None,revers
redis做同步或异步队列瞧着不像好人呐 redis redis java 数据库
redis实现队列主要是使用数据结构中的list，相当于Java中的ArrayList因为它是按照塞入顺序排序的结构，我们就可以按照左边塞入，右边取出的方式来实现先入先出的队列需求。publicvoidrpush(Stringkey,Stringvalue){Jedisjedis=null;try{jedis=jedisPool.getResource();jedis.rpush(key,valu
Hutool TreeUtil快速构建树形数据结构 yifanghub 工具类 java
在管理菜单、部门结构等场景时，我们经常需要将数据库中的层级数据转换为树形结构。本文将通过Hutool的TreeUtil工具类，实现零递归快速构建树形结构。一、环境准备JDK1.8+SpringBoot2.xHutool5.8.16MySQL8.0二、数据准备--创建部门表CREATETABLE`sys_dept`(`id`intNOTNULLAUTO_INCREMENT,`dept_name`va
AI生成一个战斗PK应用
这两天在CSDN顶部栏里面看到inscode，点进去发现“InsCode是一个一站式的软件开发服务平台，从开发-部署-运维-运营，都可以在InsCode轻松完成。”，里面有个一句话生成应用的功能挺有意思。下面是我生成的应用，AI战斗PKAI战斗PK简单来说就是想起来之前B站还是哪里看到的奥特曼大战叶问，由此想到了这个应用，输入两个历史、电影或动漫中的角色名字，然后AI输出他们战斗的过程和结果。这是
Web端版本更新提示--前端处理扶我起来还能学_ 前端 javascript vue.js 前端框架
Web端版本更新提示–前端处理原理：webpack每次打包jshash值不同import{MessageBox}from'element-ui'letlastScripts=[]//最新一次js文件src名constDURATION=5*60*1000//设置5分钟检查更新一次//提取html中的script标签的src属性asyncfunctionextractNewScripts(htmlSt
网络工具Fing Network Tools v12.10.2专业版，WiFi设备扫描神器米豆学社网络工具
[软件名称]:网络工具FingNetworkTools[软件大小]:49.2MB[下载通道]:夸克盘|迅雷盘软件介绍《FingNetworkTools》v12.10.2专业版｜WiFi安全卫士，一键检测所有联网设备✨核心功能设备扫描–实时发现WiFi网络中的所有连接设备，识别陌生入侵者⚡网络诊断–速度测试+延迟分析，找出Netflix卡顿真凶️安全防护–入侵检测+防火墙功能，守护家庭网络安全高级工
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

浅谈多目标跟踪中的相机运动

你可能感兴趣的:(浅谈多目标跟踪中的相机运动)