Dawiiii

图像跟踪与识别-KCF+DSST算法简单融合

一：KCF高速跟踪详解

本文的跟踪方法效果甚好，速度奇高，思想和实现均十分简洁。其中利用循环矩阵进行快速计算的方法尤其值得学习。另外，作者在主页上十分慷慨地给出了各种语言的实现代码。
本文详细推导论文中的一系列步骤，包括论文中未能阐明的部分。请务必先参看这篇简介循环矩阵性质的博客。

思想

一般化的跟踪问题可以分解成如下几步：
1. 在It帧中，在当前位置pt附近采样，训练一个回归器。这个回归器能计算一个小窗口采样的响应。
2. 在It+1帧中，在前一帧位置pt附近采样，用前述回归器判断每个采样的响应。
3. 响应最强的采样作为本帧位置pt+1。

循环矩阵表示图像块

在图像中，循环位移操作可以用来近似采样窗口的位移。

训练时，围绕着当前位置进行的一系列位移采样可以用二维分块循环矩阵X表示，第ij块表示原始图像下移i行右移j列的结果。类似地，测试时，前一帧结果附近的一系列位移采样也可以用X表示。

这样的X可以利用傅里叶变换快速完成许多线性运算。

线性回归训练提速

此部分频繁用到了循环矩阵的各类性质，请参看这篇博客。
线性回归的最小二乘方法解为：

w = (X H X + λ I) - 1 X H y

根据循环矩阵乘法性质，XHX的特征值为x^⊙x^∗。I本身就是一个循环矩阵，其生成向量为[1,0,0...0]，这个生成向量的傅里叶变换为全1向量，记为δ。

w = (F d i a g (x^⊙ x^*) F H + λ F d i a g (δ) F H) - 1 X H y

= (F d i a g (x^⊙ x^* + λ δ) F H) - 1 X H y

根据循环矩阵求逆性质，可以把矩阵求逆转换为特征值求逆。

w = F \cdot d i a g (1 x ^ ⊙ x ^ * + λ δ) \cdot F H X H y

w = F \cdot d i a g (1 x ^ ⊙ x ^ * + λ δ) \cdot F H \cdot F d i a g (x^*) F H \cdot y

利用F的酉矩阵性质消元：

w = F \cdot d i a g (x ^ * x ^ ⊙ x ^ * + λ δ) \cdot F H \cdot y

分号表示用1进行对位相除。
反用对角化性质：Fdiag(y)FH=C(F−1(y))，上式的前三项还是一个循环矩阵。

w = C (F - 1 (x ^ * x ^ ⊙ x ^ * + λ δ)) \cdot y

利用循环矩阵卷积性质F(C(x)⋅y)=x^∗⊙y^：

F (w) = (x ^ * x ^ ⊙ x ^ * + λ δ) * ⊙ F (y)

由于

x^⊙x^∗ 的每个元素都是实数，所以共轭不变：

F (w) = x ^ x ^ ⊙ x ^ * + λ δ ⊙ F (y) = x ^ ⊙ y ^ x ^ ⊙ x ^ * + λ δ

论文中，最后这一步推导的分子部分写成x^∗⊙y^，是错误的。但代码中没有涉及。

线性回归系数ω可以通过向量的傅里叶变换和对位乘法计算得到。

核回归训练提速

不熟悉核方法的同学可以参看这篇博客的简单说明。核回归方法的回归式为：

f (z) = α T κ (z)

其中

κ(z) 表示测试样本

z 和所有训练样本的核函数。参数有闭式解：

α = (K + λ I) - 1 y

K为所有训练样本的核相关矩阵：Kij=κ(xi,xj)。如果核函数选择得当，使得x内部元素顺序更换不影响核函数取值，则可以保证K也是循环矩阵。以下核都满足这样的条件：

设核相关矩阵的生成向量是k。推导和之前线性回归的套路非常类似：

α = (F d i a g (k^) F H + F d i a g (λ δ) F H) - 1 y = (F d i a g (k^+ λ δ) F H) - 1 y

= F d i a g (1 k ^ + λ δ) F H y = C (F - 1 (1 k ^ + λ δ)) y

利用循环矩阵卷积性质F(C(x)⋅y)=x^∗⊙y^：

α^= (1 k ^ + λ δ) * ⊙ y^

这里

k 是核相关矩阵的第一行，表示原始生成向量

x0 和移位了

i 的向量

xi 的核函数。考察其处于对称位置上的两个元素：

k i = κ (x 0, x i), k N - i = κ (x 0, x N - i)

两者都是同一个向量和自身位移结果进行运算。因为所有涉及到的核函数都只和位移的绝对值有关，所以ki=kN−i，即k是对称向量。

举例：x0=[1,2,3,4]，x1=[4,1,2,3]，x3=[2,3,4,1]。使用多项式核κ(x,y)=xTy，容易验证κ(x0,x1)=κ(x0,x3)。

对称向量的傅里叶变换为实数，有：

α^= (1 k ^ + λ δ) ⊙ y^= y ^ k ^ + λ δ

论文中，利用k的对称性消除共轭的步骤没有提及。

线性回归系数α可以通过向量的傅里叶变换和对位乘法计算得到。

核回归检测提速

所有待检测样本和所有训练样本的核相关矩阵为K，每一列对应一个待测样本。可以一次计算所有样本的响应（N×1向量）：

y' = K T α

利用循环矩阵的转置性质性质，C(k)的特征值为k^∗：

y' = C (k) T \cdot α = C (k^*) \cdot α = k * * α

利用循环矩阵的卷积性质：

y' = (k *) * α = k * α

两边傅里叶变换：

y'^= k^⊙ α^

论文中，利用转置消除共轭的步骤没有提及。

所有侯选块的检测响应可以通过向量的傅里叶变换和对位乘法计算得到。

核相关矩阵计算提速

无论训练还是检测，都需要计算核相关矩阵K的生成向量k。除了直接计算每一个核函数，在某些特定的核函数下可以进一步加速。

多项式核

κ (x, y) = f (x T y)

其中f为多项式函数。写成矩阵形式：

K = f (X T Y)

f在矩阵的每个元素上单独进行。根据循环矩阵性质，XTY也是一个循环矩阵，其生成向量为F−1(y^⊙x^∗)。所以核相关矩阵的生成向量为：

k = f (F - 1 (y^⊙ x^*))

RBF核

κ (x, y) = f (| | x - y | | 2)

其中

f 是线性函数。简单展开：

κ (x, y) = f (| | x - y | | 2) = f (| | x | | 2 + | | y | | 2 + 2 x T y)

由于

X 中的所有

x 都通过循环移位获得，故

||x||2 对于所有

x 是常数，同理

||y||2 也是。所以核相关矩阵的生成向量为：

k = f (| | x | | 2 + | | y | | 2 + F - 1 (y^⊙ x^*))

其他核

有一些核函数，虽然能保证K是循环矩阵，但无法直接拆解出其特征值，快速得到生成向量。比如Hellinger核：∑ixiyi−−−√，Intersection核：∑imin(xi,yi)。

多通道

在多通道情况下（例如使用了HOG特征），生成向量x变成M×L，其中M是样本像素数，L是特征维度。在上述所有计算中，需要更改的只有向量的内积：

x T y = \sum l (x l) T y l

注：非常感谢GX1415926535和大家的帮助，发现原文一处错误。(21)式中不应有转置，应为：

f(z)=Kzα

二：DSST
简介(Accurate Scale Estimation for Robust Visual Tracking)

DSST(Discriminative Scale Space Tracking)在2014年VOT上夺得了第一名，算法简洁，性能优异，并且我上一篇所述的KCF夺得了第三名，两者都是基于滤波器的算法，这一年是CF义军突起的一年，值得研究这些相近的优秀算法。这篇算法是基于MOSSE的改进，突出内容是加入了尺度变换，下面开始逐一讲解算法内容。

相关滤波器

　　首先讲一下MOSSE提出的相关滤波器，从目标中提取一系列的图像patches,记为
f1,f2,...ft作为训练样本，其对应的滤波器响应值为一个个高斯函数 g1,g2,...gt,而目的就是找到满足最小均方差(Minimum Output Sum of Squared Error)的最优滤波器：

ε=∑j=1t||ht∗fj−gj||2=1MN||HtFj−Gj||2(1)

其中第二个等号根据Parseval定理导出，等式左侧是空域的方程式，右侧是频域的方程式，正正是这个等式，使得我们将问题求解变换到频域里求解， ε 的最小值在频域里的解如下：

Ht=∑tj=1GjFj∑tj=1FjFj(2)

一般而言， gj 可以是任意形状的输出，这里的输出 gj 是高斯型的函数，峰值位于中心处。这个方法的技巧或者目的在于：一是运算简洁，基本都是矩阵运算；二是引入快速傅里叶(FFT)大大加快运算效率。这即是相关滤波器被应用在Tracking并获得较好效果的原因，满足了对速度的一大需求。
在得到上述相关滤波器后，对于新的一帧中的候选输入样本z,求相关得分y：

y=−1(HtZ)(3)

y取最大响应值时对应的位置z为新的目标位置。
算法思想

　　算法设计了两个一致的相关滤波器，分别实现目标的跟踪和尺度变换，定义为位置滤波器(translation filter)和尺度滤波器(scale filter),前者进行当前帧目标的定位，后者进行当前帧目标尺度的估计。两个滤波器是相对独立的，从而可以选择不同的特征种类和特征计算方式来训练和测试。文中指出该算法亮点是尺度估计的方法可以移植到任意算法中去。

算法流程：如上图所示，通过左侧的图像patch目标提取的特征F和右侧的高斯型函数G，应用式(2)得到一个相关滤波器H。然后在下一帧将测试的图像patches提取特征Z作为输入，与相关滤波器H按照式(3)进行运算，得到响应值y最大的候选目标，所以算法很简洁。
该算法将输入信号 f(图像中的某一个patch)设计为d维特征向量(可选gray,hog)，通过建立最小化代价函数构造最优相关滤波器 h,如下：
$ε = | | \sum l = 1 d h l * f l - g | | 2 + λ \sum l = 1 d | | h l | | 2 (4)$
其中， l表示特征的某一维度， λ是正则项系数，作用是消除 f频谱中的零频分量的影响，避免上式解的分子为零，如下：
$H l = G ⎯ ⎯ ⎯ F l \sum d k = 1 F k ⎯ ⎯ ⎯ ⎯ F k + λ = A l t B t (5)$
由于patch中的每个像素点需要求解 dx d维的线性方程，计算非常耗时，为了得到鲁棒的近似结果，对上式中分子 Alt和分母 Bt分别进行更新:
$A l t = (1 - η) A l t - 1 + η G t ⎯ ⎯ ⎯ ⎯ F l t$
$B t = (1 - η) B t - 1 + η \sum k = 1 d F k t ⎯ ⎯ ⎯ ⎯ F l t (6)$
其中， η为学习率。
在新的一帧中，目标位置可以通过求解最大相关滤波器响应值得到：
$y =  - 1 ⎧ ⎩ ⎨ ⎪ ⎪ \sum d l = 1 A l ⎯ ⎯ ⎯ ⎯ Z l B + λ ⎫ ⎭ ⎬ ⎪ ⎪ (7)$

快速尺度空间跟踪

　　本算法的亮点就是提出的基于一维独立的相关滤波器的尺度搜索和目标估计方法。具体操作方法是：在新的一帧中，先利用2维的位置相关滤波器来确定目标的新候选位置，再利用1维的尺度相关滤波器以当前中心位置为中心点，获取不同尺度的候选patch，从而找到最匹配的尺度。尺寸选择原则是：

anP×anR,n∈{[−S−12],...[S−12]}

其中， P,R 分别为目标在前一帧的宽高， a=1.02 为尺度因子， S=33 为尺度的数量。上述尺度不是线性关系，而是由精到粗(从内到外的方向)的检测过程。
算法流程

　　论文中的流程图已经详细写的挺详细了，为了保持内容完整性再赘述一遍：
Input:
输入图像patch It
上一帧的位置Pt−1和尺度St−1
位置模型Atranst−1、Btanst−1和尺度模型Ascalet−1、Bscalet−1
Output:
估计的目标位置Pt和尺度St
更新位置Atranst、Btranst和尺度模型Ascalet、Bscalet

其中,
位置评估：
1.参照模板在前一帧的位置，在当前帧中按照前一帧目标尺度的2倍大小提取一个样本Ztrans
2.利用Ztrans和Atranst−1、Btanst−1，根据公式(7)计算ytrans
3.计算max(ytrans)，得到目标新的位置Pt
尺度评估：
4.以目标当前新位置为中心，提取33种不同尺度的样本Ztrans
5.利用Ztrans和Atranst−1、Btanst−1计算出yscale
6.计算max(yscale)，得到目标准确的尺度St

模型更新：
7.提取样本ftrans和fscale
8.更新位置模型Atranst和Btranst
9.更新尺度模型Ascalet和Bscalet

下面给出两个不同相关滤波器的关键代码：
训练部分：
    %提取特征训练样本输入X
    %样本中每个像素点计算28维融合特征(1维原始灰度+27维fhog)
    %乘以二维hann后作为输入X
    %提取特征用于位置相关滤波器
    xl = get_translation_sample(im, pos, sz, currentScaleFactor, cos_window);

    %获取分子A=GF;分母B=F*F;此时没有lambda
    xlf = fft2(xl);
    new_hf_num = bsxfun(@times, yf, conj(xlf));
    new_hf_den = sum(xlf .* conj(xlf), 3);

    %把每个样本resize成固定大小，分别提取31维fhog特征，每个样本的所有fhog再
    %串联成一个特征向量构成33层金字塔特征，乘以一维hann窗后作为输入X
    % 提取特征用于尺度相关滤波器
    xs = get_scale_sample(im, pos, base_target_sz, currentScaleFactor * scaleFactors, scale_window, scale_model_sz);

    %同样的获取分子A=GF;分母B=F*F;此时没有lambda
    xsf = fft(xs,[],2);
    new_sf_num = bsxfun(@times, ysf, conj(xsf));
    new_sf_den = sum(xsf .* conj(xsf), 1);
检测部分：
         %提取特征测试输入F
         %样本中每个像素点计算28维融合特征(1维原始灰度+27维fhog)
         %乘以二维hann后作为输入F
         %用于位置相关滤波器
         xt = get_translation_sample(im, pos, sz, currentScaleFactor, cos_window);

        %计算响应值y=F-1{(A*Z)/(B+lambda)}
        xtf = fft2(xt);
        response = real(ifft2(sum(hf_num .* xtf, 3) ./ (hf_den + lambda)));

        %找到max(y)得到目标新位置
        [row, col] = find(response == max(response(:)), 1);

        % 更新目标位置
        pos = pos + round((-sz/2 + [row, col]) * currentScaleFactor);

        %把每个样本resize成固定大小，分别提取31维fhog特征，每个样本的所有fhog再
        %串联成一个特征向量构成33层金字塔特征，乘以一维hann窗后作为输入F
        % 用于尺度相关滤波器
        xs = get_scale_sample(im, pos, base_target_sz, currentScaleFactor * scaleFactors, scale_window, scale_model_sz);

        %得到尺度变换的响应最大值y=F-1{(A*Z)/(B+lambda)}
        xsf = fft(xs,[],2);
        scale_response = real(ifft(sum(sf_num .* xsf, 1) ./ (sf_den + lambda)));

        %找到max(y)得到当前的尺度
        recovered_scale = find(scale_response == max(scale_response(:)), 1);

        % 更新当前尺度
        currentScaleFactor = currentScaleFactor * scaleFactors(recovered_scale);
        if currentScaleFactor < min_scale_factor
            currentScaleFactor = min_scale_factor;
        elseif currentScaleFactor > max_scale_factor
            currentScaleFactor = max_scale_factor;
        end
总结

　　DSST算法是一个非常典型且高效的基于相关滤波器的目标跟踪算法，非常值得学习和借鉴其中的思想和方法，尽管跟踪算法迭代很快，在15年的VOT上被深度学习的算法所取代，但是仍然有不少算法基于相关滤波器进行改进，所以学习这类算法是相当有益的。

心得：

两个滤波器位置滤波器和尺度滤波器分别进行跟踪和计算尺度，而且两个滤波器原理相同。

HOG是一个局部特征，如果对一大幅图片直接提取特征，是得不到好的效果，所以把图像分割成很多区块，然后对每个区块计算HOG特征，这也包含了几何（位置）特性

两个滤波器的实现方式很相似。但是有几点也不尽相同：
1、位移相关性滤波器（TF）在获取hog特征图时，是以2倍目标框大小的图像获取的。并且这个候选框只有一个，即上一帧确定的目标框。
而尺度相关性滤波器（SF）在获取hog特征图时，是以当前目标框的大小为基准，以33中不同的尺度获取候选框的hog特征图，即：
ss = (1:nScales) - ceil(nScales/2);
1

1

其理论依据是：

patches=anW+anH

n∈{−S−12,...,S−12}

其中W和H分别代表目标框的宽度和高度，S代表尺度的个数。

SF的实践过程中，FFT（快速傅里叶变换）和IFFT（快速傅里叶反变换）都是一维变换，而TF则是二维空间的变换。

%得到的是样本的HOG特征图，并且用hann窗口减少图像边缘频率对FFT变换的影响

xt = get_translation_sample(im, pos, sz, currentScaleFactor, cos_window);

参考：http://blog.csdn.net/autocyz/article/details/48651013

带sse下载地址：http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/index.html

arm版本：

https://github.com/TuringKi/fDSST_cpp
三：KCF+DSST算法融合
KCF代码： http://pan.baidu.com/s/1cxURme

DSST代码： http://www.cvl.isy.liu.se/en/research/objrec/visualtracking/scalvistrack/index.html

把DSST算法中，分两部分，平移部分和尺度部分，本文中直接把DSST中的尺度部分引入到kcf中，简单来说，即平移使用kcf，尺度使用dsst，并且两者并非完全独立，每次更新的尺度变化会给到下一阵kcf的跟踪中。

大致流程：

窗口尺寸设置--带宽，高斯形状的回归标签，cos窗口--图像大小处理--抓取（根据上一帧跟踪位置和尺度）目标作为测试集-- 用平移过滤器计算平移滤波器响应找到目标位置--用尺度过滤器计算平移滤波器响应找到目标所在的尺度--更新目标位置--更新目标尺度--抓取上一步中找到的目标图块作为训练集--训练平移分类器--训练尺度分类器--保存目标位置尺度以及时间--可视化--循环--结束。

代码更改：

代码更改是以kcf源代码作为基础的，在run-tracker.m文件中加入了dsst的参数设置部分的代码，在把dasst代码中的dsst.m文件中的尺度部分代码加入了 tracker.m中，并且把kcf中的get-subwindow.m函数文件进行了更改，增加了一个输入量，尺度，即抓取图块时，会根据目标位置与尺度抓取图块，然后再用mexresize函数重新变换为标准尺寸。

代码部分：

1。run-tracker.m:
function [precision, fps] = run_tracker(video, kernel_type, feature_type, show_visualization, show_plots)

	%path to the videos (you'll be able to choose one with the GUI).
% 	base_path = './data/Benchmark/';
    base_path = 'D:/AplusFile/ComputerVision/IR-Tracking/trackingimages/imagecut/';
	%default settings
% 	if nargin < 1, video = 'all'; end 
    if nargin < 1, video = 'choose'; end
	if nargin < 2, kernel_type = 'gaussian'; end
	if nargin < 3, feature_type = 'hog'; end
	if nargin < 4, show_visualization = ~strcmp(video, 'all'); end
	if nargin < 5, show_plots = ~strcmp(video, 'all'); end

	%parameters according to the paper. at this point we can override
	%parameters based on the chosen kernel or feature type
	kernel.type = kernel_type;
	
	features.gray = false;
	features.hog = false;
	
	padding = 1.5;  %extra area surrounding the target
	lambda = 1e-4;  %regularization
	output_sigma_factor = 0.1;  %spatial bandwidth (proportional to target)
    
    
    %%  
	switch feature_type
	case 'gray',
		interp_factor = 0.075;  %0.075 linear interpolation factor for adaptation

		kernel.sigma = 0.2;  %gaussian kernel bandwidth
		
		kernel.poly_a = 1;  %polynomial kernel additive term
		kernel.poly_b = 7;  %polynomial kernel exponent
        %% 
	
		features.gray = true;
		cell_size = 1;
		
	case 'hog',
		interp_factor = 0.02;%0.02
		
		kernel.sigma = 0.5;
		
		kernel.poly_a = 1;
		kernel.poly_b = 9;
		
		features.hog = true;
		features.hog_orientations = 9;
		cell_size = 4;
		
	otherwise
		error('Unknown feature.')
    end
        %% dsst parameters
        global params;
	%params.output_sigma_factor = 1/16;		% standard deviation for the desired translation filter output
    params.scale_sigma_factor = 1/4;        % standard deviation for the desired scale filter output
    params.lambda = 1e-2;					% regularization weight (denoted "lambda" in the paper)
    params.learning_rate = 0.025;%0.025			% tracking model learning rate (denoted "eta" in the paper)
    params.number_of_scales = 33;           % number of scale levels (denoted "S" in the paper)
    params.scale_step = 1.02;               % Scale increment factor (denoted "a" in the paper)
    params.scale_model_max_area = 512;      % the maximum size of scale examples
%% 

	assert(any(strcmp(kernel_type, {'linear', 'polynomial', 'gaussian'})), 'Unknown kernel.')


	switch video
	case 'choose',
		%ask the user for the video, then call self with that video name.
		video = choose_video(base_path);
		if ~isempty(video),
			[precision, fps] = run_tracker(video, kernel_type, ...
				feature_type, show_visualization, show_plots);
			
			if nargout == 0,  %don't output precision as an argument
				clear precision
			end
		end
		
		
	case 'all',
		%all videos, call self with each video name.
		
		%only keep valid directory names
		dirs = dir(base_path);
		videos = {dirs.name};
		videos(strcmp('.', videos) | strcmp('..', videos) | ...
			strcmp('anno', videos) | ~[dirs.isdir]) = [];
		
		%the 'Jogging' sequence has 2 targets, create one entry for each.
		%we could make this more general if multiple targets per video
		%becomes a common occurence.
		videos(strcmpi('Jogging', videos)) = [];
		videos(end+1:end+2) = {'Jogging.1', 'Jogging.2'};
		
		all_precisions = zeros(numel(videos),1);  %to compute averages
		all_fps = zeros(numel(videos),1);
		
		if ~exist('matlabpool', 'file'),
			%no parallel toolbox, use a simple 'for' to iterate
			for k = 1:numel(videos),
				[all_precisions(k), all_fps(k)] = run_tracker(videos{k}, ...
					kernel_type, feature_type, show_visualization, show_plots);
			end
		else
			%evaluate trackers for all videos in parallel
			if matlabpool('size') == 0,
				matlabpool open;
			end
			parfor k = 1:numel(videos),
				[all_precisions(k), all_fps(k)] = run_tracker(videos{k}, ...
					kernel_type, feature_type, show_visualization, show_plots);
			end
		end
		
		%compute average precision at 20px, and FPS
		mean_precision = mean(all_precisions);
		fps = mean(all_fps);
		fprintf('\nAverage precision (20px):% 1.3f, Average FPS:% 4.2f\n\n', mean_precision, fps)
		if nargout > 0,
			precision = mean_precision;
		end
		
		
	case 'benchmark',
		%running in benchmark mode - this is meant to interface easily
		%with the benchmark's code.
		
		%get information (image file names, initial position, etc) from
		%the benchmark's workspace variables
		seq = evalin('base', 'subS');
		target_sz = seq.init_rect(1,[4,3]);
		pos = seq.init_rect(1,[2,1]) + floor(target_sz/2);
		img_files = seq.s_frames;
		video_path = [];
		
		%call tracker function with all the relevant parameters
		positions = tracker(video_path, img_files, pos, target_sz, ...
			padding, kernel, lambda, output_sigma_factor, interp_factor, ...
			cell_size, features, false);
		
		%return results to benchmark, in a workspace variable
		rects = [positions(:,2) - target_sz(2)/2, positions(:,1) - target_sz(1)/2];
		rects(:,3) = target_sz(2);
		rects(:,4) = target_sz(1);
		res.type = 'rect';
		res.res = rects;
		assignin('base', 'res', res);
		
		
	otherwise
		%we were given the name of a single video to process.
	
		%get image file names, initial state, and ground truth for evaluation
		[img_files, pos, target_sz, ground_truth, video_path] = load_video_info(base_path, video);
		
		
		%call tracker function with all the relevant parameters
		[positions, time] = tracker(video_path, img_files, pos, target_sz, ...
			padding, kernel, lambda, output_sigma_factor, interp_factor, ...
			cell_size, features, show_visualization);
		
		
		%calculate and show precision plot, as well as frames-per-second
		precisions = precision_plot(positions, ground_truth, video, show_plots);
		fps = numel(img_files) / time;

		fprintf('%12s - Precision (20px):% 1.3f, FPS:% 4.2f\n', video, precisions(20), fps)

		if nargout > 0,
			%return precisions at a 20 pixels threshold
			precision = precisions(20);
		end

	end
end
2.tracker.m:
function [positions, time] = tracker(video_path, img_files, pos, target_sz, ...
	padding, kernel, lambda, output_sigma_factor, interp_factor, cell_size, ...
	features, show_visualization)
%
    %% DSST parameters
global params;
    
    scale_lambda = params.lambda;
    scale_learning_rate = params.learning_rate;
    nScales = params.number_of_scales;
    scale_step = params.scale_step;
    scale_sigma_factor = params.scale_sigma_factor;
    scale_model_max_area = params.scale_model_max_area;

    %% compute size
	%if the target is large, lower the resolution, we don't need that much
	%detail
	resize_image = (sqrt(prod(target_sz)) >= 100); 
	if resize_image,
		pos = floor(pos / 2);
		target_sz = floor(target_sz / 2);
    end
    
    % target size att scale = 1
    init_target_sz = target_sz;
    base_target_sz = target_sz;
	%window size, taking padding into account
	window_sz = floor(base_target_sz * (1 + padding));
	
% 	%we could choose a size that is a power of two, for better FFT
% 	%performance. in practice it is slower, due to the larger window size.
% 	window_sz = 2 .^ nextpow2(window_sz);

	
	%create regression labels, gaussian shaped, with a bandwidth
	%proportional to target size
    %% creat translation target label
	output_sigma = sqrt(prod(base_target_sz)) * output_sigma_factor / cell_size;
	yf = fft2(gaussian_shaped_labels(output_sigma, floor(window_sz / cell_size)));

	%store pre-computed cosine window
	cos_window = hann(size(yf,1)) * hann(size(yf,2))';	
	%% creat scale target label
    % desired scale filter output (gaussian shaped), bandwidth proportional to
    % number of scales
    scale_sigma = nScales/sqrt(33) * scale_sigma_factor;
    ss = (1:nScales) - ceil(nScales/2);
    ys = exp(-0.5 * (ss.^2) / scale_sigma^2);
    ysf = single(fft(ys));
    
    % store pre-computed translation filter cosine window
    %cos_window = single(hann(window_sz(1)) * hann(window_sz(2))');
	%% store pre-computed scale filter cosine window
    
    if mod(nScales,2) == 0
        scale_window = single(hann(nScales+1));
        scale_window = scale_window(2:end);
    else
        scale_window = single(hann(nScales));
    end;

    % scale factors
    ss = 1:nScales;
    scaleFactors = scale_step.^(ceil(nScales/2) - ss);
    % compute the resize dimensions used for feature extraction in the scale
    % estimation
    scale_model_factor = 1;
    if prod(init_target_sz) > scale_model_max_area
        scale_model_factor = sqrt(scale_model_max_area/prod(init_target_sz));
    end
    scale_model_sz = floor(init_target_sz * scale_model_factor);

    currentScaleFactor = 1;
%% over
	if show_visualization,  %create video interface
		update_visualization = show_video(img_files, video_path, resize_image);
	end
	
	
	%note: variables ending with 'f' are in the Fourier domain.

	time = 0;  %to calculate FPS
	positions = zeros(numel(img_files),4);
    % find maximum and minimum scales
    im = imread([video_path img_files{1}]);
    min_scale_factor = scale_step ^ ceil(log(max(5 ./ window_sz)) / log(scale_step));
    max_scale_factor = scale_step ^ floor(log(min([size(im,1) size(im,2)] ./ base_target_sz)) / log(scale_step));

%% main circlation
	for frame = 1:numel(img_files),
		%load image
		im = imread([video_path img_files{frame}]);
		if size(im,3) > 1,
			im = rgb2gray(im);
		end
		if resize_image,
			im = imresize(im, 0.5);
        end
        %% guided image filter
  %           im=im-imguidedfilter(im);
% %          figure(2)
% %          imshow(im);
        %% track
		tic()

		if frame > 1,
            %% update translation
			%obtain a subwindow for detection at the position from last
			%frame, and convert to Fourier domain (its size is unchanged)
			patch_trans = get_subwindow(im, pos, window_sz,currentScaleFactor);
			zf = fft2(get_features(patch_trans, features, cell_size, cos_window));
			
			%calculate response of the classifier at all shifts
			switch kernel.type
			case 'gaussian',
				kzf = gaussian_correlation(zf, model_xf, kernel.sigma);
			case 'polynomial',
				kzf = polynomial_correlation(zf, model_xf, kernel.poly_a, kernel.poly_b);
			case 'linear',
				kzf = linear_correlation(zf, model_xf);
			end
			response = real(ifft2(model_alphaf .* kzf));  %equation for fast detection

			%target location is at the maximum response. we must take into
			%account the fact that, if the target doesn't move, the peak
			%will appear at the top-left corner, not at the center (this is
			%discussed in the paper). the responses wrap around cyclically.
			[vert_delta, horiz_delta] = find(response == max(response(:)), 1);
			if vert_delta > size(zf,1) / 2,  %wrap around to negative half-space of vertical axis
				vert_delta = vert_delta - size(zf,1);
			end
			if horiz_delta > size(zf,2) / 2,  %same for horizontal axis
				horiz_delta = horiz_delta - size(zf,2);
			end
			pos = pos + cell_size * [vert_delta - 1, horiz_delta - 1];
            %% update scale
              % extract the test sample feature map for the scale filter
            patch_scale = get_scale_sample(im, pos, base_target_sz, currentScaleFactor * scaleFactors, scale_window, scale_model_sz);

            % calculate the correlation response of the scale filter
            xsf = fft(patch_scale,[],2);
            scale_response = real(ifft(sum(sf_num .* xsf, 1) ./ (sf_den + lambda)));

            % find the maximum scale response
            recovered_scale = find(scale_response == max(scale_response(:)), 1);

            % update the scale
            currentScaleFactor = currentScaleFactor * scaleFactors(recovered_scale);
            if currentScaleFactor < min_scale_factor
                currentScaleFactor = min_scale_factor;
            elseif currentScaleFactor > max_scale_factor
                currentScaleFactor = max_scale_factor;
            end
        end
        %% traning translation filter
		%obtain a subwindow for training at newly estimated target position
		patch_trans = get_subwindow(im, pos, window_sz,currentScaleFactor);
		xf = fft2(get_features(patch_trans, features, cell_size, cos_window));

		%Kernel Ridge Regression, calculate alphas (in Fourier domain)
		switch kernel.type
		case 'gaussian',
			kf = gaussian_correlation(xf, xf, kernel.sigma);
		case 'polynomial',
			kf = polynomial_correlation(xf, xf, kernel.poly_a, kernel.poly_b);
		case 'linear',
			kf = linear_correlation(xf, xf);
		end
		alphaf = yf ./ (kf + lambda);   %equation for fast training

        %% training scale filter
        % extract the training sample feature map for the scale filter
        patch_scale = get_scale_sample(im, pos, base_target_sz, currentScaleFactor * scaleFactors, scale_window, scale_model_sz);

        % calculate the scale filter update
        xsf = fft(patch_scale,[],2);
        new_sf_num = bsxfun(@times, ysf, conj(xsf));
        new_sf_den = sum(xsf .* conj(xsf), 1);
        %%  
        if frame == 1,  %first frame, train with a single image
			model_alphaf = alphaf;
			model_xf = xf;
            sf_den = new_sf_den;
            sf_num = new_sf_num;
		else
			%subsequent frames, interpolate model
			model_alphaf = (1 - interp_factor) * model_alphaf + interp_factor * alphaf;
			model_xf = (1 - interp_factor) * model_xf + interp_factor * xf;
            sf_den = (1 - scale_learning_rate) * sf_den + scale_learning_rate * new_sf_den;
            sf_num = (1 - scale_learning_rate) * sf_num + scale_learning_rate * new_sf_num;
        end
		%% save position and timing
           
        % calculate the new target size
        target_sz = floor(base_target_sz * currentScaleFactor);
%         output_sigma = sqrt(prod(base_target_sz)) * output_sigma_factor / cell_size;
%         yf = fft2(gaussian_shaped_labels(output_sigma, floor(target_sz / cell_size)));

        %store pre-computed cosine window
        %cos_window = hann(size(yf,1)) * hann(size(yf,2))';	
		positions(frame,:) = [pos target_sz];
		time = time + toc();
        
        %%  visualization
        if show_visualization == 1
            rect_position = [pos([2,1]) - target_sz([2,1])/2, target_sz([2,1])];
            if frame == 1,  %first frame, create GUI
                figure('Name',['Tracker - ' video_path]);
                im_handle = imshow(uint8(im), 'Border','tight', 'InitialMag', 100 + 100 * (length(im) < 500));
                rect_handle = rectangle('Position',rect_position, 'EdgeColor','g');
                text_handle = text(10, 10, int2str(frame));
                set(text_handle, 'color', [0 1 1]);
            else
                try  %subsequent frames, update GUI
                    set(im_handle, 'CData', im)
                    set(rect_handle, 'Position', rect_position)
                    set(text_handle, 'string', int2str(frame));
                catch
                    return
                end
            end
            drawnow
        end
		
	end

	if resize_image,
		positions = positions * 2;
	end
end
3.get-subwindow.m:
function out = get_subwindow(im, pos, sz, currentScaleFactor)
%GET_SUBWINDOW Obtain sub-window from image, with replication-padding.
%   Returns sub-window of image IM centered at POS ([y, x] coordinates),
%   with size SZ ([height, width]). If any pixels are outside of the image,
%   they will replicate the values at the borders.
%
%   Joao F. Henriques, 2014
%   http://www.isr.uc.pt/~henriques/

	if isscalar(sz),  %square sub-window
		sz = [sz, sz];
	end
	patch_sz = floor(sz * currentScaleFactor);
    %make sure the size is not to small
    if patch_sz(1) < 1
        patch_sz(1) = 2;
    end;
    if patch_sz(2) < 1
        patch_sz(2) = 2;
    end;
	xs = floor(pos(2)) + (1:patch_sz(2)) - floor(patch_sz(2)/2);
	ys = floor(pos(1)) + (1:patch_sz(1)) - floor(patch_sz(1)/2);
	
	%check for out-of-bounds coordinates, and set them to the values at
	%the borders
	xs(xs < 1) = 1;
	ys(ys < 1) = 1;
	xs(xs > size(im,2)) = size(im,2);
	ys(ys > size(im,1)) = size(im,1);
	% extract image
    im_patch = im(ys, xs, :);

    % resize image to model size
    out = mexResize(im_patch, sz, 'auto');
    

end
后续还需要把dsst中的一些函数文件或者运行支持库拷贝到kcf中，之后修改一下运行路径就能进行试验了。

四，总结：

融合后的kcf+dsst算法首先在计算量上面会有所损耗，因为用的是完全版的dsst而非后面改进版本的fdsst，所以尺度的加入对于kcf的计算速度

有所损耗，运行帧数为单纯kcf的1/3。

但是识别精度提高10%左右（根据数据集的不同），有明显的尺度变化的kcf会容易跟丢，带有尺度的kcf+dsst则能够持续跟踪。

未来的改进就是把fdsst加入kcf中，怎样计算速度能提升不少。

你可能感兴趣的:(图像跟踪与识别-KCF+DSST算法简单融合)

Python Web开发之“基于flask的轻量级Web应用” 诚威_lol_中大努力中夏令营复习 python 前端 flask
参考文章1：https://cloud.tencent.com/developer/article/2373503参考文章2：基于Flask的自定义网站设计与实现（代码全文+讲解V1.0）_flask框架制作网页-CSDN博客参考文章3：Python+Flask+MysqL设计网页-李明惠-博客园(cnblogs.com)最基本的例子来源-参考文章1：说明：导入Flask类——>app=Flask
vue3 - 【完整源码】超详细实现网站 / H5 在线预览 pdf 文件功能，支持缩放、旋转、全屏预览、打印、下载、内容检索、主题色定制、侧边缩略图、页码跳转等等（最好用的pdf预览器，注释详细！）十一猫咪爱养鱼前端组件与功能(开箱即用)Vue组件与功能(工作经验)vue常见问题解决 vue3 pdf 预览器 vue3网页打开pdf文件 vue3 可自定义界面的pdf vue3 pdf 网页预览下载 vue3项目预览PDF插件组件
效果图在Vue3.js项目中，实现了快速高效的pdf预览器工具组件，附带详细的使用教程与详细的注释，保证一键复制轻松搞定！详细的注释很容易二次修改，很多实用功能，你也可以自定义界面上的样式、DIY一切！组件源码首先
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
Selenium浏览器驱动全面指南：Chrome、Firefox与IE
本文还有配套的精品资源，点击获取简介：Selenium是一个用于自动化Web应用程序测试的工具，支持多种浏览器，包括GoogleChrome、MozillaFirefox和InternetExplorer（IE）。本指南详细介绍如何配置和使用与这三种主流浏览器协同工作的Selenium驱动程序。包括ChromeDriver、GeckoDriver和IEDriverServer，以及在Python中
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
Java ArrayList 扩容机制笑衬人心。 JAVA学习笔记 java 开发语言笔记后端
一、ArrayList简介ArrayList是Java集合框架中基于数组实现的可变长度列表，其核心特性是：支持随机访问（通过索引）支持动态扩容插入/删除效率较低（非尾部操作）二、底层数据结构//JDK11+transientObject[]elementData;//实际存储元素的数组三、容量与初始状态默认构造函数publicArrayList(){this.elementData=DEFAULT
深刻解析如何解决在pycharm中导入tensorflow的子模块keras时的报错（导入语法正确） lovingf pycharm python tensorflow keras
只是导入时报错，但代码仍可以运行1.导入方式正确，但pycharm将其标红2.通过查看tensorflow的官方文件，猜测可能是python版本不适配python需为python3.6-3.9，而我的为python3.113.配置python3.9的环境（详情可看我的另一篇文章），但依然报错4.经过仔细分析，觉得可能是pycharm与tensorflow的适配问题，pycharm无法寻找到tens
Vue-pdf预览pdf文件流：让Vue项目中的PDF预览变得简单
Vue-pdf预览pdf文件流：让Vue项目中的PDF预览变得简单【下载地址】Vue-pdf预览pdf文件流Vue-pdf预览PDF文件流是一个专为Vue项目设计的开源解决方案，旨在帮助开发者轻松实现在线预览PDF文件的功能。通过集成vue-pdf插件，该项目简化了在Vue应用中嵌入和展示PDF文件的过程，支持流式传输，提升用户体验。开发者只需按照简单的步骤将插件引入项目，并根据需求配置文件路径或
新手向:代码编写工具推荐 nightunderblackcat 基础环境配置 notepad++pycharm python intellij-idea java c++c#
开发者兵器谱：我的高效编码六大神器深度解析在软件开发的世界里，得心应手的工具如同侠客手中的利剑。经过多年的项目锤炼，我精心打磨了一套开发工具链，它们各有所长，助我在不同战场上游刃有余。下面就来深度剖析这六位“数字战友”：一、轻骑兵：Notepad++——闪电编辑与文本处理的王者核心定位：超轻量级文本/代码编辑器，启动如闪电，资源占用极低。看家本领：列编辑模式：Alt+鼠标拖拽或Alt+Shift+
精通C++包括哪些方面 melonbo 百问 -C/C++c++
一、语言核心与标准特性多范式编程掌握过程式、面向对象（OOP）、泛型编程（模板）和函数式编程，能根据场景选择最佳范式。内存管理熟练使用new/delete、智能指针（unique_ptr、shared_ptr），理解RAII原则，避免内存泄漏。现代C++标准应用C++11/14/17/20特性（如移动语义、lambda表达式、协程），提升代码效率。模板与元编程实现函数/类模板，掌握SFINAE、变
计算整数二进制中1的个数 VictorWuuu 算法算法后端
Golang实现：计算整数二进制中1的个数（包含负数补码）问题分析这道题目要求我们计算一个整数的二进制表示中1的个数，对于负数需要考虑其补码形式。例如：输入：5（二进制：101）→输出：2输入：-3（二进制补码：1111...1101）→输出：31（32位系统下）解题思路我们可以利用位运算中的与运算（&）来检查整数的每一位是否为1。具体步骤如下：初始化计数器为0通过循环检查整数的每一位：将整数与1
深入游戏开发：瓦片地图与游戏引擎集成蓉蓉蓉蓉瓦片地图游戏引擎 Lua脚本库存管理动态滚动
背景简介在游戏开发领域，瓦片地图技术（Tilemap）是实现2D游戏世界构建的重要工具。它通过在网格上排列和渲染预制的瓦片图像，来创建游戏场景。本文将基于书籍章节内容，探讨瓦片地图的构建与优化，以及如何将脚本有效集成到游戏引擎中。瓦片地图构建与优化瓦片地图的构建涉及几个关键步骤，如位图的构建、库存和物品的管理。书中提到，位图可以通过编程方式动态生成，也可以从文件中加载。例如，通过调用loadTil
goland设置goroot_GoLand安装及环境配置 weixin_39885383 goland设置goroot
前因后果：新学期新气象，开学的第一节课是zw老师的区块链技术与应用领域，congratulations！涉及编程实验，使用Go语言，需要安装GoLand软件进行下一步。进去之后选择对应的版本下载，这里我下的Windows64的。完成之后开始安装，一路next直到完成，需要注意的就是安装路径，默认是C盘，这里我更改为了E盘。接下来进行Go语言坏境变量的配置，非常熟练的打开环境变量。坏境变量打开方式：
开发百度离线地图Java Web项目与无水印瓦片下载工具王超逸q
本文还有配套的精品资源，点击获取简介：本项目采用MyEclipse开发环境构建JavaWeb应用程序，实现百度离线地图功能。通过百度地图API获取地图瓦片，并包含无水印瓦片下载工具，需遵循百度地图的使用条款。项目文件包括源代码、配置文件、资源文件，涉及地图API调用、HTTP协议、JavaWeb应用生命周期、MyEclipse使用、地图瓦片坐标系统理解等技术。项目的成功部署需要熟悉Web服务器如T
高效实现滚动地图：瓦片渲染技术郑丢丢瓦片渲染游戏开发内存优化滚动地图渲染技术
高效实现滚动地图：瓦片渲染技术背景简介在游戏开发中，创建大型、动态的地图是一大挑战，尤其是对于内存的优化要求极高。传统的背景图方式不仅占内存，而且在处理大型地图时效率低下。本文介绍了一种被称为瓦片渲染的技术，它通过将大地图分解为小的图像块（瓦片），有效减少了内存的使用，同时还能实现流畅的滚动效果。瓦片渲染的原理瓦片渲染是一种处理大型游戏地图的方法，它不依赖于一个大型的位图，而是通过数组和小图像块（
新手如何本地构建Milvus向量数据库 BeMiracle~ milvus 数据库
简单构建一个Milvus数据库一、前言：什么是Milvus数据库二、安装Docker官方下载地址：配置Docker三、安装Milvus四、Milvus关键概念介绍1、首先创建数据库2、然后创建逻辑定义3、添加字段4、创建集合collection5、建立索引（有索引才能查询数据）6、插入更新删除数据7、查询数据(查询limit个相似向量)一、前言：什么是Milvus数据库Milvus是一款‌开源向量
WIN11实现链路聚合/端口聚合蒙山蒙水硬件网络链路聚合端口聚合 win11 windows11
引用：https://www.ejiadc.cn/2024/07/1719831104322提示：配置链路聚合/端口聚合时，交换机和电脑之间只能有一根网线相连，否则会导致环路。端口聚合配置完成后，再加上多条网线。创建过程win11目前只支持通过自带的powershell进行链路聚合配置，简单配置过程记录如下：
GDAL读取Jpeg2000格式图像蒙山蒙水 C++算法图像处理 c++GDAL 遥感 JPEG2000
JPEG-2000标准支持无损和有损压缩，并且支持单图像分量（如灰度图像）和多图像分量（如彩色图像）。除了基本的图像压缩功能外，还支持其他的功能：1）对图像进行按精度或者按分辨率来渐进显示。2）感兴趣编码，就是对不同的图像区域给予不同的精度。3）对图像的某个区域进行随机访问时，不用对整个码流进行解码。4）提供一种灵活的图像格式，这种格式能够分辨出那些是图像数据信息，那些是码流内部信息。5）具有较好
地图瓦片下载工具介绍：一键获取离线地图资源昌吉程Kyla
地图瓦片下载工具介绍：一键获取离线地图资源【下载地址】地图瓦片下载工具介绍这款地图瓦片下载工具为地图开发者和用户提供了强大的离线地图支持。它能够高效下载地图底层瓦片，帮助用户在没有网络连接的情况下依然可以访问和使用地图服务。工具支持灵活配置，用户可根据需求自定义下载范围和层级，确保数据精准覆盖。兼容多种地图服务格式，操作简单，只需解压后运行程序并设置参数即可启动下载。无论是用于开发还是个人使用，这
Golang ToLower和ToLowerSpecial源码探究 ob767 golang
本文简单探索ToLower方法及SpecialCase的使用方法和实现，如果只关注SpecialCase方法的同学可以直接跳转至分割线以下问题起因是使用strings包中的ToLower时转换小写结果与预期不相符a:="ADASD$%^*@%3Ω"fmt.Println(strings.ToLower(a))//adasd$%^*@%3ω本只想将A-Z进行大小写转换，但strings.ToLowe
Golang领域GOROOT的配置与使用技巧 Golang编程笔记 golang 爬虫开发语言 ai
Golang领域GOROOT的配置与使用技巧关键词：Golang,GOROOT,配置,使用技巧,环境变量摘要：本文详细介绍了Golang领域中GOROOT的相关知识。首先阐述了GOROOT的背景，包括其目的、适用读者、文档结构和相关术语。接着深入解析了GOROOT的核心概念及与其他关键元素的联系，并通过Mermaid流程图展示其架构。之后详细讲解了GOROOT配置的核心算法原理及具体操作步骤，配以
Golang教程——配置环境，再探GoLand 棏郢. Go golang 开发语言后端
文章目录一、Go是什么？二、环境配置验证配置环境变量三、安装开发者工具GoLand四、HelloGolang一、Go是什么？Go（也称为Golang）是一种开源的编程语言，由Google开发并于2009年首次发布。Go语言旨在提供一种简单、高效、可靠的编程语言，适用于构建可扩展的软件系统。Go语言具有以下特点：简洁易读：Go语言的语法简洁明了，易于阅读和理解。它摒弃了一些复杂的语法和概念，使得代码
svelte笔记艾小逗 web 笔记
svelte特性编译过程使用场景创建项目问题1：build报错基本语法响应式变量if语句for循环await加载数据Event组件通信父子组件跨组件通信storeslot插槽生命周期tickonMountonDestroySvelteKit与Svelte的区别项目结构路由+page+page.svelte+page.js/ts+error+layout+layout.sveltelayout.se
常见机器学习算法与应用场景计算机软件程序设计知识科普机器学习算法人工智能
当然可以。下面是对常见机器学习算法的全面详细阐述，包括每种算法的基本原理、特点以及典型应用场景。1.监督学习（SupervisedLearning）1.1线性回归（LinearRegression）原理：通过拟合一条直线来表示输入和输出之间的关系，适用于预测连续值输出。特点：简单易懂，计算速度快，但只能捕捉线性关系。应用场景：房价预测股票价格预测销售额预测1.2逻辑回归（LogisticRegre
数据库Mysql基础------第一部分数据的准备与基础命令 Judy~judy 数据库数据库 mysql
一、初识数据库一、为什么要用数据库？数据库（Database）是按照数据结构来组织、存储和管理数据的仓库数据库随时随地的存在，并且使用，简单的说，数据库就是收集数据的结构。数据涉及很多，例如一个产品属于种类，并且有自己的数据标签，这就是为什么要用关系型数据。在关系数据库，我们建模数据包括产品，品类，标签等等，所有这些都用一个表格，包含行和列，就像Excel中的电子表格。从文件中读取数据的反序列化操
nonorepo+turbo实现多项目管理 k0933 记录 vue.js 前端
运行命令pnpminstallpnpmrundevpnpmrunbuild:pcpnpmrunbuild:h5参考1、Monorepo多项目管理不再难！从零开始：pnpmworkspace手把手教你打造灵活、可扩展的开发环境2、monorepo的理解以及简单实现
通用 Makefile 模板想和我重名？小Tips 开发语言 linux
一个简单的Makefile模版#=============================================================================#示例项目结构:#my_project/#├──Makefile#├──src/#│├──main.c#│└──module1.cpp#└──include/#├──my_header.h#└──module1.h
LeetCode 70：爬楼梯｜递归到动态规划全路径解析 kiki_2411 算法设计与分析 leetcode 动态规划算法
本篇博客将通过LeetCode第70题“ClimbingStairs”为例，系统讲解从递归暴力解法到记忆化搜索、再到动态规划及空间优化的四种典型思路，适合算法初学者深入掌握递归与DP基础。文章目录LeetCode70|爬楼梯一、题目描述二、思路分析三、方法一：递归（不带记忆）思路C++代码四、方法二：递归+记忆化搜索（Top-DownDP）思路五、方法三：动态规划（Bottom-Up）思路六、方法
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
HarmonyOS应用开发进阶：ArkTS高效开发模式与工程实践一键难忘 harmonyos HarmonyOS应用开发者
文章目录HarmonyOS应用开发进阶：ArkTS高效开发模式与工程实践一、高级组件开发模式1.1自定义组合式组件二、网络通信与数据缓存2.1智能请求管理三、动态交互与动画引擎3.1手势驱动动画四、模块化工程架构4.1分层架构设计4.2动态模块加载五、多设备适配策略5.1响应式布局系统六、性能监测与优化6.1渲染性能分析七、测试与质量保障7.1自动化测试框架八、持续集成与部署8.1自动化构建流程结
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置