zhazhiqiang2010

DPM(Defomable Parts Model) 源码分析

DPM(Deformable Parts Model)--原理(一)

原文：http://blog.csdn.net/ttransposition/article/details/12966521

DPM(Deformable Parts Model)

Reference:

Object detection with discriminatively trained partbased models. IEEE Trans. PAMI, 32(9):1627–1645, 2010.

"Support Vector Machines for Multiple-Instance Learning,"Proc. Advances in Neural Information Processing Systems,2003.

作者主页：http://www.cs.berkeley.edu/~rbg/latent/index.html

大体思路

DPM是一个非常成功的目标检测算法，连续获得VOC（Visual Object Class）07,08,09年的检测冠军。目前已成为众多分类器、分割、人体姿态和行为分类的重要部分。2010年Pedro Felzenszwalb被VOC授予"终身成就奖"。DPM可以看做是HOG（Histogrrams of Oriented Gradients）的扩展，大体思路与HOG一致。先计算梯度方向直方图，然后用SVM（Surpport Vector Machine ）训练得到物体的梯度模型（Model）。有了这样的模板就可以直接用来分类了，简单理解就是模型和目标匹配。DPM只是在模型上做了很多改进工作。

上图是HOG论文中训练出来的人形模型。它是单模型，对直立的正面和背面人检测效果很好，较以前取得了重大的突破。也是目前为止最好的的特征（最近被CVPR20 13年的一篇论文《Histograms of Sparse Codes for Object Detection》超过了）。但是，如果是侧面呢？所以自然我们会想到用多模型来做。DPM就使用了2个模型，主页上最新版本Versio5的程序使用了12个模型。

上图就是自行车的模型，左图为侧面看，右图为从正前方看。好吧，我承认已经面目全非了，这只是粗糙版本。训练的时候只是给了一堆自行车的照片，没有标注是属于component 1，还是component 2.直接按照边界的长宽比，分为2半训练。这样肯定会有很多很多分错了的情况，训练出来的自然就失真了。不过没关系，论文里面只是把这两个Model当做初始值。重点就是作者用了多模型。

上图右边的两个模型各使用了6个子模型，白色矩形框出来的区域就是一个子模型。基本上见过自行车的人都知道这是自行车。之所以会比左边好辨识，是因为分错component类别的问题基本上解决了，还有就是图像分辨率是左边的两倍，这个就不细说，看论文。

有了多模型就能解决视角的问题了，还有个严重的问题，动物是动的，就算是没有生命的车也有很多款式，单单用一个Model，如果动物动一下，比如美女搔首弄姿，那模型和这个美女的匹配程度就低了很多。也就是说，我们的模型太死板了，不能适应物体的运动,特别是非刚性物体的运动。自然我们又能想到添加子模型，比如给手一个子模型，当手移动时，子模型能够检测到手的位置。把子模型和主模型的匹配程度综合起来，最简单的就是相加，那模型匹配程度不就提高了吗？思路很简单吧！还有个小细节，子模型肯定不能离主模型太远了，试想下假如手到身体的位置有两倍身高那么远，那这还是人吗？也许这是个检测是不是鬼的好主意。所以我们加入子模型与主模型的位置偏移作为Cost,也就是说综合得分要减去偏移Cost.本质上就是使用子模型和主模型的空间先验知识。

好了，终于来了一张合影。最右边就是我们的偏移Cost,圆圈中心自然就是子模型的理性位置，如果检测出来的子模型的位置恰好在此，那Cost就为0，在周边那就要减掉一定的值，偏离的越远减掉的值越大。

最后再理一下继承发展关系，HOG特征源自于SIFT，参见《Distinctive image features from scale-invariant Keypoints》。Part Model 早在1973年就被提出参见《The representation and matching of pictorial structures》（木有看……）。

另外HOG特征可以参考鄙人博客：Opencv HOG行人检测源码分析SIFT特征本来也想写的但是，那时候懒，而且表述比较啰嗦，就参考一位跟我同一届的北大美女的系列博客吧。【OpenCV】SIFT原理与源码分析

总之，DPM的本质就是弹簧形变模型，参见 1973年的一篇论文 The representation and matching of pictorial structures

2.检测

检测过程比较简单：

综合得分：

是rootfilter (我前面称之为主模型)的得分，或者说是匹配程度，本质就是和的卷积，后面的partfilter也是如此。中间是n个partfilter（前面称之为子模型）的得分。是为了component之间对齐而设的rootoffset. 为rootfilter的left-top位置在root feature map中的坐标，为第个partfilter映射到part feature map中的坐标。是因为part feature map的分辨率是root feature map的两倍，为相对于rootfilter left-top 的偏移。

的得分如下：

上式是在patfilter理想位置,即anchor position的一定范围内，寻找一个综合匹配和形变最优的位置。为偏移向量，为偏移向量，为偏移的Cost权值。比如则即为最普遍的欧氏距离。这一步称为距离变换，即下图中的transformed response。这部分的主要程序有train.m、featpyramid.m、dt.cc.

3.训练

3.1多示例学习（Multiple-instance learning）

3.1.1 MI-SVM

一般机器学习算法，每一个训练样本都需要类别标号（对于二分类：1/-1）。实际上那样的数据其实已经经过了抽象，实际的数据要获得这样的标号还是很难，图像就是个典型。还有就是数据标记的工作量太大，我们想偷懒了，所以多只是给了正负样本集。负样本集里面的样本都是负的，但是正样本里面的样本不一定都是正的，但是至少有一个样本是正的。比如检测人的问题，一张天空的照片就可以是一个负样本集；一张某某自拍照就是一个正样本集（你可以在N个区域取N个样本，但是只有部分是有人的正样本）。这样正样本的类别就很不明确，传统的方法就没法训练。

疑问来了，图像的不是有标注吗？有标注就应该有类别标号啊?这是因为图片是人标的，数据量特大，难免会有些标的不够好,这就是所谓的弱监督集（weakly supervised set）。所以如果算法能够自动找出最优的位置，那分类器不就更精确吗？标注位置不是很准确，这个例子不是很明显，还记得前面讲过的子模型的位置吗？比如自行车的车轮的位置，是完全没有位置标注的，只知道在bounding box区域附件有一个车轮。不知道精确位置，就没法提取样本。这种情况下，车轮会有很多个可能的位置，也就会形成一个正样本集，但里面只有部分是包含轮子的。

针对上述问题《Support Vector Machines for Multiple-Instance Learning》提出了MI-SVM。本质思想是将标准SVM的最大化样本间距扩展为最大化样本集间距。具体来说是选取正样本集中最像正样本的样本用作训练，正样本集内其它的样本就等候发落。同样取负样本中离分界面最近的负样本作为负样本。因为我们的目的是要保证正样本中有正，负样本不能为正。就基本上化为了标准SVM。取最大正样本（离分界面最远），最小负样本（离分界面最近）：

对于正样本：为正样本集中选中的最像大正样本的样本。

对于负样本：可以将max展开，因为最小的负样本满足的话，其余负样本就都能满足，所以任意负样本有：

目标函数：

也就是说选取正样本集中最大的正样本，负样本集中的所有样本。与标准SVM的唯一不同之处在于拉格朗日系数的界限。

而标准SVM的约束是：

最终化为一个迭代优化问题:

思想很简单:第一步是在正样本集中优化；第二步是优化SVM模型。与K-Means这类聚类算法一样都只是简单的两步，却爆发了无穷的力量。

这里可以参考一篇博客Multiple-instance learning。

关于SVM的详细理论推导就不得不推荐我最为膜拜的MIT Doctor pluskid: 支持向量机系列

关于SVM的求解：SVM学习——Sequential Minimal Optimization

SVM学习——Coordinate Desent Method

此外，与多示例学习对应的还有多标记学习（multi-lable learning）有兴趣可以了解下。二者联系很大，多示例是输入样本的标记具有歧义（可正可负），而多标记是输出样本有歧义。

3.1.2 Latent SVM

1）Latent-SVM实质上和MI-SVM是一样的。区别在于扩展了Latent变量。首先解释下Latent变量，MI-SVM决定正样本集中哪一个样本作为正样本的就是一个latent变量。不过这个变量是单一的，比较简单，取值只是正样本集中的序号而已。DPM中也是要选择最大的正样本，但是它的latent变量就特别多。比如bounding box的实际位置，在HOG特征金字塔中的level,某样本属于哪一类component。也就是说我们有了一张正样本的图片，标注了bounding box，我们要在某一位置，某一尺度，提取出一个最大正样本作为某一component的正样本。

直接看Latent-SVM的训练过程：

这一部分还牵扯到了Data-minig。先不管，先只看循环中的3-6,12.

3-6就对于MI-SVM的第一步。12就对应了MI-SVM的第二步。作者这里直接用了梯度下降法，求解最优模型β。

2）现在说下Data-minig。作者为什么不直接优化，还搞个Data-minig干嘛呢？因为，负样本数目巨大，Version3中用到的总样本数为2^28，其中Pos样本数目占的比例特别低，负样本太多，直接导致优化过程很慢，因为很多负样本远离分界面对于优化几乎没有帮助。Data-minig的作用就是去掉那些对优化作用很小的Easy-examples保留靠近分界面的Hard-examples。分别对应13和10。这样做的的理论支撑证明如下：

3）再简单说下随机梯度下降法（Stochastic Gradient Decent）：

首先梯度表达式：

梯度近似：

优化流程：

这部分的主要程序：pascal_train.m->train.m->detect.m->learn.cc

3.2 训练初始化

LSVM对初始值很敏感，因此初始化也是个重头戏。分为三个阶段。英语方面我就不班门弄斧了，直接上截图。

下面稍稍提下各阶段的工作，主要是论文中没有的Latent 变量分析：

Phase1:是传统的SVM训练过程，与HOG算法一致。作者是随机将正样本按照aspect ration（长宽比）排序，然后很粗糙的均分为两半训练两个component的rootfilte。这两个rootfilter的size也就直接由分到的pos examples决定了。后续取正样本时，直接将正样本缩放成rootfilter的大小。

Phase2:是LSVM训练。Latent variables 有图像中正样本的实际位置包括空间位置（x,y）,尺度位置level，以及component的类别c，即属于component1 还是属于 component 2。要训练的参数为两个 rootfilter，offset（b）

Phase3:也是LSVM过程。

先提下子模型的添加。作者固定了每个component有6个partfilter，但实际上还会根据实际情况减少。为了减少参数，partfilter都是对称的。partfilter在rootfilter中的锚点（anchor location）在按最大energy选取partfilter的时候就已经固定下来了。

这阶段的Latent variables是最多的有：rootfilter（x,y,scale）,partfilters(x,y,scale)。要训练的参数为 rootfilters, rootoffset, partfilters, defs(的偏移Cost)。

这部分的主要程序：pascal_train.m

4.细节

4.1轮廓预测（Bounding Box Prediction）

仔细看下自行车的左轮，如果我们只用rootfilter检测出来的区域，即红色区域，那么前轮会被切掉一部分，但是如果能综合partfilter检测出来的bounding box就能得到更加准确的bounding box如右图。

这部分很简单就是用最小二乘（Least Squres）回归，程序中trainbox.m中直接左除搞定。

4.2 HOG

作者对HOG进行了很大的改动。作者没有用4*9=36维向量，而是对每个8x8的cell提取18+9+4=31维特征向量。作者还讨论了依据PCA（Principle Component Analysis）可视化的结果选9+4维特征，能达到HOG 4*9维特征的效果。

这里很多就不细说了。开题一个字都还没写，要赶着开题……主要是features.cc。有了下面这张图，自己慢慢研究下：

源码分析：

DPM(Defomable Parts Model) 源码分析-检测

DPM(Defomable Parts Model) 源码分析-训练

DPM(Defomable Parts Model) 源码分析-检测（二）

原文：http://blog.csdn.net/ttransposition/article/details/12954195

DPM(Defomable Parts Model)原理

首先声明此版本为V3.1。因为和论文最相符。V4增加了模型数由2个增加为6个，V5提取了语义特征。源码太长纯代码应该在2K+,只选取了核心部分代码

demo.m

[cpp]  view plain copy   
     
    
 function demo()  
   
 test('000034.jpg', 'car');  
 test('000061.jpg', 'person');  
 test('000084.jpg', 'bicycle');  
   
 function test(name, cls)  
 % load and display image  
 im=imread(name);  
 clf;  
 image(im);  
 axis equal;   
 axis on;  
 disp('input image');  
 disp('press any key to continue'); pause;  
   
 % load and display model  
 load(['VOC2007/' cls '_final']); %加载模型  
 visualizemodel(model);  
 disp([cls ' model']);  
 disp('press any key to continue'); pause;  
   
 % detect objects  
 boxes = detect(im, model, 0); %model为mat中的结构体  
 top = nms(boxes, 0.5);  %Non-maximum suppression.  
 showboxes(im, top);  
 %print(gcf, '-djpeg90', '-r0', [cls '.jpg']);  
 disp('detections');  
 disp('press any key to continue'); pause;  
   
 % get bounding boxes  
 bbox = getboxes(model, boxes);  %根据检测到的root，parts，预测bounding  
 top = nms(bbox, 0.5);  
 bbox = clipboxes(im, top); %预测出来的bounding，可能会超过图像原始尺寸，所以要减掉  
 showboxes(im, bbox);  
 disp('bounding boxes');  
 disp('press any key to continue'); pause;  

detect.m

[cpp]  view plain copy   
     
    
 function [boxes] = detect(input, model, thresh, bbox, ...  
                           overlap, label, fid, id, maxsize)  
 % 论文 fig.4                         
   
 % boxes = detect(input, model, thresh, bbox, overlap, label, fid, id, maxsize)  
 % Detect objects in input using a model and a score threshold.  
 % Higher threshold leads to fewer detections.  
 % boxes = [rx1 ry1 rx2 ry2 | px1 py1 px2 py2 ...| componetindex | score ]  
 % The function returns a matrix with one row per detected object.  The  
 % last column of each row gives the score of the detection.  The  
 % column before last specifies the component used for the detection.  
 % The first 4 columns specify the bounding box for the root filter and  
 % subsequent columns specify the bounding boxes of each part.  
 %  
 % If bbox is not empty, we pick best detection with significant overlap.   
 % If label and fid are included, we write feature vectors to a data file.  
   
 %phase 2： im, model, 0, bbox, overlap, 1, fid, 2*i-1  
 % trian boxex : detect(im, model, 0, bbox, overlap)  
 if nargin > 3 && ~isempty(bbox)  
   latent = true;  
 else  
   latent = false;  
 end  
   
 if nargin > 6 && fid ~= 0  
   write = true;  
 else  
   write = false;  
 end  
   
 if nargin < 9  
   maxsize = inf;  
 end  
   
 % we assume color images  
 input = color(input);   %如果是灰度图，扩充为三通道 R=G=B=Gray  
   
 % prepare model for convolutions  
 rootfilters = [];  
 for i = 1:length(model.rootfilters) %   
   rootfilters{i} = model.rootfilters{i}.w;% r*w*31维向量，9（方向范围 0~180） +18（方向范围 0-360）+4（cell熵和）  
 end  
 partfilters = [];  
 for i = 1:length(model.partfilters)  
   partfilters{i} = model.partfilters{i}.w;  
 end  
   
 % cache some data 获取所有 root，part的所有信息  
 for c = 1:model.numcomponents   % releas3.1 一种对象，只有2个模型，releas5 有3*2个模型  
   ridx{c} = model.components{c}.rootindex; % m1=1,m2=2  
   oidx{c} = model.components{c}.offsetindex; %o1=1,o2=2  
   root{c} = model.rootfilters{ridx{c}}.w;  
   rsize{c} = [size(root{c},1) size(root{c},2)]; %root size,单位为 sbin*sbin的block块，相当于原始HOG中的一个cell  
   numparts{c} = length(model.components{c}.parts); %目前为固定值6个,但是有些part是 fake  
   for j = 1:numparts{c}  
     pidx{c,j} = model.components{c}.parts{j}.partindex; %part是在该对象的所有component的part下连续编号  
     didx{c,j} = model.components{c}.parts{j}.defindex;  % 在 rootfiter中的 anchor location  
     part{c,j} = model.partfilters{pidx{c,j}}.w; % 6*6*31  
     psize{c,j} = [size(part{c,j},1) size(part{c,j},2)]; %   
     % reverse map from partfilter index to (component, part#)  
     rpidx{pidx{c,j}} = [c j];  
   end  
 end  
   
 % we pad the feature maps to detect partially visible objects  
 padx = ceil(model.maxsize(2)/2+1); % 7/2+1 = 5  
 pady = ceil(model.maxsize(1)/2+1); % 11/2+1 = 7  
   
 % the feature pyramid  
 interval = model.interval;  %10  
 %--------------------------------特征金字塔---------------------------------------------------------  
 % feat的尺寸为 img.rows/sbin,img.cols/sbin  
 % scales:缩放了多少  
 [feat, scales] = featpyramid(input, model.sbin, interval); % 8，10  
   
 % detect at each scale  
 best = -inf;  
 ex = [];  
 boxes = [];  
 %---------------------逐层检测目标-----------------------------------------------------------%  
 for level = interval+1:length(feat) %注意是从第二层开始  
   scale = model.sbin/scales(level);  % 1/缩小了多少    
   if size(feat{level}, 1)+2*pady < model.maxsize(1) || ... %扩展后还是未能达到 能同时计算两个component的得分  
      size(feat{level}, 2)+2*padx < model.maxsize(2) || ...  
      (write && ftell(fid) >= maxsize) %已经没有空间保存样本了  
     continue;  
   end  
     
   if latent %训练时使用，检测时跳过  
     skip = true;  
     for c = 1:model.numcomponents  
       root_area = (rsize{c}(1)*scale) * (rsize{c}(2)*scale);% rootfilter  
       box_area = (bbox(3)-bbox(1)+1) * (bbox(4)-bbox(2)+1); % bbox该class 所有 rootfilter 的交集即minsize  
       if (root_area/box_area) >= overlap && (box_area/root_area) >= overlap %这句话真纠结，a>=0.7b,b>=0.7a -> a>=0.7b>=0.49a  
         skip = false;  
       end  
     end  
     if skip  
       continue;  
     end  
   end  
       
   % -----------convolve feature maps with filters -----------  
   %rootmatch,partmatch ,得分图root的尺度总是part的一半，  
   %rootmatch尺寸是partmatch的一半  
   featr = padarray(feat{level}, [pady padx 0], 0);  % 上下各补充 pady 行0，左右各补充padx行 0  
   %C = fconv(A, cell of B, start, end);  
   rootmatch = fconv(featr, rootfilters, 1, length(rootfilters));  
   if length(partfilters) > 0  
     featp = padarray(feat{level-interval}, [2*pady 2*padx 0], 0);  
     partmatch = fconv(featp, partfilters, 1, length(partfilters));  
   end  
   %-------------------逐component检测-----------------------------------  
   % 参见论文 Fig 4  
   % 最终得到  综合得分图   score  
   for c = 1:model.numcomponents  
     % root score + offset  
     score = rootmatch{ridx{c}} + model.offsets{oidx{c}}.w;    
     % add in parts  
     for j = 1:numparts{c}  
       def = model.defs{didx{c,j}}.w;  
       anchor = model.defs{didx{c,j}}.anchor;  
       % the anchor position is shifted to account for misalignment  
       % between features at different resolutions  
       ax{c,j} = anchor(1) + 1; %  
       ay{c,j} = anchor(2) + 1;  
       match = partmatch{pidx{c,j}};  
       [M, Ix{c,j}, Iy{c,j}] = dt(-match, def(1), def(2), def(3), def(4)); % dx,dy,dx^2,dy^2的偏移惩罚系数  
       % M part的综合匹配得分图，与part尺寸一致。Ix{c,j}, Iy{c,j} 即part实际的最佳位置（相对于root）  
       % 参见论文公式 9  
       score = score - M(ay{c,j}:2:ay{c,j}+2*(size(score,1)-1), ...  
                         ax{c,j}:2:ax{c,j}+2*(size(score,2)-1));  
     end  
       
     %-------阈值淘汰------------------------  
     if ~latent  
       % get all good matches  
       % ---thresh  在 分类时为0，在 找 hard exmaple 时是 -1.05--  
       I = find(score > thresh);  %返回的是从上到下从左到右的索引  
       [Y, X] = ind2sub(size(score), I);  %还原为 行，列坐标        
       tmp = zeros(length(I), 4*(1+numparts{c})+2);  %一个目标的root，part，score信息，见程序开头说明  
       for i = 1:length(I)  
         x = X(i);  
         y = Y(i);  
         [x1, y1, x2, y2] = rootbox(x, y, scale, padx, pady, rsize{c});  
         b = [x1 y1 x2 y2];  
         if write  
           rblocklabel = model.rootfilters{ridx{c}}.blocklabel;  
           oblocklabel = model.offsets{oidx{c}}.blocklabel;        
           f = featr(y:y+rsize{c}(1)-1, x:x+rsize{c}(2)-1, :);  
           xc = round(x + rsize{c}(2)/2 - padx); %   
           yc = round(y + rsize{c}(1)/2 - pady);  
           ex = [];  
           ex.header = [label; id; level; xc; yc; ...  
                        model.components{c}.numblocks; ...  
                        model.components{c}.dim];  
           ex.offset.bl = oblocklabel;  
           ex.offset.w = 1;  
           ex.root.bl = rblocklabel;  
           width1 = ceil(rsize{c}(2)/2);  
           width2 = floor(rsize{c}(2)/2);  
           f(:,1:width2,:) = f(:,1:width2,:) + flipfeat(f(:,width1+1:end,:));  
           ex.root.w = f(:,1:width1,:);  
           ex.part = [];  
         end  
         for j = 1:numparts{c}  
           [probex, probey, px, py, px1, py1, px2, py2] = ...  
               partbox(x, y, ax{c,j}, ay{c,j}, scale, padx, pady, ...  
                       psize{c,j}, Ix{c,j}, Iy{c,j});  
           b = [b px1 py1 px2 py2];  
           if write  
             if model.partfilters{pidx{c,j}}.fake  
               continue;  
             end  
             pblocklabel = model.partfilters{pidx{c,j}}.blocklabel;  
             dblocklabel = model.defs{didx{c,j}}.blocklabel;  
             f = featp(py:py+psize{c,j}(1)-1,px:px+psize{c,j}(2)-1,:);  
             def = -[(probex-px)^2; probex-px; (probey-py)^2; probey-py];  
             partner = model.partfilters{pidx{c,j}}.partner;  
             if partner > 0  
               k = rpidx{partner}(2);  
               [kprobex, kprobey, kpx, kpy, kpx1, kpy1, kpx2, kpy2] = ...  
                   partbox(x, y, ax{c,k}, ay{c,k}, scale, padx, pady, ...  
                           psize{c,k}, Ix{c,k}, Iy{c,k});  
               kf = featp(kpy:kpy+psize{c,k}(1)-1,kpx:kpx+psize{c,k}(2)-1,:);  
               % flip linear term in horizontal deformation model  
               kdef = -[(kprobex-kpx)^2; kpx-kprobex; ...  
                        (kprobey-kpy)^2; kprobey-kpy];  
               f = f + flipfeat(kf);  
               def = def + kdef;  
             else  
               width1 = ceil(psize{c,j}(2)/2);  
               width2 = floor(psize{c,j}(2)/2);  
               f(:,1:width2,:) = f(:,1:width2,:) + flipfeat(f(:,width1+1:end,:));  
               f = f(:,1:width1,:);  
             end  
             ex.part(j).bl = pblocklabel;  
             ex.part(j).w = f;  
             ex.def(j).bl = dblocklabel;  
             ex.def(j).w = def;  
           end  
         end  
         if write  
           exwrite(fid, ex); % 写入负样本  
         end  
         tmp(i,:) = [b c score(I(i))];  
       end  
       boxes = [boxes; tmp];  
     end  
   
     if latent  
       % get best match  
       for x = 1:size(score,2)  
         for y = 1:size(score,1)  
           if score(y, x) > best    
             % 以该(y，x)为left-top点的rootfilter的范围在原图像中的位置  
             [x1, y1, x2, y2] = rootbox(x, y, scale, padx, pady, rsize{c});  
             % intesection with bbox  
             xx1 = max(x1, bbox(1));  
             yy1 = max(y1, bbox(2));  
             xx2 = min(x2, bbox(3));  
             yy2 = min(y2, bbox(4));  
             w = (xx2-xx1+1);  
             h = (yy2-yy1+1);  
             if w > 0 && h > 0  
               % check overlap with bbox  
               inter = w*h;  
               a = (x2-x1+1) * (y2-y1+1); % rootfilter 的面积  
               b = (bbox(3)-bbox(1)+1) * (bbox(4)-bbox(2)+1); % bbox的面积  
               % 计算很很独特，如果只是 inter / b 那么 如果a很大，只是一部分与 bounding box重合,那就不可靠了，人再怎么标注错误，也不会这么大  
               % 所以，a越大，要求的重合率越高才好，所以分母+a,是个不错的选择，但是这样减小的太多了，所以减去 inter  
               o = inter / (a+b-inter);  
               if (o >= overlap)  
                 %  
                 best = score(y, x);  
                 boxes = [x1 y1 x2 y2];  
                 % 这一部分一直被覆盖，最后保留的是 best样本  
                 if write                    
                   f = featr(y:y+rsize{c}(1)-1, x:x+rsize{c}(2)-1, :);  
                   rblocklabel = model.rootfilters{ridx{c}}.blocklabel;  
                   oblocklabel = model.offsets{oidx{c}}.blocklabel;        
                   xc = round(x + rsize{c}(2)/2 - padx);  
                   yc = round(y + rsize{c}(1)/2 - pady);            
                   ex = [];  
                   % label; id; level; xc; yc,正样本的重要信息！  
                   % xc,yc,居然是相对于剪切后的图片  
                   ex.header = [label; id; level; xc; yc; ...  
                                model.components{c}.numblocks; ...  
                                model.components{c}.dim];  
                   ex.offset.bl = oblocklabel;  
                   ex.offset.w = 1;  
                   ex.root.bl = rblocklabel;  
                   width1 = ceil(rsize{c}(2)/2);  
                   width2 = floor(rsize{c}(2)/2);  
                   f(:,1:width2,:) = f(:,1:width2,:) + flipfeat(f(:,width1+1:end,:));  
                   ex.root.w = f(:,1:width1,:); %样本特征  
                   ex.part = [];  
                 end  
                 for j = 1:numparts{c}  
                   %probex，probey综合得分最高的位置，相对于featp  
                   %px1，py1，px2，py2 转化成相对于featr  
                   [probex, probey, px, py, px1, py1, px2, py2] = ...  
                       partbox(x, y, ax{c,j}, ay{c,j}, scale, ...  
                               padx, pady, psize{c,j}, Ix{c,j}, Iy{c,j});  
                   boxes = [boxes px1 py1 px2 py2];  
                   if write  
                     if model.partfilters{pidx{c,j}}.fake  
                       continue;  
                     end  
                     p = featp(py:py+psize{c,j}(1)-1, ...  
                               px:px+psize{c,j}(2)-1, :);  
                     def = -[(probex-px)^2; probex-px; (probey-py)^2; probey-py];  
                     pblocklabel = model.partfilters{pidx{c,j}}.blocklabel;  
                     dblocklabel = model.defs{didx{c,j}}.blocklabel;  
                     partner = model.partfilters{pidx{c,j}}.partner;  
                     if partner > 0  
                       k = rpidx{partner}(2);  
                       [kprobex, kprobey, kpx, kpy, kpx1, kpy1, kpx2, kpy2] = ...  
                           partbox(x, y, ax{c,k}, ay{c,k}, scale, padx, pady, ...  
                                   psize{c,k}, Ix{c,k}, Iy{c,k});  
                       kp = featp(kpy:kpy+psize{c,k}(1)-1, ...  
                                  kpx:kpx+psize{c,k}(2)-1, :);  
                       % flip linear term in horizontal deformation model  
                       kdef = -[(kprobex-kpx)^2; kpx-kprobex; ...  
                                (kprobey-kpy)^2; kprobey-kpy];  
                       p = p + flipfeat(kp);  
                       def = def + kdef;  
                     else  
                       width1 = ceil(psize{c,j}(2)/2);  
                       width2 = floor(psize{c,j}(2)/2);  
                       p(:,1:width2,:) = p(:,1:width2,:) + ...  
                           flipfeat(p(:,width1+1:end,:));  
                       p = p(:,1:width1,:);  
                     end  
                     ex.part(j).bl = pblocklabel;  
                     ex.part(j).w = p;  
                     ex.def(j).bl = dblocklabel;  
                     ex.def(j).w = def;  
                   end  
                 end  
                 boxes = [boxes c best];  
               end  
             end  
           end  
         end  
       end  
     end  
   end  
 end  
   
 if latent && write && ~isempty(ex)  
   exwrite(fid, ex); %datfile  
 end  
   
 % The functions below compute a bounding box for a root or part   
 % template placed in the feature hierarchy.  
 %  
 % coordinates need to be transformed to take into account:  
 % 1. padding from convolution  
 % 2. scaling due to sbin & image subsampling  
 % 3. offset from feature computation      
 %  
   
 function [x1, y1, x2, y2] = rootbox(x, y, scale, padx, pady, rsize)  
 x1 = (x-padx)*scale+1;  %图像是先缩放（构造金字塔时）再打补丁  
 y1 = (y-pady)*scale+1;  
 x2 = x1 + rsize(2)*scale - 1; % 宽度也要缩放  
 y2 = y1 + rsize(1)*scale - 1;  
   
 function [probex, probey, px, py, px1, py1, px2, py2] = ...  
     partbox(x, y, ax, ay, scale, padx, pady, psize, Ix, Iy)  
 probex = (x-1)*2+ax; %最优位置  
 probey = (y-1)*2+ay;  
 px = double(Ix(probey, probex)); %综合得分最高的位置  
 py = double(Iy(probey, probex));  
 px1 = ((px-2)/2+1-padx)*scale+1; % pading是root的两倍  
 py1 = ((py-2)/2+1-pady)*scale+1;  
 px2 = px1 + psize(2)*scale/2 - 1;  
 py2 = py1 + psize(1)*scale/2 - 1;  
   
 % write an example to the data file  
 function exwrite(fid, ex)  
 fwrite(fid, ex.header, 'int32');  
 buf = [ex.offset.bl; ex.offset.w(:); ...  
        ex.root.bl; ex.root.w(:)];  
 fwrite(fid, buf, 'single');  
 for j = 1:length(ex.part)  
   if ~isempty(ex.part(j).w)  
     buf = [ex.part(j).bl; ex.part(j).w(:); ...  
            ex.def(j).bl; ex.def(j).w(:)];  
     fwrite(fid, buf, 'single');  
   end  
 end  

features.cc

[cpp]  view plain copy   
     
    
 #include <math.h>  
 #include "mex.h"  
   
 // small value, used to avoid division by zero  
 #define eps 0.0001  
   
 #define bzero(a, b) memset(a, 0, b)   
 int round(float a) { float tmp = a - (int)a; if( tmp >= 0.5 ) return (int)a + 1; else return (int)a; }  
 // unit vectors used to compute gradient orientation  
 // cos(20*i)  
 double uu[9] = {1.0000,   
         0.9397,   
         0.7660,   
         0.500,   
         0.1736,   
         -0.1736,   
         -0.5000,   
         -0.7660,   
         -0.9397};  
 //sin(20*i)  
 double vv[9] = {0.0000,   
         0.3420,   
         0.6428,   
         0.8660,   
         0.9848,   
         0.9848,   
         0.8660,   
         0.6428,   
         0.3420};  
   
 static inline double min(double x, double y) { return (x <= y ? x : y); }  
 static inline double max(double x, double y) { return (x <= y ? y : x); }  
   
 static inline int min(int x, int y) { return (x <= y ? x : y); }  
 static inline int max(int x, int y) { return (x <= y ? y : x); }  
   
 // main function:  
 // takes a double color image and a bin size   
 // returns HOG features  
 mxArray *process(const mxArray *mximage, const mxArray *mxsbin) {  
   double *im = (double *)mxGetPr(mximage);  
   const int *dims = mxGetDimensions(mximage);  
   if (mxGetNumberOfDimensions(mximage) != 3 ||  
       dims[2] != 3 ||  
       mxGetClassID(mximage) != mxDOUBLE_CLASS)  
     mexErrMsgTxt("Invalid input");  
   
   int sbin = (int)mxGetScalar(mxsbin);  
   
   // memory for caching orientation histograms & their norms  
   int blocks[2];  
   blocks[0] = (int)round((double)dims[0]/(double)sbin);//行  
   blocks[1] = (int)round((double)dims[1]/(double)sbin);//列  
   double *hist = (double *)mxCalloc(blocks[0]*blocks[1]*18, sizeof(double));//只需要计算18bin，9bin的推  
   double *norm = (double *)mxCalloc(blocks[0]*blocks[1], sizeof(double));  
   
   // memory for HOG features  
   int out[3];//size  
   out[0] = max(blocks[0]-2, 0);//减去2干嘛？？  
   out[1] = max(blocks[1]-2, 0);  
   out[2] = 27+4;  
   mxArray *mxfeat = mxCreateNumericArray(3, out, mxDOUBLE_CLASS, mxREAL);//特征,size=out   
   double *feat = (double *)mxGetPr(mxfeat);  
     
   int visible[2];  
   visible[0] = blocks[0]*sbin;  
   visible[1] = blocks[1]*sbin;  
   //先列再行  
   for (int x = 1; x < visible[1]-1; x++) {  
     for (int y = 1; y < visible[0]-1; y++) {  
       // first color channel  
       double *s = im + min(x, dims[1]-2)*dims[0] + min(y, dims[0]-2);//在im中的位置  
       double dy = *(s+1) - *(s-1);  
       double dx = *(s+dims[0]) - *(s-dims[0]); //坐标系是一样的，c和matlab的存储顺序不一样  
       double v = dx*dx + dy*dy;  
   
       // second color channel  
       s += dims[0]*dims[1];  
       double dy2 = *(s+1) - *(s-1);  
       double dx2 = *(s+dims[0]) - *(s-dims[0]);  
       double v2 = dx2*dx2 + dy2*dy2;  
   
       // third color channel  
       s += dims[0]*dims[1];  
       double dy3 = *(s+1) - *(s-1);  
       double dx3 = *(s+dims[0]) - *(s-dims[0]);  
       double v3 = dx3*dx3 + dy3*dy3;  
   
       // pick channel with strongest gradient，计算v  
       if (v2 > v) {  
         v = v2;  
         dx = dx2;  
         dy = dy2;  
           }   
           if (v3 > v) {  
         v = v3;  
         dx = dx3;  
         dy = dy3;  
       }  
   
       // snap to one of 18 orientations，就算角度best_o  
       double best_dot = 0;  
       int best_o = 0;  
       for (int o = 0; o < 9; o++) {  
         // (sinθ)^2+(cosθ)^2 =1  
         // max cosθ*dx+ sinθ*dy 对其求导，可得极大值 θ = arctan dy/dx  
         double dot = uu[o]*dx + vv[o]*dy;  
         if (dot > best_dot) {  
           best_dot = dot;  
           best_o = o;  
         } else if (-dot > best_dot) {  
           best_dot = -dot;  
           best_o = o+9;  
         }  
       }  
         
       // add to 4 histograms around pixel using linear interpolation  
       double xp = ((double)x+0.5)/(double)sbin - 0.5;  
       double yp = ((double)y+0.5)/(double)sbin - 0.5;  
       int ixp = (int)floor(xp);  
       int iyp = (int)floor(yp);  
       double vx0 = xp-ixp;  
       double vy0 = yp-iyp;  
       double vx1 = 1.0-vx0;  
       double vy1 = 1.0-vy0;  
       v = sqrt(v);  
     //左上角     
       if (ixp >= 0 && iyp >= 0) {  
         *(hist + ixp*blocks[0] + iyp + best_o*blocks[0]*blocks[1]) +=   
           vx1*vy1*v;  
       }  
       //右上角        
       if (ixp+1 < blocks[1] && iyp >= 0) {  
         *(hist + (ixp+1)*blocks[0] + iyp + best_o*blocks[0]*blocks[1]) +=   
           vx0*vy1*v;  
       }  
       //左下角  
       if (ixp >= 0 && iyp+1 < blocks[0]) {  
         *(hist + ixp*blocks[0] + (iyp+1) + best_o*blocks[0]*blocks[1]) +=   
           vx1*vy0*v;  
       }  
       //右下角  
       if (ixp+1 < blocks[1] && iyp+1 < blocks[0]) {  
         *(hist + (ixp+1)*blocks[0] + (iyp+1) + best_o*blocks[0]*blocks[1]) +=   
           vx0*vy0*v;  
       }  
     }  
   }  
   
   // compute energy in each block by summing over orientations  
   //计算每一个cell的 sum( ( v(oi)+v(oi+9) )^2 ),oi=0..8  
   for (int o = 0; o < 9; o++) {  
     double *src1 = hist + o*blocks[0]*blocks[1];  
     double *src2 = hist + (o+9)*blocks[0]*blocks[1];  
     double *dst = norm;  
     double *end = norm + blocks[1]*blocks[0];  
     while (dst < end) {  
       *(dst++) += (*src1 + *src2) * (*src1 + *src2);  
       src1++;  
       src2++;  
     }  
   }  
   
   // compute features  
   for (int x = 0; x < out[1]; x++) {  
     for (int y = 0; y < out[0]; y++) {  
       double *dst = feat + x*out[0] + y;        
       double *src, *p, n1, n2, n3, n4;  
   
       p = norm + (x+1)*blocks[0] + y+1;//右下角的constrain insensitive sum  
       n1 = 1.0 / sqrt(*p + *(p+1) + *(p+blocks[0]) + *(p+blocks[0]+1) + eps);  
       p = norm + (x+1)*blocks[0] + y;//右边  
       n2 = 1.0 / sqrt(*p + *(p+1) + *(p+blocks[0]) + *(p+blocks[0]+1) + eps);  
       p = norm + x*blocks[0] + y+1;//下边  
       n3 = 1.0 / sqrt(*p + *(p+1) + *(p+blocks[0]) + *(p+blocks[0]+1) + eps);  
       p = norm + x*blocks[0] + y;//自己        
       n4 = 1.0 / sqrt(*p + *(p+1) + *(p+blocks[0]) + *(p+blocks[0]+1) + eps);  
   
       double t1 = 0;  
       double t2 = 0;  
       double t3 = 0;  
       double t4 = 0;  
   
       // contrast-sensitive features  
       src = hist + (x+1)*blocks[0] + (y+1);  
       for (int o = 0; o < 18; o++) {  
         double h1 = min(*src * n1, 0.2);//截短  
         double h2 = min(*src * n2, 0.2);  
         double h3 = min(*src * n3, 0.2);  
         double h4 = min(*src * n4, 0.2);  
         *dst = 0.5 * (h1 + h2 + h3 + h4);//求和  
         t1 += h1;  
         t2 += h2;  
         t3 += h3;  
         t4 += h4;  
         dst += out[0]*out[1];//下一个bin  
         src += blocks[0]*blocks[1];  
       }  
   
       // contrast-insensitive features  
       src = hist + (x+1)*blocks[0] + (y+1);  
       for (int o = 0; o < 9; o++) {  
         double sum = *src + *(src + 9*blocks[0]*blocks[1]);  
         double h1 = min(sum * n1, 0.2);  
         double h2 = min(sum * n2, 0.2);  
         double h3 = min(sum * n3, 0.2);  
         double h4 = min(sum * n4, 0.2);  
         *dst = 0.5 * (h1 + h2 + h3 + h4);  
         dst += out[0]*out[1];  
         src += blocks[0]*blocks[1];  
       }  
   
       // texture features  
       *dst = 0.2357 * t1;  
       dst += out[0]*out[1];  
       *dst = 0.2357 * t2;  
       dst += out[0]*out[1];  
       *dst = 0.2357 * t3;  
       dst += out[0]*out[1];  
       *dst = 0.2357 * t4;  
     }  
   }  
   
   mxFree(hist);  
   mxFree(norm);  
   return mxfeat;  
 }  
   
 // matlab entry point  
 // F = features(image, bin)  
 // image should be color with double values  
 void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) {   
   if (nrhs != 2)  
     mexErrMsgTxt("Wrong number of inputs");   
   if (nlhs != 1)  
     mexErrMsgTxt("Wrong number of outputs");  
   plhs[0] = process(prhs[0], prhs[1]);  
 }  

dt.cc

[cpp]  view plain copy   
     
    
 #include <math.h>  
 #include <sys/types.h>  
 #include "mex.h"  
   
 #define int32_t int  
 /* 
  * Generalized distance transforms. 
  * We use a simple nlog(n) divide and conquer algorithm instead of the 
  * theoretically faster linear method, for no particular reason except 
  * that this is a bit simpler and I wanted to test it out. 
  * 
  * The code is a bit convoluted because dt1d can operate either along 
  * a row or column of an array.   
  */  
   
 static inline int square(int x) { return x*x; }  
   
 // dt helper function  
 void dt_helper(double *src, double *dst, int *ptr, int step,   
            int s1, int s2, int d1, int d2, double a, double b) {  
  if (d2 >= d1) {  
    int d = (d1+d2) >> 1;  
    int s = s1;  
    for (int p = s1+1; p <= s2; p++)  
      if (src[s*step] + a*square(d-s) + b*(d-s) >   
      src[p*step] + a*square(d-p) + b*(d-p))  
     s = p;  
    dst[d*step] = src[s*step] + a*square(d-s) + b*(d-s);  
    ptr[d*step] = s;  
    dt_helper(src, dst, ptr, step, s1, s, d1, d-1, a, b);  
    dt_helper(src, dst, ptr, step, s, s2, d+1, d2, a, b);  
  }  
 }  
   
 // dt of 1d array  
 void dt1d(double *src, double *dst, int *ptr, int step, int n,   
       double a, double b) {  
   dt_helper(src, dst, ptr, step, 0, n-1, 0, n-1, a, b);  
 }  
   
 // matlab entry point  
 // [M, Ix, Iy] = dt(vals, ax, bx, ay, by)  
 void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) {   
   if (nrhs != 5)  
     mexErrMsgTxt("Wrong number of inputs");   
   if (nlhs != 3)  
     mexErrMsgTxt("Wrong number of outputs");  
   if (mxGetClassID(prhs[0]) != mxDOUBLE_CLASS)  
     mexErrMsgTxt("Invalid input");  
   
   const int *dims = mxGetDimensions(prhs[0]);  
   double *vals = (double *)mxGetPr(prhs[0]);  
   double ax = mxGetScalar(prhs[1]);  
   double bx = mxGetScalar(prhs[2]);  
   double ay = mxGetScalar(prhs[3]);  
   double by = mxGetScalar(prhs[4]);  
     
   mxArray *mxM = mxCreateNumericArray(2, dims, mxDOUBLE_CLASS, mxREAL);  
   mxArray *mxIx = mxCreateNumericArray(2, dims, mxINT32_CLASS, mxREAL);  
   mxArray *mxIy = mxCreateNumericArray(2, dims, mxINT32_CLASS, mxREAL);  
   double *M = (double *)mxGetPr(mxM);  
   int32_t *Ix = (int32_t *)mxGetPr(mxIx);  
   int32_t *Iy = (int32_t *)mxGetPr(mxIy);  
   
   double *tmpM = (double *)mxCalloc(dims[0]*dims[1], sizeof(double)); // part map  
   int32_t *tmpIx = (int32_t *)mxCalloc(dims[0]*dims[1], sizeof(int32_t));  
   int32_t *tmpIy = (int32_t *)mxCalloc(dims[0]*dims[1], sizeof(int32_t));  
   
   for (int x = 0; x < dims[1]; x++)  
     dt1d(vals+x*dims[0], tmpM+x*dims[0], tmpIy+x*dims[0], 1, dims[0], ay, by);  
   
   for (int y = 0; y < dims[0]; y++)  
     dt1d(tmpM+y, M+y, tmpIx+y, dims[0], dims[1], ax, bx);  
   
   // get argmins and adjust for matlab indexing from 1  
   for (int x = 0; x < dims[1]; x++) {  
     for (int y = 0; y < dims[0]; y++) {  
       int p = x*dims[0]+y;  
       Ix[p] = tmpIx[p]+1;  
       Iy[p] = tmpIy[tmpIx[p]*dims[0]+y]+1;  
     }  
   }  
   
   mxFree(tmpM);  
   mxFree(tmpIx);  
   mxFree(tmpIy);  
   plhs[0] = mxM;  
   plhs[1] = mxIx;  
   plhs[2] = mxIy;  
 }  

DPM(Defomable Parts Model) 源码分析-训练（三）

原文：http://blog.csdn.net/ttransposition/article/details/12954631

DPM(Defomable Parts Model)原理

首先调用格式：

example:
pascal('person', 2); % train and evaluate a 2 component person model

pascal_train.m

[cpp]  view plain copy   
     
    
 function model = pascal_train(cls, n) % n=2  
   
 % model = pascal_train(cls)  
 % Train a model using the PASCAL dataset.  
   
 globals;   
 %----------读取正负样本-----------------------  
 % pos.im,neg.im存储了图像路径，pos.x1..pos.y2为box,负样本无box  
 [pos, neg] = pascal_data(cls);  
   
 % 按照长宽比，分成等量的两部分? 即将 component label  固定，phase2时，该值为latent variable。  spos为索引  
 spos = split(pos, n);  
   
 % -----------phase 1 : train root filters using warped positives & random negatives-----------  
 try  
   load([cachedir cls '_random']);  
 catch  
 % -----------------------------phas 1--------------------------------  
 % 初始化 rootfilters  
   for i=1:n  
     models{i} = initmodel(spos{i});  
     %---------train-------------  
     % model.rootfilters{i}.w  
     % model.offsets{i}.w  
     models{i} = train(cls, models{i}, spos{i}, neg, 1, 1, 1, 1, 2^28);  
   
   end  
   save([cachedir cls '_random'], 'models');  
 end  
   
 % -----------------phase2-------------------------------------------  
 % :merge models and train using latent detections & hard negatives  
 try   
   load([cachedir cls '_hard']);  
 catch  
   model = mergemodels(models);  
   model = train(cls, model, pos, neg(1:200), 0, 0, 2, 2, 2^28, true, 0.7);  
   save([cachedir cls '_hard'], 'model');  
 end  
 %----------------phase 3----------------------------------------------  
 % add parts and update models using latent detections & hard negatives.  
 try   
   load([cachedir cls '_parts']);  
 catch  
   for i=1:n  
     model = addparts(model, i, 6);  
   end   
   % use more data mining iterations in the beginning  
   model = train(cls, model, pos, neg(1:200), 0, 0, 1, 4, 2^30, true, 0.7);  
   model = train(cls, model, pos, neg(1:200), 0, 0, 6, 2, 2^30, true, 0.7, true);  
   save([cachedir cls '_parts'], 'model');  
 end  
   
 % update models using full set of negatives.  
 try   
   load([cachedir cls '_mine']);  
 catch  
   model = train(cls, model, pos, neg, 0, 0, 1, 3, 2^30, true, 0.7, true, ...  
                 0.003*model.numcomponents, 2);  
   save([cachedir cls '_mine'], 'model');  
 end  
   
 % train bounding box prediction  
 try  
   load([cachedir cls '_final']);  
 catch  
  % 论文中说用最小二乘，怎么直接相除了，都不考虑矩阵的奇异性  
   model = trainbox(cls, model, pos, 0.7);  
   save([cachedir cls '_final'], 'model');  
 end  

initmodel.m

[cpp]  view plain copy   
     
    
 function model = initmodel(pos, sbin, size)  
   
 % model = initmodel(pos, sbin, size)  
 % Initialize model structure.  
 %  
 % If not supplied the dimensions of the model template are computed  
 % from statistics in the postive examples.  
 %   
 % This should be documented! :-)  
 % model.sbin         8  
 % model.interval     10  
 % model.numblocks     phase 1 ：单独训练rootfilter时为2，offset,rootfilter；phase 2，为 4   
 % model.numcomponents  1  
 % model.blocksizes     （1）=1，（2）= root.h*root.w/2*31  
 % model.regmult        0,1  
 % model.learnmult      20,1  
 % model.maxsize        root 的size   
 % model.minsize  
 % model.rootfilters{i}  
 %   .size               以sbin为单位，尺寸为综合各样本的h/w，area计算出来的  
 %   .w  
 %   .blocklabel        blocklabel是为编号，offset（2）,rootfilter（2）,partfilter（12 or less）,def （12 same as part）虽然意义不同但是放在一起统一编号  
 % model.partfilters{i}  
 %   .w  
 %   .blocklabel  
 % model.defs{i}  
 %   .anchor  
 %   .w  
 %   .blocklabel  
 % model.offsets{i}  
 %   .w               0  
 %   .blocklabel       1  
 % model.components{i}  
 %   .rootindex    1  
 %   .parts{j}  
 %     .partindex  
 %     .defindex  
 %   .offsetindex    1  
 %   .dim             2 + model.blocksizes(1) + model.blocksizes(2)  
 %   .numblocks       2  
   
 % pick mode of aspect ratios  
 h = [pos(:).y2]' - [pos(:).y1]' + 1;  
 w = [pos(:).x2]' - [pos(:).x1]' + 1;  
 xx = -2:.02:2;  
 filter = exp(-[-100:100].^2/400); % e^-25,e^25  
 aspects = hist(log(h./w), xx); %  
 aspects = convn(aspects, filter, 'same');  
 [peak, I] = max(aspects);  
 aspect = exp(xx(I)); %滤波后最大的h/w，作为最典型的h/w  
   
 % pick 20 percentile area  
 areas = sort(h.*w);  
 area = areas(floor(length(areas) * 0.2)); % 比它大的，可以缩放，比该尺寸小的呢？  
 area = max(min(area, 5000), 3000); %限制在 3000-5000  
   
 % pick dimensions  
 w = sqrt(area/aspect);  
 h = w*aspect;  
   
 % size of HOG features  
 if nargin < 4  
   model.sbin = 8;  
 else  
   model.sbin = sbin;  
 end  
   
 % size of root filter  
 if nargin < 5  
   model.rootfilters{1}.size = [round(h/model.sbin) round(w/model.sbin)];  
 else  
   model.rootfilters{1}.size = size;  
 end  
   
 % set up offset   
 model.offsets{1}.w = 0;  
 model.offsets{1}.blocklabel = 1;  
 model.blocksizes(1) = 1;  
 model.regmult(1) = 0;  
 model.learnmult(1) = 20;  
 model.lowerbounds{1} = -100;  
   
 % set up root filter  
 model.rootfilters{1}.w = zeros([model.rootfilters{1}.size 31]);  
 height = model.rootfilters{1}.size(1);  
 % root filter is symmetricf  
 width = ceil(model.rootfilters{1}.size(2)/2);  % ？？？ /2  
 model.rootfilters{1}.blocklabel = 2;  
 model.blocksizes(2) = width * height * 31;  
 model.regmult(2) = 1;  
 model.learnmult(2) = 1;  
 model.lowerbounds{2} = -100*ones(model.blocksizes(2),1);  
   
 % set up one component model  
 model.components{1}.rootindex = 1;  
 model.components{1}.offsetindex = 1;  
 model.components{1}.parts = {};  
 model.components{1}.dim = 2 + model.blocksizes(1) + model.blocksizes(2);  
 model.components{1}.numblocks = 2;  
   
 % initialize the rest of the model structure  
 model.interval = 10;  
 model.numcomponents = 1;  
 model.numblocks = 2;  
 model.partfilters = {};  
 model.defs = {};  
 model.maxsize = model.rootfilters{1}.size;  
 model.minsize = model.rootfilters{1}.size;  

learn.cc

[cpp]  view plain copy   
     
    
 #include <stdio.h>  
 #include <stdlib.h>  
 #include <string.h>  
 #include <math.h>  
 #include <sys/time.h>  
 #include <errno.h>  
   
 /* 
  * Optimize LSVM objective function via gradient descent. 
  * 
  * We use an adaptive cache mechanism.  After a negative example 
  * scores beyond the margin multiple times it is removed from the 
  * training set for a fixed number of iterations. 
  */  
   
 // Data File Format  
 // EXAMPLE*  
 //   
 // EXAMPLE:  
 //  long label          ints  
 //  blocks              int  
 //  dim                 int  
 //  DATA{blocks}  
 //  
 // DATA:  
 //  block label         float  
 //  block data          floats  
 //  
 // Internal Binary Format  
 //  len           int (byte length of EXAMPLE)  
 //  EXAMPLE       <see above>  
 //  unique flag   byte  
   
 // number of iterations  
 #define ITER 5000000  
   
 // small cache parameters  
 #define INCACHE 3  
 #define WAIT 10  
   
 // error checking  
 #define check(e) \  
 (e ? (void)0 : (printf("%s:%u error: %s\n%s\n", __FILE__, __LINE__, #e, strerror(errno)), exit(1)))  
   
 // number of non-zero blocks in example ex  
 #define NUM_NONZERO(ex) (((int *)ex)[labelsize+1])  
   
 // float pointer to data segment of example ex  
 #define EX_DATA(ex) ((float *)(ex + sizeof(int)*(labelsize+3)))  
   
 // class label (+1 or -1) for the example  
 #define LABEL(ex) (((int *)ex)[1])  
   
 // block label (converted to 0-based index)  
 #define BLOCK_IDX(data) (((int)data[0])-1)  
   
 int labelsize;  
 int dim;  
   
 // comparison function for sorting examples   
 // 参见 http://blog.sina.com.cn/s/blog_5155e8d401009145.html  
 int comp(const void *a, const void *b) {  
   // sort by extended label first, and whole example second...  
     
   //逐字节比较的，当buf1<buf2时，返回值<0，当buf1=buf2时，返回值=0，当buf1>buf2时，返回值>0  
   // 先比较这五个量 [label id level x y]，也就是说按照 样本类别->id->level->x->y排序样本  
   int c = memcmp(*((char **)a) + sizeof(int),   
          *((char **)b) + sizeof(int),   
          labelsize*sizeof(int));// 5  
   if (c) //label 不相等  
     return c;  
     
   // labels are the same ，怎么可能会一样呢 id在正负样本集内从1开始是递增的啊  phase 2 阶段同一张图片产生的样本，id都是一样的  
   int alen = **((int **)a);  
   int blen = **((int **)b);  
   if (alen == blen) //长度一样  
     return memcmp(*((char **)a) + sizeof(int),   
           *((char **)b) + sizeof(int),   
           alen); //真霸气，所有字节都比较……  
   return ((alen < blen) ? -1 : 1);//按长度排序  
 }  
   
 // a collapsed example is a sequence of examples  
 struct collapsed {  
   char **seq;  
   int num;  
 };  
   
 // set of collapsed examples  
 struct data {  
   collapsed *x;  
   int num;  
   int numblocks;  
   int *blocksizes;  
   float *regmult;  
   float *learnmult;  
 };  
   
 // seed the random number generator with the current time  
 void seed_time() {  
  struct timeval tp;  
  check(gettimeofday(&tp, NULL) == 0);  
  srand48((long)tp.tv_usec);  
 }  
   
 static inline double min(double x, double y) { return (x <= y ? x : y); }  
 static inline double max(double x, double y) { return (x <= y ? y : x); }  
   
 // gradient descent  
 //---------------参照论文公式17 后的步骤---------------------------------------  
 void gd(double C, double J, data X, double **w, double **lb) {  
 //  C=0.0002, J=1, X, w==0, lb==-100);  
 //      
   int num = X.num; //组数  
     
   // state for random permutations  
   int *perm = (int *)malloc(sizeof(int)*X.num);  
   check(perm != NULL);  
   
   // state for small cache  
   int *W = (int *)malloc(sizeof(int)*num);  
   check(W != NULL);  
   for (int j = 0; j < num; j++)  
     W[j] = 0;  
   
   int t = 0;  
   while (t < ITER) {  // 5000000 ，霸气……  
     // pick random permutation  
     for (int i = 0; i < num; i++) //组数  
       perm[i] = i;  
     //-------打乱顺序-----  
     // 论文中是随机选择一个样本，这里是随机排好序，再顺序取。  
     // 类似于随机取，但是这里能保证取到全部样本，避免单个样本重复被抽到，重复作用  
     for (int swapi = 0; swapi < num; swapi++) {  
       int swapj = (int)(drand48()*(num-swapi)) + swapi; //drand48 产生 0-1之间的均匀分布  
       int tmp = perm[swapi];  
       perm[swapi] = perm[swapj];  
       perm[swapj] = tmp;  
     }  
   
     // count number of examples in the small cache  
     int cnum = 0; //下面的循环部分的实际循环次数  
     for (int i = 0; i < num; i++) {  
       if (W[i] <= INCACHE) // 3  
         cnum++;  
     }  
     //-------------------------------------------------------  
     for (int swapi = 0; swapi < num; swapi++) {  
       // select example  
       int i = perm[swapi];  
       collapsed x = X.x[i];  
   
       // skip if example is not in small cache  
       //负样本分对一次+1，分错一次清为0  
       //连续三次都分对了，那么这个样本很有可能是 easy 样本  
       //直接让他罚停四次迭代  
       if (W[i] > INCACHE) { //3  
             W[i]--;  
             continue;  
       }  
   
       // learning rate  
       double T = t + 1000.0; //学习率，直接1/t太大了  
       double rateX = cnum * C / T;  
       double rateR = 1.0 / T;  
   
       if (t % 10000 == 0) {  
         printf(".");  
         fflush(stdout); //清除文件缓冲区，文件以写方式打开时将缓冲区内容写入文件  
       }  
       t++;  
         
       // compute max over latent placements  
       //  -----step 3----  
       int M = -1;  
       double V = 0;  
       // 组内循环，选择 Zi=argmax β*f 即文中的第3部  
       // 训练rootfiter时，x.num=1,因为随机产生的负样本其id不同  
       for (int m = 0; m < x.num; m++) {   
         double val = 0;  
         char *ptr = x.seq[m];  
         float *data = EX_DATA(ptr); //特征数据的地址 第9个数据开始，  
         //后面跟着是 block1 label | block2 data|block2 lable | block2 data    
         //                 1      |       1    |     2       |  h*w/2*31个float  
         int blocks = NUM_NONZERO(ptr); // phase 1，phase 2 : 2 个,offset,rootfilter  
         for (int j = 0; j < blocks; j++) {  
           int b = BLOCK_IDX(data); //   
           data++;  
           for (int k = 0; k < X.blocksizes[b]; k++)//（1）=1，（2）= root.h*root.w/2*31  
             val += w[b][k] * data[k]; //第一次循环是0  
           data += X.blocksizes[b];  
         }  
         if (M < 0 || val > V) {  
           M = m;  
           V = val;  
         }  
       }  
         
       // update model  
       //-----step.4 也算了step.5 的一半 ---------------  
       // 梯度下降，减小 w  
       for (int j = 0; j < X.numblocks; j++) {// 2  
         double mult = rateR * X.regmult[j] * X.learnmult[j]; // 0,1  20,1,1/T，对于block2,学习率at就是 1/t,block 1 为0  
         for (int k = 0; k < X.blocksizes[j]; k++) {  
           w[j][k] -= mult * w[j][k]; //不管是分对了，还是分错了，都要减掉 at*β,见公式17下的4,5   
         }  
       }  
       char *ptr = x.seq[M];  
       int label = LABEL(ptr);  
       //----step.5----------分错了，往梯度的负方向移动  
       if (label * V < 1.0)   
       {  
         W[i] = 0;  
         float *data = EX_DATA(ptr);  
         int blocks = NUM_NONZERO(ptr);  
         for (int j = 0; j < blocks; j++) {  
             int b = BLOCK_IDX(data);  
             //  yi*cnum * C / T*1,见论文中 公式16,17  
             double mult = (label > 0 ? J : -1) * rateX * X.learnmult[b];         
             data++;  
             for (int k = 0; k < X.blocksizes[b]; k++)  
                 w[b][k] += mult * data[k];  
             data += X.blocksizes[b];  
         }  
       } else if (label == -1)   
       {  
             if (W[i] == INCACHE) //3  
                 W[i] = WAIT; //10  
             else  
                 W[i]++;  
       }  
     }  
   
     // apply lowerbounds  
     for (int j = 0; j < X.numblocks; j++) {  
       for (int k = 0; k < X.blocksizes[j]; k++) {  
         w[j][k] = max(w[j][k], lb[j][k]);  
       }  
     }  
   
   }  
   
   free(perm);  
   free(W);  
 }  
   
 // score examples  
 double *score(data X, char **examples, int num, double **w) {  
   double *s = (double *)malloc(sizeof(double)*num);  
   check(s != NULL);  
   for (int i = 0; i < num; i++) {  
     s[i] = 0.0;  
     float *data = EX_DATA(examples[i]);  
     int blocks = NUM_NONZERO(examples[i]);  
     for (int j = 0; j < blocks; j++) {  
       int b = BLOCK_IDX(data);  
       data++;  
       for (int k = 0; k < X.blocksizes[b]; k++)  
         s[i] += w[b][k] * data[k];  
       data += X.blocksizes[b];  
     }  
   }  
   return s;    
 }  
   
 // merge examples with identical labels  
 void collapse(data *X, char **examples, int num) {  
 //&X, sorted, num_unique  
   collapsed *x = (collapsed *)malloc(sizeof(collapsed)*num);  
   check(x != NULL);  
   int i = 0;  
   x[0].seq = examples;  
   x[0].num = 1;  
   for (int j = 1; j < num; j++) {  
     if (!memcmp(x[i].seq[0]+sizeof(int), examples[j]+sizeof(int),   
         labelsize*sizeof(int))) {  
       x[i].num++; //如果label 五个量相同  
     } else {  
       i++;  
       x[i].seq = &(examples[j]);  
       x[i].num = 1;  
     }  
   }  
   X->x = x;  
   X->num = i+1;    
 }  
   
 //调用参数 C=0.0002, J=1, hdrfile, datfile, modfile, inffile, lobfile  
 int main(int argc, char **argv) {    
   seed_time();  
   int count;  
   data X;  
   
   // command line arguments  
   check(argc == 8);  
   double C = atof(argv[1]);  
   double J = atof(argv[2]);  
   char *hdrfile = argv[3];  
   char *datfile = argv[4];  
   char *modfile = argv[5];  
   char *inffile = argv[6];  
   char *lobfile = argv[7];  
   
   // read header file  
   FILE *f = fopen(hdrfile, "rb");  
   check(f != NULL);  
   int header[3];  
   count = fread(header, sizeof(int), 3, f);  
   check(count == 3);  
   int num = header[0]; //正负样本总数  
   labelsize = header[1]; // labelsize = 5;  [label id level x y]  
   X.numblocks = header[2]; // 2  
   X.blocksizes = (int *)malloc(X.numblocks*sizeof(int)); //（1）=1，（2）= root.h*root.w/2*31  
   count = fread(X.blocksizes, sizeof(int), X.numblocks, f);  
   check(count == X.numblocks);  
   X.regmult = (float *)malloc(sizeof(float)*X.numblocks); //0 ，1  
   check(X.regmult != NULL);  
   count = fread(X.regmult, sizeof(float), X.numblocks, f);  
   check(count == X.numblocks);  
   X.learnmult = (float *)malloc(sizeof(float)*X.numblocks);//20， 1  
   check(X.learnmult != NULL);  
   count = fread(X.learnmult, sizeof(float), X.numblocks, f);  
   check(count == X.numblocks);  
   check(num != 0);  
   fclose(f);  
   printf("%d examples with label size %d and %d blocks\n",  
      num, labelsize, X.numblocks);  
   printf("block size, regularization multiplier, learning rate multiplier\n");  
   dim = 0;  
   for (int i = 0; i < X.numblocks; i++) {  
     dim += X.blocksizes[i];  
     printf("%d, %.2f, %.2f\n", X.blocksizes[i], X.regmult[i], X.learnmult[i]);  
   }  
   
   // ---------------从 datfile 读取  正负 examples----------------  
   // examples [i] 存储了第i个样本的信息 长度为 1 int + 7 int +dim 个float + 1 byte  
   // 1 int      legth 样本包括信息头在内的总字节长度  
   // 7 int      [1/-1 id 0 0 0 2 dim] ,id为样本编号，[label id level centry_x centry_y]，2是block个数  
   // dim float  feature,dim=2+1+root.h*root.w/2*31,意义如下  
   //         block1 label | block2 data|block2 lable | block2 data  
   //               1      |       1    |     2       |  h*w/2*31个float  
   // 1 byte     unique=0  
   f = fopen(datfile, "rb");  
   check(f != NULL);  
   printf("Reading examples\n");  
     
   //+,-example数据  
   char **examples = (char **)malloc(num*sizeof(char *));   
     
   check(examples != NULL);  
     for (int i = 0; i < num; i++) {  
     // we use an extra byte in the end of each example to mark unique  
     // we use an extra int at the start of each example to store the   
     // example's byte length (excluding unique flag and this int)  
     //[legth label id level x y  unique] unique=0  
     int buf[labelsize+2];   
     //写入时的值为[1/-1 i 0 0 0 2 dim]   
     count = fread(buf, sizeof(int), labelsize+2, f);  
     check(count == labelsize+2);  
     // byte length of an example's data segment  
       
     //---前面七个是头，后面dim个float是样本特征数据，dim=2+1+root.h*root.w/2*31  
     int len = sizeof(int)*(labelsize+2) + sizeof(float)*buf[labelsize+1];     
     // memory for data, an initial integer, and a final byte  
     examples[i] = (char *)malloc(sizeof(int)+len+1);  
       
     check(examples[i] != NULL);  
     // set data segment's byte length  
     ((int *)examples[i])[0] = len;  
     // set the unique flag to zero  
     examples[i][sizeof(int)+len] = 0;  
     // copy label data into example  
     for (int j = 0; j < labelsize+2; j++)  
       ((int *)examples[i])[j+1] = buf[j];  
     // read the rest of the data segment into the example  
     count = fread(examples[i]+sizeof(int)*(labelsize+3), 1,   
           len-sizeof(int)*(labelsize+2), f);  
     check(count == len-sizeof(int)*(labelsize+2));  
   }  
   fclose(f);  
   printf("done\n");  
   
   // sort  
   printf("Sorting examples\n");  
   char **sorted = (char **)malloc(num*sizeof(char *));  
   check(sorted != NULL);  
   memcpy(sorted, examples, num*sizeof(char *));  
     
   //qsort 库函数，真正的比较函数为 comp  
   //从小到大，快速排序  
   //依次按照 样本类别->id->level->cx->cy  排序样本  
   //如果前面五个量都一样……  
   //1.等长度，比较所有字节；  
   //2.谁长谁小，长度不同是因为不同的component的 尺寸不一致   
     
   qsort(sorted, num, sizeof(char *), comp);   
   printf("done\n");  
   
   // find unique examples  
   // 唯一的样本，unique flag=1,  
   // 相同的样本第一个样本的unique flag为1，其余为0 ，有的样本的位置被，unique替代了，但是并没有完全删除掉  
   int i = 0;  
   int len = *((int *)sorted[0]); //负样本的第一个  
   sorted[0][sizeof(int)+len] = 1; // unique flag 置 1  
   for (int j = 1; j < num; j++) {  
     int alen = *((int *)sorted[i]);  
     int blen = *((int *)sorted[j]);  
     if (alen != blen || memcmp(sorted[i] + sizeof(int), sorted[j] + sizeof(int), alen)) //component不同 || 不同样本  
     {  
       i++;  
       sorted[i] = sorted[j];  
       sorted[i][sizeof(int)+blen] = 1; //标记为 unique  
     }  
   }  
   int num_unique = i+1;  
   printf("%d unique examples\n", num_unique);  
   
   // -------------------collapse examples----------------  
   // 前面是找完全不一样的样本，这里是分组  
   // label 的五个量 [label id level centry_x centry_y] 相同的分为一组，在detect时，写入了datfile   
   // 负样本的 cx,cy都是相对于整张图片的，正样本是相对于剪切后的图像  
   // 前面五个全相同，  
   // 对于phase1 不可能，因为正负样本的id都不相同  
   // 对于phase2 正样本只保留了最有可能是正样本的样本，只有一种情况,  
   // rootfilter1,rootfilter2在同一张图片(id相同)，检测出来的 Hard负样本 的cx,cy相同，因此一组最多应该只能出现2个 （待验证）  
   // 原因是此时的latent variable 为（cx,cy,component），上述情况相下，我们只能保留component1或者component2  
   // 后续训练时，这两个量是连续使用的，为什么呢？？  
   // collapse.seq(char **) 记录了每一组的第一个样本  
   // collapse.num 每组的个数  
   // X.num 组数  
   // X.x=&collapse[0]，也就是第一个 collapse的地址  
   collapse(&X, sorted, num_unique);  
   printf("%d collapsed examples\n", X.num);  
   
   // initial model  
   // 读modfile文件，得到w的初始值。phase 1 初始化为全 0，phase 2 为上一次训练的结果……  
   double **w = (double **)malloc(sizeof(double *)*X.numblocks);//2  
   check(w != NULL);  
   f = fopen(modfile, "rb");  
   for (int i = 0; i < X.numblocks; i++) {  
     w[i] = (double *)malloc(sizeof(double)*X.blocksizes[i]); //（1）=1，（2）= root.h*root.w/2*31  
     check(w[i] != NULL);  
     count = fread(w[i], sizeof(double), X.blocksizes[i], f);  
     check(count == X.blocksizes[i]);  
   }  
   fclose(f);  
   
   // lower bounds  
   // 读lobfile文件，初始化为全 滤波器参数下线-100 ……  
   double **lb = (double **)malloc(sizeof(double *)*X.numblocks);  
   check(lb != NULL);  
   f = fopen(lobfile, "rb");  
   for (int i = 0; i < X.numblocks; i++) {  
     lb[i] = (double *)malloc(sizeof(double)*X.blocksizes[i]);  
     check(lb[i] != NULL);  
     count = fread(lb[i], sizeof(double), X.blocksizes[i], f);  
     check(count == X.blocksizes[i]);  
   }  
   fclose(f);  
     
   
   printf("Training");  
   //-------------------------------- train -------------------------------  
   //-----梯度下降发训练参数 w，参见论文 公式17 后面的步骤  
   gd(C, J, X, w, lb);  
   printf("done\n");  
   
   // save model  
   printf("Saving model\n");  
   f = fopen(modfile, "wb");  
   check(f != NULL);  
   //   存储 block1,block2的训练结果，w  
   for (int i = 0; i < X.numblocks; i++) {  
     count = fwrite(w[i], sizeof(double), X.blocksizes[i], f);  
     check(count == X.blocksizes[i]);  
   }  
   fclose(f);  
   
   // score examples  
   // ---所有的样本都的得分,没有乘以 label y   
   printf("Scoring\n");  
   double *s = score(X, examples, num, w);  
   
   // ---------Write info file-------------  
   printf("Writing info file\n");  
   f = fopen(inffile, "w");  
   check(f != NULL);  
   for (int i = 0; i < num; i++) {  
     int len = ((int *)examples[i])[0];  
     // label, score, unique flag  
     count = fprintf(f, "%d\t%f\t%d\n", ((int *)examples[i])[1], s[i],   
                     (int)examples[i][sizeof(int)+len]);  
     check(count > 0);  
   }  
   fclose(f);  
     
   printf("Freeing memory\n");  
   for (int i = 0; i < X.numblocks; i++) {  
     free(w[i]);  
     free(lb[i]);  
   }  
   free(w);  
   free(lb);  
   free(s);  
   for (int i = 0; i < num; i++)  
     free(examples[i]);  
   free(examples);  
   free(sorted);  
   free(X.x);  
   free(X.blocksizes);  
   free(X.regmult);  
   free(X.learnmult);  
   
   return 0;  
 }  

你可能感兴趣的:(DPM)

stable diffusion参数说明 weixin_45597589 stable diffusion专题 stable diffusion
stablediffusion参数说明采样方法没有优劣之分，速度不一样。一般Eulera、DPM++2MKarras、DPM++SDEKarras,漫画一般选择DPM++2MKarras高清修复一般勾选。放大算法一般选择R-ESRGAN4x+ANIME6B宽度、高度控制图片的分辨率，根据选择的大模型的训练集尺寸选择，一般为64的倍数提示词相关性一般选择7~10采样迭代步数代表这幅画画了多少笔，一般
MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer 我在努力学习分割（禁止说我水平差） transformer 深度学习人工智能
MedSegDiff-V2:基于变压器的扩散医学图像分割摘要扩散概率模型(DiffusionProbabilisticModel,DPM)最近在计算机视觉领域获得了广泛的应用，这要归功于它的图像生成应用，如Imagen、LatentDiffusionModels和StableDiffusion，这些应用已经展示了令人印象深刻的能力，并在社区内引发了许多讨论。最近的研究进一步揭示了DPM在医学图像分
迅为LS2K0500开发板引出PCI接口，可扩展显卡、网卡、声卡、视频卡、SATARAID等 mucheni 2K0500
CPU迅为LS2K0500开发板采用龙芯2K0500处理器，基于龙芯自主指令系统(LoongArch)架构，片内集成64位LA264处理器核。实现ACPI、DVFS/DPM动态电源功耗管理等低功耗技术，支持多种电源级别和唤醒方式，可根据具体应用场景对芯片部分功能和高速接口进行动态时钟、电源开关控制，满足工控、网络安全等应用领域低功耗应用需求。PCI开发板引出PCI接口，可扩展显卡、网卡、声卡、视频
YOLOv8改进 | 主干篇 | 低照度增强网络PE-YOLO改进主干（改进暗光条件下的物体检测模型） Snu77 YOLOv8有效涨点专栏 YOLO 深度学习人工智能 pytorch 计算机视觉 python 目标检测
一、本文介绍本文给大家带来的改进机制是低照度图像增强网络PE-YOLO中的PENet，PENet通过拉普拉斯金字塔将图像分解成多个分辨率的组件，增强图像细节和低频信息。它包括一个细节处理模块（DPM），用于通过上下文分支和边缘分支增强图像细节，以及一个低频增强滤波器（LEF），以捕获低频语义并减少高频噪声。同时该网络的发布版本并不完善，存在二次创新的机会，后期我会将其网络进行二次创新，增强低照度的
Stable Diffusion中不同的采样方法 CCSBRIDGE 人工智能计算机视觉
在StableDiffusion模型中，采样方法是从学习到的概率分布中生成图像的算法。采样方法影响生成图像的质量、样式、速度以及过程的控制程度。以下是一些采样方法的概述和它们对图像生成可能产生的影响：DPM++系列DPM++2M/3M:这些是扩展的扩散概率模型，其中数字表示模型使用的标记步数（例如2M表示200万步）。步数越多，通常生成的图像细节和质量越高，但需要更长的计算时间。DPM++SDE:
MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model 我在努力学习分割（禁止说我水平差）神经网络
MedSegDiff:基于扩散概率模型的医学图像分割摘要：扩散概率模型(Diffusionprobabilisticmodel,DPM)是近年来计算机视觉研究的热点之一。它在Imagen、LatentDiffusionModels和StableDiffusion等图像生成应用中表现出了令人印象深刻的生成能力，引起了社区的广泛讨论。最近的许多研究还发现，它在许多其他视觉任务中也很有用，比如图像去模糊
MedSegDiff： Medical Image Segmentation with Diffusion Probabilistic Model 计算机视觉-Archer 人工智能
摘要Diffusionprobabilisticmodel(DPM)recentlybecomesoneofthehottesttopicincomputervision.ItsimagegenerationapplicationsuchasImagen,LatentDiffusionModelsandStableDiffusionhaveshownimpressivegenerationcapa
为什么MAX22216/MAX22217电流控制（CDR）比电压控制更好(VDR)？卓联微范同学硬件工程驱动开发人工智能算法健康医疗
如图▪与电流控制模式相比，电压控制模式需要更大的裕量来实现最小的驱动电流和保持电流。▪电压控制易受线圈电阻和输入电压变化的影响。▪电流控制模式消除了这些不准确性，节省了功耗并减少了电磁阀磨损。柱塞运动检测(DPM)问题:在卡住的阀门中，即使达到HIT电流，柱塞也不会移动。检测柱塞运动对于诊断是非常理想的方法。解决方案:一种诊断工具，允许“动态”检测局部峰值将为每个通道单独进行检测检测闯值可由用户通
aigc Sampling method 采样器 AI视觉网奇 aigc与数字人 AIGC
以下是我的建议：如果想快速生成质量不错的图片，建议选择DPM++2MKarras(20-30步)、UNIPC（15-25步）如果想要高质量的图，不关心重现性，建议选择DPM++SDEKarras（10-15步较慢)，DDIM(10-15步较快)如果想要简单的图，建议选择Euler,Heun(可以减少步骤以节省时间)如果想要稳定可重现的图像，请避免选择任何祖先采样器（名字里面带a或SDE）相反，如果
【腾讯云 HAI域探秘】StableDiffusionWebUI 让我找到了宫崎骏动漫里的夏天不叫猫先生人工智能云计算 stable diffusion 腾讯云 HAI
目录前言一、HAI二、应用场景三、构建StableDiffusion模型1、新建HAI应用2、StableDiffusionWebUI（1）功能介绍（2）页面转中文（3）AI绘图①正向提示词语②反向提示词③“+”、“AND”、“|”用法④权重⑤Eulera取样方法⑥DPM++2MKarras取样方法⑦新增提示词案例四、总结前言一直以来想部署一个自己的StableDiffusion模型，但是在构建模
定向政策矩阵牧云虎
内容定向政策矩阵(DPM)是由荷兰皇家壳牌集团开发的-一个业务组合计划工具，用于多业务公司的总体战略制定。与通用矩阵相比，选取的量化指标不同，定向政策矩阵更直接细化业务组合，并采取星级评定的方式尽可能的量化指标，以达到业务分区的真实性。定向政策矩阵(DirectionalPolicyMatrix，指导性政策矩阵，简称DPM或DP矩阵)定向政策矩阵的内容如图，该矩阵是-一个三乘三矩阵，描绘了各项业务
【SD】loopback 回送开魔法阵 - 换衣服 - 修复手部 oneREAD stable diffusion
原理：通过1张图片多次迭代，产生新的图片，并记录每张图片的不同DPM++2MKarrasCFG:7重绘幅度0.75bestquality,masterpiece,uniform,blueeyes,redglasses,1girl,magiccircle,cute,blackpantyhose,openpose迭代10次Finaldenoisingstrength：0.8openpose+depth
汽车行业里的DPM条码扫描解析慧都小妮子网络条码工具条码开发 dpm
汽车行业已全面采用直接零件标记(DPM)代码，这有助于在制造过程中识别和监控组件。本博客探讨了DPM代码的重要性，并调查了汽车行业中传统代码扫描技术遇到的困难。点击下载DynamsoftBarcodeReader最新版https://www.evget.com/product/3691/download了解汽车制造中的DPM代码准确的数据采集是实现卓越汽车制造的质量控制的一个基本方面。DPM代码作
【电商】AI模特高清放大 oneREAD AI电商 stable diffusion
目录实战一：模特人偶实战二：3DOPENPOSE生成模特高清放大（可开启ADetailer）实战三：半身模特随机生成高清放大（可开启ADetailer）实战四：人偶生成模特图实战一：模特人偶使用InpaintAnything对人物的衣物进行处理得到：重绘非蒙版内容DPM++SDEKarras重绘幅度0.8迭代次数40模型：麦橘写实预处理器设置：1：canny2：openposeopenpose_f
【Animatediff】制作玫瑰，鲜花，香水，动态LOGO （结尾》图片停留） oneREAD AI动画 stable diffusion
提示：也可以后期加入文字。@电商\lofi_v4.safetensors[9462506675]》制作初始图片1：输入提示词流动的烟雾，飘落的花瓣，优雅的香水瓶周围环绕着柔软的钻石，烟，红色浪漫的玫瑰:1.5,柔和的背光营造梦幻的效果，浪漫的感觉，玫瑰柔软的纹理和颜色通过环光，空灵的质量，工作室照明，belnder,c4d,oc渲染，虚假，不真实，绘画，线条，低质量，低分辨率，模糊，不清楚DPM+
【海报】新年海报制作 oneREAD AI海报 stable diffusion
准备一张写好文字的图片。模型：@电商\lofi_v4.safetensors[9462506675]bestquality,masterpiece,8k,(softlighting:1.2),firecrackers,Chinesenewyear,,虚假，不真实，绘画，线条，低质量，低分辨率，模糊，不清楚将图片导入文生图DPM++2MKarras迭代步数：30CFG:91：开启control-ca
Android10.0 Framework层服务一览表 weixin_44205232 android java 开发语言
服务名称说明是否移除相关代码位置gsiservice:[]native服务，gsi镜像服务，和系统动态分区相关可以动态替换system.img可以移除/frameworks/base/packages/DynamicSystemInstallationService//system/gsid/dpmservice:[com.qti.dpm.IDpmService]高通预置服务/vendor/qco
【海报】动态海报 --- 龙女新年快乐 oneREAD AI海报 stable diffusion
第一次生成：模型：鬼魂迭代步数30DPM++2MKarras尺寸：1140x768orientaldragon,dragon,1girl,redeyes,whitehair,whitebackground,standing,solo,hairaccessory,shoes,lookingatviewer,flower,bangs,fullbody,yellowtheme,yellowdragon,
【海报】字体设计【总结】 oneREAD AI海报 stable diffusion
导入一张白底黑字的图片bestquality,masterpiece,photorealistic,8k,winter,snowflakes,definition,highdetail,adreamybackground,lantern/lamp,newyearmeteorology,santaalter,LightandShadow,,,,DPM++2MKarras迭代步数：40control:
打工人副业变现秘籍，某多/某手变现底层引擎-Stable Diffusion 局部重绘(利用SD进行换脸) 菜鸡哥的码场打工人副业变现秘籍 stable diffusion 人工智能
首先明确一个概念：绘图是对整个图片进行重绘，但局部重绘是对你选中的位置重绘，这就是两个功能的不同点。局部重绘详细步骤：1、用画笔涂黑你想修改的地方，图片右边的蓝色点可以拖动改变画笔大小，边缘适合用小画笔，中间用粗画笔；2、在正向关键词中写入想重新生成的词，比如1cuteface，因为你只想换脸，所以不用加别的主体提示词；3、记得绘制三次元时需要切换主模型为chiloutmix，采样方法用DPM++
fhog资料整理 AI视觉网奇视觉跟踪
fasthog资料整理：https://github.com/joaofaro/FHOGhttps://github.com/ppaanngggg/fhog这个有两种：1.DPM的Mattmp_image;image.convertTo(tmp_image,CV_32FC1);cout<
从SDE出发推导DPM-Solver TianwenZhou stable diffusion 深度学习人工智能
我们知道，传统的DDPM或SMLD等模型的反向过程需要多次迭代，生成一张图片就需要几千次迭代，速度远比GANs要慢。而拖慢整个模型进度的，正是模型的采样过程，无论是DDPM的祖先采样(AncestralSampling)，还是SMLD的退火Langevin采样，每生成一张图片时，都需要1000～2000步的反复迭代。因此，为了加速DDPM，我们需要加速其采样过程。现有的加速采样的方法层出不穷，有依
《MedSegDiff Medical Image Segmentation with Diffusion Probabilistic Model》论文阅读理解 wyypersist 研1沉淀 DPM diffusion model MedSegDiff 医学图像分割缺陷检测
《MedSegDiffMedicalImageSegmentationwithDiffusionProbabilisticModel》论文阅读理解领域：AnomalyDetection（缺陷检测）论文地址：MedSegDiff:MedicalImageSegmentationwithDiffusionProbabilisticModel1主要动机医学图像分割为医生检测疾病提供了一定的便利。DPM扩
MedSegDiff 小杨小杨1 #扩散模型计算机视觉深度学习人工智能
MedSegDiff:MedicalImageSegmentationwithDiffusionProbabilisticModel摘要第一个基于DPM的通用医学图像分割任务模型为了提高医学图像分割中DPM的分步区域注意，提出了动态条件编码方法，为每一步采样建立状态自适应条件进一步提出了特征频率分析器(FF-Parser)：消除高频噪声成分在此过程中的负面影响代码地址：https://github
论文阅读：MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model 小源0 论文阅读计算机视觉人工智能
论文标题：MedSegDiff:MedicalImageSegmentationwithDiffusionProbabilisticModel翻译：MedSegDiff：基于扩散概率模型的医学图像分割名词解释：高频分量（高频信号）对应着图像变化剧烈的部分，也就是图像的边缘（轮廓）或者噪声以及细节部分。1.动态条件编码在大多数条件DPM中，条件先验是一个唯一的给定信息。然而，医学图像分割是出了名的模
综述：目标检测二十年（机翻版）（未完 sylviiiiiia 目标检测人工智能计算机视觉
原文地址20年来的目标检测：一项调查摘要关键词一介绍二目标检测二十年A.一个目标检测的路线图1)里程碑：传统探测器ViolaJones探测器HOG检测器基于可变形零件的模型（DPM）2)里程碑：基于CNN的两阶段探测器RCNNSPPNetFastRCNNFasterRCNN特征金字塔网络（FPN）3)里程碑：基于CNN的单阶段探测器您只看一次（YOLO）中心网络DETRB.对象检测数据集和度量标准
枫林幽梦【 InsCode Stable Diffusion 美图活动一期】 friklogff stable diffusion inscode stable diffusion
一、StableDiffusion模型在线使用地址：https://inscode.csdn.net/@inscode/Stable-Diffusion二、模型版本及相关配置：模型：GuoFeng3.ckpt[74c61c3a52]Lora：GuoFeng3.2_Lora:0.66采样迭代步数（steps）:30采样方法（Sampler）：DPM++SDEKarras宽度：1080高度：1920提
YOLO出击暗夜目标检测！中科大提出端到端的暗目标检测框架PE-YOLO xwz小王子深度学习入门基础 YOLO 目标检测目标跟踪
当前的目标检测模型在许多基准数据集上取得了良好的结果，但在暗光条件下检测目标仍然是一个巨大的挑战。为了解决这个问题，作者提出了金字塔增强网络（PENet）并将其与YOLOv3结合，构建了一个名为PE-YOLO的暗光目标检测框架。首先，PENet使用拉普拉斯金字塔将图像分解为4个具有不同分辨率的组件。具体来说，作者提出了一个细节处理模块（DPM）来增强图像的细节，其中包括上下文分支和边缘分支。此外，
YOLO V1学习笔记朽月初二 YOLO 目标检测笔记学习
为什么要学YOLOV1_哔哩哔哩_bilibili这个视频讲解的很好，建议在看这个之前看看卷积神经网络，会对卷积后的结果理解更加深刻一点。一背景目标检测分为单阶段和两阶段模型。之前的目标检测DPM、R-CNN、Fast-RCNN、Faster-RCNN都是双阶段模型，也就是说需要先提取候选框，然后对各个候选框进行分类、甄别。双阶段模型没有全图信息，容易丢失很多信息。识别精度高，但是识别速度始终是技
关于目标检测的那些事儿（1） —— 二十年发展史 ^_^ 柠檬怪瘦yummy~ 目标检测目标检测深度学习图像识别
目标检测是当前计算机视觉和机器学习领域的研究热点。从Viola-JonesDetector、DPM等冷兵器时代的智慧到当今RCNN、YOLO等深度学习土壤孕育下的GPU暴力美学，整个目标检测的发展可谓是计算机视觉领域的一部浓缩史。简要概括下从1994到至今一共二十余年间目标检测的发展历程。先看一张图：。。。。。。。一、基于经典手工特征的目标检测算法（冷兵器时代的智慧）早期的目标检测算法大多是基于手
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement