zhazhiqiang2010

在Windows下运行Felzenszwalb的Deformable Part Models(voc-release4.01)目标检测matlab源码

原文：http://blog.csdn.net/masibuaa/article/details/17577195

可变形部件模型Deformable Part Models是目前最好的目标检测算法，由Felzenszwalb提出，本文介绍如何在windows下运行Felzenszwalb给出的matlab源码。

有关Deformable Part Model参见论文

A Discriminatively Trained, Multiscale,Deformable Part Model[CVPR 2008]的中文翻译

Object Detection with Discriminatively Trained Part Based Models[PAMI 2010]的中文翻译

及 有关可变形部件模型(Deformable Part Model)的一些说明

Deformable Part Model 相关网页(其中有源码下载)：http://www.cs.berkeley.edu/~rbg/latent/index.html

Pedro Felzenszwalb的个人主页：http://cs.brown.edu/~pff/

PASCAL VOC 目标检测挑战：http://pascallin.ecs.soton.ac.uk/challenges/VOC/

Felzenszwalb给出了matlab版本的实现，且只能运行在linux和Mac操作系统上，有网友给出了其中的第四版voc-release4.01修改后在windows上运行的方法，这里进行一下总结。

本文参考以下三篇博客：

Win7+VS2010+Matlab2011b下运行Discriminatively Trained Deformable PartModels(4.01版）代码-运行demo()-详细步骤

如何在window下运行Discriminatively Trained Deformable PartModels代码

在windows下运行Felzenszwalb的Discriminatively Trained Deformable Part Models代码

我的环境：Win7 + Matlab R2010a(其中配置VC++6.0中的c++编译器)

在网站http://www.cs.berkeley.edu/~rbg/latent/index.html上下载voc-release4.01源码并解压。

步骤1 在Matlab中配置c++编译器

在matlab命令行中输入：

[html]  view plain copy   
     
 mex –setup

回车，出现提示：

[html]  view plain copy   
     
    
 Please choose your compiler for building external interface (MEX) files:   
 Would you like mex to locate installed compilers [y]/n?  

输入n，回车，此时会列出matlab支持的编译器：

[html]  view plain copy   
     
    
 Select a compiler:  
   [1]Intel C++ 11.1 (with Microsoft Visual C++ 2008 SP1 linker)  
   [2]Intel C++ 9.1 (with Microsoft Visual C++ 2005 SP1 linker)  
   [3]Intel Visual Fortran 11.1 (with Microsoft Visual C++ 2008 SP1 linker)  
   [4]Intel Visual Fortran 11.1 (with Microsoft Visual C++ 2008 Shell linker)  
   [5]Intel Visual Fortran 10.1 (with Microsoft Visual C++ 2005 SP1 linker)  
   [6]Lcc-win32 C 2.4.1  
   [7]Microsoft Visual C++ 6.0  
   [8]Microsoft Visual C++ 2005 SP1  
   [9]Microsoft Visual C++ 2008 Express  
   [10]Microsoft Visual C++ 2008 SP1  
   [11]Open WATCOM C++  
   
   [0]None  

根据自己机器上安装的VC版本，选择对应的编译器，输入序号，回车，提示：

[html]  view plain copy   
     
    
 Your machine has a Microsoft Visual C++compiler located at  
 C:\Program Files\Microsoft Visual Studio.Do you want to use this compiler [y]/n?  

如果自动检测给出的是正确的VC目录，输入y，否则可以输入n后手动输入VC目录。

步骤2 尝试调用compile()编译源码

将matlab工作目录设置为文件夹voc-release4.01所在的目录，在matlab命令行中输入compile，即调用compile()函数尝试编译源码，我们看看会出现什么错误，然后挨个解决，错误提示如下：

[html]  view plain copy   
     
    
 Command line warning D4024 : unrecognizedsource file type 'resize.cc', object file assumed  
 Command line warning D4027 : source file'resize.cc' ignored  
 Command line warning D4021 : no actionperformed  

说明编译器无法识别.cc文件，打开compile.m文件，如下：

[html]  view plain copy   
     
    
 mex -O resize.cpp  
 mex -O dt.cpp  
 mex -O features.cpp  
 mex -O getdetections.cpp  
   
 % use one of the following depending on your setup  
 % 0 is fastest, 3 is slowest   
   
 % 0) multithreaded convolution using SSE  
 % mex -O fconvsse.cc -o fconv  
   
 % 1) multithreaded convolution using blas  
 %    WARNING: the blas version does not work with matlab >= 2010b   
 %    and Intel CPUs  
 % mex -O fconvblasMT.cc -lmwblas -o fconv  
   
 % 2) mulththreaded convolution without blas  
 % mex -O fconvMT.cc -o fconv  
   
 % 3) convolution using blas  
 % mex -O fconvblas.cc -lmwblas -o fconv  
   
 % 4) basic convolution, very compatible  
 % mex -O fconv.cc -o fconv  
   
 %在windows下使用时加上下面这句，并注释掉0)  
 mex -O fconv.cpp  

发现首先会编译resize.cc，dt.cc，features.cc，getdetections.cc 这四个文件，既然不识别.cc文件，就将这四个.cc文件的扩展名都改为.cpp，同时也修改compile.m文件，将前四句改为：

[html]  view plain copy   
     
    
 mex -O resize.cpp  
 mex -O dt.cpp  
 mex -O features.cpp  
 mex -O getdetections.cpp  

步骤3 修改resize.cpp文件

然后调用compile()，错误提示：

[html]  view plain copy   
     
    
 resize.cpp(36) : error C2057: expected constant expression  
 resize.cpp(36) : error C2466: cannot allocate an array of constant size 0  
 resize.cpp(36) : error C2133: 'ofs' : unknown size  
 resize.cpp(70) : error C2065: 'bzero' : undeclared identifier  
 resize.cpp(95) : error C2065: 'round' : undeclared identifier  

为解决此问题，修改resize.cpp文件，在前面加上bzero和round的定义：

[cpp]  view plain copy   
     
    
 #define bzero(a,b) memset(a,0,b)  
 int round(float a){float tmp = a-(int)a; if(tmp>=0.5) return(int)a+1;else return (int)a;}  

并并修改ofs数组的定义，将

[cpp]  view plain copy   
     
 alphainfo ofs[len];

这句改成：

[cpp]  view plain copy   
     
 alphainfo *ofs = new alphainfo[len];

当然在同一作用域后面加上：

[cpp]  view plain copy   
     
 delete [] ofs;

修改完后的resize.cpp文件如下：

[cpp]  view plain copy   
     
    
 #include <math.h>  
 #include <assert.h>  
 #include <string.h>  
 #include "mex.h"  
   
 /* 
  * Fast image subsampling. 
  * This is used to construct the feature pyramid. 
  */  
   
 //在windows下使用时加上下面这句  
 #define bzero(a,b) memset(a,0,b)  
 int round(float a){float tmp = a-(int)a; if(tmp>=0.5) return (int)a+1;else return (int)a;}  
    
 // struct used for caching interpolation values  
 struct alphainfo {  
   int si, di;  
   double alpha;  
 };  
   
 // copy src into dst using pre-computed interpolation values  
 void alphacopy(double *src, double *dst, struct alphainfo *ofs, int n) {  
   struct alphainfo *end = ofs + n;  
   while (ofs != end) {  
     dst[ofs->di] += ofs->alpha * src[ofs->si];  
     ofs++;  
   }  
 }  
   
 // resize along each column  
 // result is transposed, so we can apply it twice for a complete resize  
 void resize1dtran(double *src, int sheight, double *dst, int dheight,   
           int width, int chan) {  
   double scale = (double)dheight/(double)sheight;  
   double invscale = (double)sheight/(double)dheight;  
     
   // we cache the interpolation values since they can be   
   // shared among different columns  
   int len = (int)ceil(dheight*invscale) + 2*dheight;  
   //alphainfo ofs[len];  
   alphainfo *ofs = new alphainfo[len];//在windows下使用时加上这句，注释掉上面一句   
   int k = 0;  
   for (int dy = 0; dy < dheight; dy++) {  
     double fsy1 = dy * invscale;  
     double fsy2 = fsy1 + invscale;  
     int sy1 = (int)ceil(fsy1);  
     int sy2 = (int)floor(fsy2);         
   
     if (sy1 - fsy1 > 1e-3) {  
       assert(k < len);  
       assert(sy-1 >= 0);  
       ofs[k].di = dy*width;  
       ofs[k].si = sy1-1;  
       ofs[k++].alpha = (sy1 - fsy1) * scale;  
     }  
   
     for (int sy = sy1; sy < sy2; sy++) {  
       assert(k < len);  
       assert(sy < sheight);  
       ofs[k].di = dy*width;  
       ofs[k].si = sy;  
       ofs[k++].alpha = scale;  
     }  
   
     if (fsy2 - sy2 > 1e-3) {  
       assert(k < len);  
       assert(sy2 < sheight);  
       ofs[k].di = dy*width;  
       ofs[k].si = sy2;  
       ofs[k++].alpha = (fsy2 - sy2) * scale;  
     }  
   }  
   
   // resize each column of each color channel  
   bzero(dst, chan*width*dheight*sizeof(double));  
   for (int c = 0; c < chan; c++) {  
     for (int x = 0; x < width; x++) {  
       double *s = src + c*width*sheight + x*sheight;  
       double *d = dst + c*width*dheight + x;  
       alphacopy(s, d, ofs, k);  
     }  
   }  
   delete[] ofs;//在windows下使用时加上这句  
 }  
   
 // main function  
 // takes a double color image and a scaling factor  
 // returns resized image  
 mxArray *resize(const mxArray *mxsrc, const mxArray *mxscale) {  
   double *src = (double *)mxGetPr(mxsrc);  
   const int *sdims = mxGetDimensions(mxsrc);  
   if (mxGetNumberOfDimensions(mxsrc) != 3 ||   
       mxGetClassID(mxsrc) != mxDOUBLE_CLASS)  
     mexErrMsgTxt("Invalid input");    
   
   double scale = mxGetScalar(mxscale);  
   if (scale > 1)  
     mexErrMsgTxt("Invalid scaling factor");     
   
   int ddims[3];  
   ddims[0] = (int)round(sdims[0]*scale);  
   ddims[1] = (int)round(sdims[1]*scale);  
   ddims[2] = sdims[2];  
   mxArray *mxdst = mxCreateNumericArray(3, ddims, mxDOUBLE_CLASS, mxREAL);  
   double *dst = (double *)mxGetPr(mxdst);  
   
   double *tmp = (double *)mxCalloc(ddims[0]*sdims[1]*sdims[2], sizeof(double));  
   resize1dtran(src, sdims[0], tmp, ddims[0], sdims[1], sdims[2]);  
   resize1dtran(tmp, sdims[1], dst, ddims[1], ddims[0], sdims[2]);  
   mxFree(tmp);  
   
   return mxdst;  
 }  
   
 // matlab entry point  
 // dst = resize(src, scale)  
 // image should be color with double values  
 void mexFunction(int nlhs, mxArray *plhs[], int nrhs, const mxArray *prhs[]) {   
   if (nrhs != 2)  
     mexErrMsgTxt("Wrong number of inputs");   
   if (nlhs != 1)  
     mexErrMsgTxt("Wrong number of outputs");  
   plhs[0] = resize(prhs[0], prhs[1]);  
 }  

步骤4 修改dt.cpp文件

修改完resize.cpp文件后，继续compile，错误提示如下：

[html]  view plain copy   
     
 dt.cpp(61): error C2065: 'int32_t' : undeclared identifier

等等。

为解决此问题，在dt.cpp文件前面加上：

[cpp]  view plain copy   
     
 #defineint32_t int

然后继续compile，错误提示如下：

[html]  view plain copy   
     
    
 dt.cpp(77): error C2374: 'x' : redefinition; multiple initialization  
 dt.cpp(70) : seedeclaration of 'x'  

说明有变量的二次定义，其实这是VC++6.0编译器的一个bug，在VC++6.0中，如果有如下的语句：

[cpp]  view plain copy   
     
    
 for(int i=0; i < 10; i++)  
     {...}  
 for(int i=0; i <10; i++)  
     {...}  

则编译器会提示第二个变量i是重复定义，也就是说，编译器不认为在for语句内定义的变量的作用域仅限于for语句内，这与C++语法不符，现在的VS2010中已经没有这个问题了。所以在resize.cpp文件的对应位置注释掉二次定义就可以了，或者如果你选择的编译器不是VC++6.0的话，就没有这个问题。

步骤5 修改features.cpp文件

修改好dt.cpp文件后，再次compile，错误提示如下：

[html]  view plain copy   
     
    
 features.cpp(48) : error C2065: 'round' : undeclared identifier   
 features.cpp(158) : error C2374: 'x' : redefinition; multiple initialization   
         features.cpp(65) : see declaration of 'x'   
 features.cpp(195) : error C2374: 'o' : redefinition; multiple initialization   
        features.cpp(179) : see declaration of 'o'  

可以看出有三个问题，round()函数未定义，变量x和o重复定义，

所以在features.cpp文件中加入round()函数的定义：

[cpp]  view plain copy   
     
 intround(float a){float tmp = a-(int)a; if(tmp>=0.5) return (int)a+1;elsereturn (int)a;}

并根据出错位置注释掉变量x和o的二次定义

步骤6 再次修改compile.m文件

修改完features.cpp文件后，再次compile，错误提示如下：

[html]  view plain copy   
     
    
     Usage:   
         MEX [option1 ... optionN] sourcefile1 [... sourcefileN]   
             [objectfile1 ... objectfileN] [libraryfile1 ... libraryfileN]   
 Use the -help option for more information, or consult the MATLAB API Guide.  
 Error in ==> compile at 10  
 mex -O fconvsse.cc -o fconv  

打开compile.m文件，查看第10行之前的注释：

[html]  view plain copy   
     
    
 % use one of thefollowing depending on your setup  
 % 0 is fastest, 3 isslowest(应该是0 is fastest, 4 is slowest)  

可以看到0-4只是效率不同，作用一样，既然第10行的0号出问题了，就换一个，根据网友pozen的说明：其他几个fconv用了其他平台的multiThread在windows上跑不起，所以在最后加上：

[html]  view plain copy   
     
 mex -O fconv.cpp

并将第10行的

[html]  view plain copy   
     
 mex -O fconvsse.cc -o fconv

注释掉。

注意这里要先将fconv.cc文件的扩展名改为cpp，否则还会出现一开始的不识别.cc文件的问题。

修改完后的compile.m文件如下：

[html]  view plain copy   
     
    
 mex -O resize.cpp  
 mex -O dt.cpp  
 mex -O features.cpp  
 mex -O getdetections.cpp  
   
 % use one of the following depending on your setup  
 % 0 is fastest, 3 is slowest   
   
 % 0) multithreaded convolution using SSE  
 % mex -O fconvsse.cc -o fconv  
   
 % 1) multithreaded convolution using blas  
 %    WARNING: the blas version does not work with matlab >= 2010b   
 %    and Intel CPUs  
 % mex -O fconvblasMT.cc -lmwblas -o fconv  
   
 % 2) mulththreaded convolution without blas  
 % mex -O fconvMT.cc -o fconv  
   
 % 3) convolution using blas  
 % mex -O fconvblas.cc -lmwblas -o fconv  
   
 % 4) basic convolution, very compatible  
 % mex -O fconv.cc -o fconv  
   
 %在windows下使用时加上下面这句，并注释掉0)  
 mex -O fconv.cpp  

步骤7 修改fconv.cpp文件

修改完compile.m文件后，再次compile，错误提示如下：

[html]  view plain copy   
     
 fconv.cpp(75): error C4716: 'process' : must return a value

所以修改fconv.cpp文件，将

[html]  view plain copy   
     
 void*process(void *thread_arg)

改为：

[html]  view plain copy   
     
 void process(void*thread_arg)

即去掉指针符号。

然后再次compile，没错误提示了，编译成功了。

步骤8 运行demo()，进行目标检测试验

编译完成后，在matlab命令行中输入demo，进行目标检测试验，根据提示，依次会出现小轿车、人、自行车的部件模型和检测结果，如果想检测其他图片，修改demo文件即可。

结果

(1) 小轿车

(2) 人

(3) 自行车

stable diffusion参数说明 weixin_45597589 stable diffusion专题 stable diffusion
stablediffusion参数说明采样方法没有优劣之分，速度不一样。一般Eulera、DPM++2MKarras、DPM++SDEKarras,漫画一般选择DPM++2MKarras高清修复一般勾选。放大算法一般选择R-ESRGAN4x+ANIME6B宽度、高度控制图片的分辨率，根据选择的大模型的训练集尺寸选择，一般为64的倍数提示词相关性一般选择7~10采样迭代步数代表这幅画画了多少笔，一般
MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer 我在努力学习分割（禁止说我水平差） transformer 深度学习人工智能
MedSegDiff-V2:基于变压器的扩散医学图像分割摘要扩散概率模型(DiffusionProbabilisticModel,DPM)最近在计算机视觉领域获得了广泛的应用，这要归功于它的图像生成应用，如Imagen、LatentDiffusionModels和StableDiffusion，这些应用已经展示了令人印象深刻的能力，并在社区内引发了许多讨论。最近的研究进一步揭示了DPM在医学图像分
迅为LS2K0500开发板引出PCI接口，可扩展显卡、网卡、声卡、视频卡、SATARAID等 mucheni 2K0500
CPU迅为LS2K0500开发板采用龙芯2K0500处理器，基于龙芯自主指令系统(LoongArch)架构，片内集成64位LA264处理器核。实现ACPI、DVFS/DPM动态电源功耗管理等低功耗技术，支持多种电源级别和唤醒方式，可根据具体应用场景对芯片部分功能和高速接口进行动态时钟、电源开关控制，满足工控、网络安全等应用领域低功耗应用需求。PCI开发板引出PCI接口，可扩展显卡、网卡、声卡、视频
YOLOv8改进 | 主干篇 | 低照度增强网络PE-YOLO改进主干（改进暗光条件下的物体检测模型） Snu77 YOLOv8有效涨点专栏 YOLO 深度学习人工智能 pytorch 计算机视觉 python 目标检测
一、本文介绍本文给大家带来的改进机制是低照度图像增强网络PE-YOLO中的PENet，PENet通过拉普拉斯金字塔将图像分解成多个分辨率的组件，增强图像细节和低频信息。它包括一个细节处理模块（DPM），用于通过上下文分支和边缘分支增强图像细节，以及一个低频增强滤波器（LEF），以捕获低频语义并减少高频噪声。同时该网络的发布版本并不完善，存在二次创新的机会，后期我会将其网络进行二次创新，增强低照度的
Stable Diffusion中不同的采样方法 CCSBRIDGE 人工智能计算机视觉
在StableDiffusion模型中，采样方法是从学习到的概率分布中生成图像的算法。采样方法影响生成图像的质量、样式、速度以及过程的控制程度。以下是一些采样方法的概述和它们对图像生成可能产生的影响：DPM++系列DPM++2M/3M:这些是扩展的扩散概率模型，其中数字表示模型使用的标记步数（例如2M表示200万步）。步数越多，通常生成的图像细节和质量越高，但需要更长的计算时间。DPM++SDE:
MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model 我在努力学习分割（禁止说我水平差）神经网络
MedSegDiff:基于扩散概率模型的医学图像分割摘要：扩散概率模型(Diffusionprobabilisticmodel,DPM)是近年来计算机视觉研究的热点之一。它在Imagen、LatentDiffusionModels和StableDiffusion等图像生成应用中表现出了令人印象深刻的生成能力，引起了社区的广泛讨论。最近的许多研究还发现，它在许多其他视觉任务中也很有用，比如图像去模糊
MedSegDiff： Medical Image Segmentation with Diffusion Probabilistic Model 计算机视觉-Archer 人工智能
摘要Diffusionprobabilisticmodel(DPM)recentlybecomesoneofthehottesttopicincomputervision.ItsimagegenerationapplicationsuchasImagen,LatentDiffusionModelsandStableDiffusionhaveshownimpressivegenerationcapa
为什么MAX22216/MAX22217电流控制（CDR）比电压控制更好(VDR)？卓联微范同学硬件工程驱动开发人工智能算法健康医疗
如图▪与电流控制模式相比，电压控制模式需要更大的裕量来实现最小的驱动电流和保持电流。▪电压控制易受线圈电阻和输入电压变化的影响。▪电流控制模式消除了这些不准确性，节省了功耗并减少了电磁阀磨损。柱塞运动检测(DPM)问题:在卡住的阀门中，即使达到HIT电流，柱塞也不会移动。检测柱塞运动对于诊断是非常理想的方法。解决方案:一种诊断工具，允许“动态”检测局部峰值将为每个通道单独进行检测检测闯值可由用户通
aigc Sampling method 采样器 AI视觉网奇 aigc与数字人 AIGC
以下是我的建议：如果想快速生成质量不错的图片，建议选择DPM++2MKarras(20-30步)、UNIPC（15-25步）如果想要高质量的图，不关心重现性，建议选择DPM++SDEKarras（10-15步较慢)，DDIM(10-15步较快)如果想要简单的图，建议选择Euler,Heun(可以减少步骤以节省时间)如果想要稳定可重现的图像，请避免选择任何祖先采样器（名字里面带a或SDE）相反，如果
【腾讯云 HAI域探秘】StableDiffusionWebUI 让我找到了宫崎骏动漫里的夏天不叫猫先生人工智能云计算 stable diffusion 腾讯云 HAI
目录前言一、HAI二、应用场景三、构建StableDiffusion模型1、新建HAI应用2、StableDiffusionWebUI（1）功能介绍（2）页面转中文（3）AI绘图①正向提示词语②反向提示词③“+”、“AND”、“|”用法④权重⑤Eulera取样方法⑥DPM++2MKarras取样方法⑦新增提示词案例四、总结前言一直以来想部署一个自己的StableDiffusion模型，但是在构建模
定向政策矩阵牧云虎
内容定向政策矩阵(DPM)是由荷兰皇家壳牌集团开发的-一个业务组合计划工具，用于多业务公司的总体战略制定。与通用矩阵相比，选取的量化指标不同，定向政策矩阵更直接细化业务组合，并采取星级评定的方式尽可能的量化指标，以达到业务分区的真实性。定向政策矩阵(DirectionalPolicyMatrix，指导性政策矩阵，简称DPM或DP矩阵)定向政策矩阵的内容如图，该矩阵是-一个三乘三矩阵，描绘了各项业务
【SD】loopback 回送开魔法阵 - 换衣服 - 修复手部 oneREAD stable diffusion
原理：通过1张图片多次迭代，产生新的图片，并记录每张图片的不同DPM++2MKarrasCFG:7重绘幅度0.75bestquality,masterpiece,uniform,blueeyes,redglasses,1girl,magiccircle,cute,blackpantyhose,openpose迭代10次Finaldenoisingstrength：0.8openpose+depth
汽车行业里的DPM条码扫描解析慧都小妮子网络条码工具条码开发 dpm
汽车行业已全面采用直接零件标记(DPM)代码，这有助于在制造过程中识别和监控组件。本博客探讨了DPM代码的重要性，并调查了汽车行业中传统代码扫描技术遇到的困难。点击下载DynamsoftBarcodeReader最新版https://www.evget.com/product/3691/download了解汽车制造中的DPM代码准确的数据采集是实现卓越汽车制造的质量控制的一个基本方面。DPM代码作
【电商】AI模特高清放大 oneREAD AI电商 stable diffusion
目录实战一：模特人偶实战二：3DOPENPOSE生成模特高清放大（可开启ADetailer）实战三：半身模特随机生成高清放大（可开启ADetailer）实战四：人偶生成模特图实战一：模特人偶使用InpaintAnything对人物的衣物进行处理得到：重绘非蒙版内容DPM++SDEKarras重绘幅度0.8迭代次数40模型：麦橘写实预处理器设置：1：canny2：openposeopenpose_f
【Animatediff】制作玫瑰，鲜花，香水，动态LOGO （结尾》图片停留） oneREAD AI动画 stable diffusion
提示：也可以后期加入文字。@电商\lofi_v4.safetensors[9462506675]》制作初始图片1：输入提示词流动的烟雾，飘落的花瓣，优雅的香水瓶周围环绕着柔软的钻石，烟，红色浪漫的玫瑰:1.5,柔和的背光营造梦幻的效果，浪漫的感觉，玫瑰柔软的纹理和颜色通过环光，空灵的质量，工作室照明，belnder,c4d,oc渲染，虚假，不真实，绘画，线条，低质量，低分辨率，模糊，不清楚DPM+
【海报】新年海报制作 oneREAD AI海报 stable diffusion
准备一张写好文字的图片。模型：@电商\lofi_v4.safetensors[9462506675]bestquality,masterpiece,8k,(softlighting:1.2),firecrackers,Chinesenewyear,,虚假，不真实，绘画，线条，低质量，低分辨率，模糊，不清楚将图片导入文生图DPM++2MKarras迭代步数：30CFG:91：开启control-ca
Android10.0 Framework层服务一览表 weixin_44205232 android java 开发语言
服务名称说明是否移除相关代码位置gsiservice:[]native服务，gsi镜像服务，和系统动态分区相关可以动态替换system.img可以移除/frameworks/base/packages/DynamicSystemInstallationService//system/gsid/dpmservice:[com.qti.dpm.IDpmService]高通预置服务/vendor/qco
【海报】动态海报 --- 龙女新年快乐 oneREAD AI海报 stable diffusion
第一次生成：模型：鬼魂迭代步数30DPM++2MKarras尺寸：1140x768orientaldragon,dragon,1girl,redeyes,whitehair,whitebackground,standing,solo,hairaccessory,shoes,lookingatviewer,flower,bangs,fullbody,yellowtheme,yellowdragon,
【海报】字体设计【总结】 oneREAD AI海报 stable diffusion
导入一张白底黑字的图片bestquality,masterpiece,photorealistic,8k,winter,snowflakes,definition,highdetail,adreamybackground,lantern/lamp,newyearmeteorology,santaalter,LightandShadow,,,,DPM++2MKarras迭代步数：40control:
打工人副业变现秘籍，某多/某手变现底层引擎-Stable Diffusion 局部重绘(利用SD进行换脸) 菜鸡哥的码场打工人副业变现秘籍 stable diffusion 人工智能
首先明确一个概念：绘图是对整个图片进行重绘，但局部重绘是对你选中的位置重绘，这就是两个功能的不同点。局部重绘详细步骤：1、用画笔涂黑你想修改的地方，图片右边的蓝色点可以拖动改变画笔大小，边缘适合用小画笔，中间用粗画笔；2、在正向关键词中写入想重新生成的词，比如1cuteface，因为你只想换脸，所以不用加别的主体提示词；3、记得绘制三次元时需要切换主模型为chiloutmix，采样方法用DPM++
fhog资料整理 AI视觉网奇视觉跟踪
fasthog资料整理：https://github.com/joaofaro/FHOGhttps://github.com/ppaanngggg/fhog这个有两种：1.DPM的Mattmp_image;image.convertTo(tmp_image,CV_32FC1);cout<
从SDE出发推导DPM-Solver TianwenZhou stable diffusion 深度学习人工智能
我们知道，传统的DDPM或SMLD等模型的反向过程需要多次迭代，生成一张图片就需要几千次迭代，速度远比GANs要慢。而拖慢整个模型进度的，正是模型的采样过程，无论是DDPM的祖先采样(AncestralSampling)，还是SMLD的退火Langevin采样，每生成一张图片时，都需要1000～2000步的反复迭代。因此，为了加速DDPM，我们需要加速其采样过程。现有的加速采样的方法层出不穷，有依
《MedSegDiff Medical Image Segmentation with Diffusion Probabilistic Model》论文阅读理解 wyypersist 研1沉淀 DPM diffusion model MedSegDiff 医学图像分割缺陷检测
《MedSegDiffMedicalImageSegmentationwithDiffusionProbabilisticModel》论文阅读理解领域：AnomalyDetection（缺陷检测）论文地址：MedSegDiff:MedicalImageSegmentationwithDiffusionProbabilisticModel1主要动机医学图像分割为医生检测疾病提供了一定的便利。DPM扩
MedSegDiff 小杨小杨1 #扩散模型计算机视觉深度学习人工智能
MedSegDiff:MedicalImageSegmentationwithDiffusionProbabilisticModel摘要第一个基于DPM的通用医学图像分割任务模型为了提高医学图像分割中DPM的分步区域注意，提出了动态条件编码方法，为每一步采样建立状态自适应条件进一步提出了特征频率分析器(FF-Parser)：消除高频噪声成分在此过程中的负面影响代码地址：https://github
论文阅读：MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model 小源0 论文阅读计算机视觉人工智能
论文标题：MedSegDiff:MedicalImageSegmentationwithDiffusionProbabilisticModel翻译：MedSegDiff：基于扩散概率模型的医学图像分割名词解释：高频分量（高频信号）对应着图像变化剧烈的部分，也就是图像的边缘（轮廓）或者噪声以及细节部分。1.动态条件编码在大多数条件DPM中，条件先验是一个唯一的给定信息。然而，医学图像分割是出了名的模
综述：目标检测二十年（机翻版）（未完 sylviiiiiia 目标检测人工智能计算机视觉
原文地址20年来的目标检测：一项调查摘要关键词一介绍二目标检测二十年A.一个目标检测的路线图1)里程碑：传统探测器ViolaJones探测器HOG检测器基于可变形零件的模型（DPM）2)里程碑：基于CNN的两阶段探测器RCNNSPPNetFastRCNNFasterRCNN特征金字塔网络（FPN）3)里程碑：基于CNN的单阶段探测器您只看一次（YOLO）中心网络DETRB.对象检测数据集和度量标准
枫林幽梦【 InsCode Stable Diffusion 美图活动一期】 friklogff stable diffusion inscode stable diffusion
一、StableDiffusion模型在线使用地址：https://inscode.csdn.net/@inscode/Stable-Diffusion二、模型版本及相关配置：模型：GuoFeng3.ckpt[74c61c3a52]Lora：GuoFeng3.2_Lora:0.66采样迭代步数（steps）:30采样方法（Sampler）：DPM++SDEKarras宽度：1080高度：1920提
YOLO出击暗夜目标检测！中科大提出端到端的暗目标检测框架PE-YOLO xwz小王子深度学习入门基础 YOLO 目标检测目标跟踪
当前的目标检测模型在许多基准数据集上取得了良好的结果，但在暗光条件下检测目标仍然是一个巨大的挑战。为了解决这个问题，作者提出了金字塔增强网络（PENet）并将其与YOLOv3结合，构建了一个名为PE-YOLO的暗光目标检测框架。首先，PENet使用拉普拉斯金字塔将图像分解为4个具有不同分辨率的组件。具体来说，作者提出了一个细节处理模块（DPM）来增强图像的细节，其中包括上下文分支和边缘分支。此外，
YOLO V1学习笔记朽月初二 YOLO 目标检测笔记学习
为什么要学YOLOV1_哔哩哔哩_bilibili这个视频讲解的很好，建议在看这个之前看看卷积神经网络，会对卷积后的结果理解更加深刻一点。一背景目标检测分为单阶段和两阶段模型。之前的目标检测DPM、R-CNN、Fast-RCNN、Faster-RCNN都是双阶段模型，也就是说需要先提取候选框，然后对各个候选框进行分类、甄别。双阶段模型没有全图信息，容易丢失很多信息。识别精度高，但是识别速度始终是技
关于目标检测的那些事儿（1） —— 二十年发展史 ^_^ 柠檬怪瘦yummy~ 目标检测目标检测深度学习图像识别
目标检测是当前计算机视觉和机器学习领域的研究热点。从Viola-JonesDetector、DPM等冷兵器时代的智慧到当今RCNN、YOLO等深度学习土壤孕育下的GPU暴力美学，整个目标检测的发展可谓是计算机视觉领域的一部浓缩史。简要概括下从1994到至今一共二十余年间目标检测的发展历程。先看一张图：。。。。。。。一、基于经典手工特征的目标检测算法（冷兵器时代的智慧）早期的目标检测算法大多是基于手
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

在Windows下运行Felzenszwalb的Deformable Part Models(voc-release4.01)目标检测matlab源码

你可能感兴趣的:(DPM)