huangli19870217

HOG Detector ~ Training OLTbinaries

http://lego.twgg.org/?p=852

最近糊里糊塗的完成了 HOG Detector 對於輪胎偵測的訓練(效果挺優 !!)，

都要感謝此網站的達人：http://blog.baifaces.com/baifaces/blog/work/opencv-hog-peopledetector-trainning.html

在此也記錄一下，我實作時的疑難雜症吧！！

實作平台是：Ubuntu 11.04

釋出訓練程式的網站：http://pascal.inrialpes.fr/soft/olt/ (載點) (樣本檔)

樣本檔容量很大，如果只是要單純訓練自己的樣本的話，大可不用抓。

步驟紀錄如下：

 
    
     
       
       
         [lego@lego HOG]$ wget http: 
         //pascal 
         .inrialpes.fr 
         /soft/olt/OLTbinaries 
         .zip 
        
 
         [lego@lego HOG]$ unzip OLTbinaries.zip 
        
 
         [lego@lego HOG]$  
         cd 
         OLTbinaries 
        
 
         // 
          建立樣本資料夾 train 與  
         test 
        
 
         [lego@lego OLTbinaries]$  
         mkdir 
         train  
         test 
        
 
         // 
          把你的正樣本 copy 到 train 與  
         test 
          目錄中 (pos為你放正樣本圖片的資料夾) 
        
 
         [lego@lego OLTbinaries]$  
         cp 
         -r pos train/ 
        
 
         [lego@lego OLTbinaries]$  
         cp 
         -r pos  
         test 
         / 
        
 
         // 
          把你的負樣本 copy 到 train 與  
         test 
          目錄中 (neg為你放負樣本圖片的資料夾) 
        
 
         [lego@lego OLTbinaries]$  
         cp 
         -r neg train/ 
        
 
         [lego@lego OLTbinaries]$  
         cp 
         -r neg  
         test 
         / 
        
 
         // 
          建立正負樣本的 list 
        
 
         [lego@lego OLTbinaries]$  
         find 
         train 
         /pos 
         > train 
         /pos 
         .lst 
        
 
         [lego@lego OLTbinaries]$  
         find 
         test 
         /pos 
         >  
         test 
         /pos 
         .lst 
        
 
         [lego@lego OLTbinaries]$  
         find 
         train 
         /neg 
         > train 
         /neg 
         .lst 
        
 
         [lego@lego OLTbinaries]$  
         find 
         test 
         /neg 
         >  
         test 
         /neg 
         .lst 
        
 
         // 
          做完上述指令後，需要把上面的每一個 lst 檔的第一行 刪掉 
        
 
         // 
          修改 runall.sh 把其中的 WIDTH 與 HEIGHT 改成你自己的正樣本大小 
        
 
         [lego@lego OLTbinaries]$  
         vi 
         runall.sh 
        
 
         WIDTH=64;  
         export 
         WIDTH 
        
 
         HEIGHT=128;  
         export 
         HEIGHT 
        
 
         // 
          接下來就開始訓練了 !!! (我訓練的正樣本有 1133 張 size 50 x 50，負樣本有 680 張 size 512x384) 
        
 
         // 
          跟 AdaBoost 比起來，HOG Detector 的訓練時間算是很快！！ 
        
 
         [lego@lego OLTbinaries]$ sh runall.sh 
        
 
         // 
          等待 runall.sh 跑完後，便可看到 OLTbinaries 
         /HOG 
          目錄下，產生了一個 model  
         file 
        
 
         // 
          此即為我們訓練好的檔案。 
        
 
         [lego@lego OLTbinaries]$  
         ls 
         HOG 
         /model_4BiSVMLight 
         .alt 
        
 
         HOG 
         /model_4BiSVMLight 
         .alt 
        
 
     
 
    
  

以上為訓練過程，以下備註一下注意事項：

1. 訓練的正、負圖片可以是 png 或 jpg ( 我用 bmp 時，會出錯 )，還有就是副檔名要小寫。
2. 若要改變訓練完的 model 檔名稱與位置，可在 runall.sh 中修改。

做完訓練，接下來就是測試訓練檔好不好用啦！！

在此它有提供 runonimage.sh 讓我們測試，用法如下：
## 使用前記得先修改 runonimage.sh 內的正樣本圖片長、寬(與你訓練的正樣本長、寬要一樣)，不然會出錯。
WIDTH=64; export WIDTH
HEIGHT=128; export HEIGHT

 
         # runonimage.sh {image name/image directory/list file} {out text file} {out image file/out image dir} 
        
         // 
          總共有三個參數 
        
         參數1: 可直接指定預測試的圖片檔名 (ex: photo.jpg )，或者是一個存放圖片清單的檔案 
        
         ( ex: 存放所有你要測試圖片清單的檔案 image.lst 內容如： 
         test 
         /photo1 
         .jpg ) 
        
         參數2: 測試過程中，可能會有一些測試結果的資訊， 這些資訊會存入該參數指定的檔案 
        
         參數3: 測試完畢後，該程式會將偵測物件的結果資訊，畫在圖片上，因此該參數便是指定這張被繪製偵測結果資訊的圖片的位置， 
        
         如果你指定的是圖片檔名，則會以該檔名進行儲存； 
        
         如果你指定的是一個目錄，則會以原始測試的檔名，儲存在你指定的目錄中。 
        
         // 
          實際指令下法 
        
         # 1 測試單張圖片 
        
         [lego@lego OLTbinaries]$ sh runonimage.sh photo.jpg result.txt result.jpg 
        
         # 2 測試大量圖片 
        
         [lego@lego OLTbinaries]$ sh runonimage.sh image.lst result.txt result_folder/

測試的圖片，還是盡量使用 jpg 或 png 且輸出的附檔名一定要是小寫，不然有時候跑起來程式會一直出錯，挺麻煩的。

在此SHOW三張偵測結果圖吧 (效果不賴)：

當然 ~ 有時候難免有誤判。

以後有空再把它整進 Android 手機中試看看好了 !!! 先

为了验证这一想法的正确性和可行性，笔者做了些实验，在Ubuntu10.4 g++4.4.5环境中，步骤如下：

下载release版的程序：OLTbinaries.zip
下载样本：INRIAPerson.tar
在目录OLTbinaries/下建立两个文件夹test, train. 将INRIAperson/Test/neg拷贝到test/下，INRIAperson/Train/neg拷贝到train/下;将INRIAperson/test_64x128_H96拷贝到test/下重命名为pos，将INRIAperson/train_64x128_H96拷贝到train/下重命名为pos;
将test/neg , test/pos各自文件夹中的所有图片文件名分别输出到neg.list, pos.list, 并放置在test/下; 同样地操作在train/。<pre class="brush: shell; gutter: true">amadeuzou@ubuntu:~/Projects/opencv/OLTbinaries/test$ ls ./neg > neg.list amadeuzou@ubuntu:~/Projects/opencv/OLTbinaries/test$ ls ./pos > pos.list
到这里，样本数据便准备好了，那么，只要修改OLTbinaries/runall.sh相关参数然后这些此脚本，一小时左右的时间，便会在OLTbinaries/HOG/下产生一个model_4BiSVMLight.alt文件，你的模型数据便保存在这里面。到这里，你便成功trainning了一个model。

注意事项：

runall.sh中第5行，按你的正负样本数目修改：

 
            HardOption=" --poscases 2416 --negcases 1218 "

runall.sh中第21行，按你的样本文件夹所在(InDir)及输出文件所在(OutDir)修改：

 
            OutDir=./HOG 
          
            InDir=./ 
          
            OutFile=$OutDir/record 
          
            CMDLINE=$OutDir/record

trainning过程中会产生两个G左右的临时文件在OutDir（=./HOG）中，所以要确保硬盘空间足够，结束时删除，只留model_4BiSVMLight.alt。

整个trainning过程分4步，有4条屏幕输出信息，最可能出现的错误是样本文件路径不对，可在pos.list neg.list 中用图像文件的绝对路径。

 
            First iteration complete 
          
            Hard examples created 
          
            Doing second learning 
          
            Second iteration complete

如果你用的是自己的样本，注意修改其他参数（待究），如正样本的大小：

 
            WIDTH=64; export WIDTH 
          
            HEIGHT=128; export HEIGHT

有了模型，怎么去做目标检测呢？你可以做以下的试验：

使用bin在OLTbinaries/bin/中classify_rhog： classify_rhog [待检测图片] [目标位置数据结果保存的文本文件] [模型文件] -i [位置画在图像文件]amadeuzou@ubuntu:~/Projects/opencv/OLTbinaries/bin$ ./classify_rhog person-1.jpg result.txt model_4BiSVMLight.alt -i result.jpg
结果：

使用lib在OLTbinaries/lib/中：

 
            /* 
          
            * ============================================= 
          
            * 
          
            *       Filename:  lib-detector.cpp 
          
            * 
          
            *    Description:  Code to detect object 
          
            * 
          
            *       Compiler:  gcc 
          
            * 
          
            *         Author:  Amadeu zou 
          
            *         URL:  www.baifaces.com 
          
            * 
          
            * ============================================= 
          
            */ 
          
            #include <cv.h> 
          
            #include <highgui.h> 
          
            #include <string> 
          
            #include <iostream> 
          
            #include <algorithm> 
          
            #include <iterator> 
          
            #include <X11/Xlib.h> 
          
            #include <Imlib2.h> 
          
            #include <lear/interface/windetect.h>// change this path as appropriate. 
          
            using namespace std; 
          
            std::list<DetectedRegion> detector(char* imgf, WinDetectClassify windetect, LinearClassify* classifier) 
          
            { 
          
                std::list<DetectedRegion> detections; 
          
                // read image 
          
                Imlib_Image image = imlib_load_image(imgf); 
          
                // if the load was successful 
          
                if (image) 
          
                {// set the image we loaded as the current context image to work on 
          
                    imlib_context_set_image(image); 
          
                } else { 
          
                    //std::cerr << "Unable to read image: " << argv[1] << std::endl; 
          
                    return detections; 
          
                } 
          
                int width  = imlib_image_get_width(), 
          
                    height = imlib_image_get_height(); 
          
                typedef unsigned char uchar; 
          
                DATA32* data = imlib_image_get_data_for_reading_only(); 
          
                uchar* imagedata = new uchar[3*width*height*sizeof(uchar)]; 
          
                for (int j= 0; j< height; ++j) 
          
                for (int i= 0; i< width; ++i) { 
          
                    uchar* pixel = imagedata+(i+j*width)*3; 
          
                    int argb = data[i+j*width]; 
          
                    pixel[0] = static_cast<uchar>((argb & 0x00FF0000)>>16); 
          
                    pixel[1] = static_cast<uchar>((argb & 0x0000FF00)>> 8); 
          
                    pixel[2] = static_cast<uchar>((argb & 0x000000FF)    ); 
          
                } 
          
                imlib_free_image(); 
          
                // now get detections 
          
                windetect.test(*classifier, detections, imagedata, width, height); 
          
                delete[] imagedata; 
          
                return detections; 
          
            } 
          
            int main(int argc, char** argv) { 
          
                if (argc != 4) { 
          
                    std::cout << "Error" << std::endl; 
          
                    return 0; 
          
                } 
          
                char modelpath[256]; 
          
                strcpy(modelpath,argv[2]); 
          
                string model_file(modelpath) ; 
          
                // initialize the person detector. All default parameters are set for person detector. 
          
                WinDetectClassify windetect;// use default person detector. 
          
                RHOGDenseParam desc; 
          
                LinearClassify* classifier = NULL;// initialize it to 64x128 person detector. 
          
                classifier = new LinearClassify(model_file, 0); 
          
                windetect.init(&desc); // initialize the descriptor computation 
          
                std::list<DetectedRegion> detections; 
          
                detections = detector(argv[1], windetect, classifier); 
          
                //draw region in image 
          
                IplImage* img = cvLoadImage(argv[1],1); 
          
                for(list<DetectedRegion>::iterator itor=detections.begin();itor!=detections.end();++itor) 
          
                { 
          
                     cvRectangle(img,cvPoint(itor->x,itor->y),cvPoint(itor->x+itor->width,itor->y+itor->height),cvScalar(0,0,255),2); 
          
                } 
          
                cvSaveImage(argv[3],img); 
          
                cvReleaseImage(&img); 
          
                //print detections 
          
                std::copy(detections.begin(), detections.end(), std::ostream_iterator<DetectedRegion>(std::cout, "\n")); 
          
                return 0; 
          
            }

编译：

 
            g++ `pkg-config --cflags --libs opencv` -O3 -o lib-detector lib-detector.cpp   -I.  -I/usr/include -L. -lcmdline -lcvip -lclassifier -llearutil -lboost_filesystem-gcc  -lblitz -L/usr/lib -lImlib2 -lfreetype -lz -L/usr/X11R6/lib -lX11 -lXext -ldl -lm

结果：

 
            amadeuzou@ubuntu:~/Projects/opencv/OLTbinaries/lib$ ./lib-detector person-1.jpg   model_4BiSVMLight.alt  result.jpg 
          
               298    215    145    290    2.2674 1.10256009e-01 
          
                13      9    237    475   3.71704 1.31164089e-01 
          
               234     -7    230    460   3.59693 1.35627717e-01

使用源码在learcode/app/中classify_rhog.cpp：配置及使用见learcode/README

Ubuntu/Linux运行安卓全攻略海洋月亮 ubuntu linux android docker scrapy
Ubuntu中使用scrcpy进行Android投屏，当我们手头没开发板没有屏幕的时候，就可以借助ADB和scrcpy进行投屏，很方便:A.这里展示如何在Ubuntu中使用scrcpy+adb+docker方案运行手机Android系统B.使用的模拟器方案基于redroid,能够非常简单方便地在任何Linux上运行Android模拟器C.测试环境:Ubuntu24.04D.需要用到的工具:scrc
ubuntu/centos环境下玩android系统(二): linux下的android模拟器运行！刀客777 linux开发 android linux path swt list java
上一篇完成了Android的编译，想必一定心里痒痒了！这一篇将开始玩转android模拟器！如果不喜欢在linux下运行emulator，可直接看第三篇，第三篇讲述windows下的模拟器，相对linux下，要简单很多！一.下载AndoirdSDK,这次我选择的是android-sdk_r15-linux.tgz安装很简单，直接解压到opt目录下！最好配制一下PATH,以便运行时不用设置PATH环
傻瓜式安装QT+ROS2+Ubuntu22环境(可直接在pro中使用) 牛顶顶大王 Ros qt 开发语言性能优化
结果展示QT版本的订阅者实例/官网的发布者实例1.安装qt我使用的版本5.14.2下载地址现在qt下载无法访问了，需要0.0下载qt-opensource-linux-x64-5.14.2.run直接运行其他环境的安装sudoaptinstallgccsudoaptinstallg++sudoaptinstallclangsudoaptinstallclang++sudoaptinstallmak
ubuntu环境搭建四：安装和使用git 小坚学Linux ubuntu环境搭建 git ubuntu github
1.安装gitsudoapt-getinstallgit2.配置git的名字和邮箱gitconfig--globaluser.name"jian"gitconfig--globaluser.email"[email protected]"gitconfig--globalcore.editorvim提交内核patch的配置gitconfig--globaluser.name"RuijianLi"gi
Ubuntu22+ROS2+QtCreator+Ros_Qtc_Plugin开发环境搭建 ZPC8210 ROS python github git
Ubuntu22+ROS2+QtCreator+Ros_Qtc_Plugin开发环境搭建1.写在前面最近重装了ubuntu22.04，被告知ubuntu22已经不支持ROS1了，想着ROS2毕竟是大势所趋，所以安装了ROS2准备进行相应的学习开发。折腾了两天，没发现一款好用的、适合ROS2开发的IDE。之前开发ROS1程序时一直用的QTC，我本以为QTC应该还没有对应的ROS2插件，没想到网上查找
Python Day44 别勉. python机器学习 python 开发语言
Task：1.预训练的概念2.常见的分类预训练模型3.图像预训练模型的发展史4.预训练的策略5.预训练代码实战：resnet181.预训练的概念预训练（Pre-training）是指在大规模数据集上，先训练模型以学习通用的特征表示，然后将其用于特定任务的微调。这种方法可以显著提高模型在目标任务上的性能，减少训练时间和所需数据量。核心思想：在大规模、通用的数据（如ImageNet）上训练模型，学习丰
Tensorflow 回归模型 FLASK + DOCKER 部署至 Ubuntu 虚拟机
准备工作：安装虚拟机，安装ubuntu，安装python3.x、pip和对应版本的tensorflow和其他库文件,安装docker。注意事项：1.windows系统运行的模型文件不能直接运行到虚拟机上，需在虚拟机上重新运行并生成模型文件2.虚拟机网络状态改为桥接Flask代码如下：fromflaskimportFlask,request,jsonifyimportpickleimportnump
Linux (Ubuntu) conda：未找到命令报错处理司南锤 cs基础 linux linux ubuntu conda
检查安装路径：确认Anaconda或Miniconda是否已经安装。通常，安装路径在用户主目录下，例如~/anaconda3或~/miniconda3。添加路径到环境变量：如果知道Anaconda或Miniconda的安装路径，可以手动将路径添加到环境变量中。例如，如果安装路径是~/anaconda3，可以在终端中输入以下命令：exportPATH=~/anaconda3/bin:$PATH为了使
【福利】简单记录免费的卡密系统小锋学长生活大爆炸学习之旅卡密发卡独角兽免签
转载请注明出处：小锋学长生活大爆炸[xfxuezhang.cn]目录环境搭建独角数卡——发卡用V免签——收款用网络验证——验证用独角数卡与V免签的对接说明体验网址环境搭建#宝塔wget-Oinstall.shhttps://download.bt.cn/install/install-ubuntu_6.0.sh&&sudobashinstall.shed8484bec#Dockersudoapti
uniapp+vue写小程序页面，实现一张图片默认放大后，可以在容器内上下左右拖动查看
1.组件chargingimageViewerimport{ref,onMounted,computed}from'vue';constprops=defineProps({imageUrl:{type:String,required:true,},});//视图容器尺寸constVIEW_WIDTH=750;//微信小程序设计稿宽度constVIEW_HEIGHT=1800;//缩放限制cons
关于java通过背景图生成图片 a未来永远是个未知数 #java的图片处理 java java intellij-idea maven spring boot 图像处理
目录对接部分（碎碎念，可跳过）引入本地jar包文件路径错误尝试解决方案开发部分获取字体的方法关于二维码的生成关于在背景图上添加内容关于在背景图上写字关于在背景图上叠加图片关于保存图片第一次尝试第二次尝试第三次尝试最终方案关于文件读取为MultipartFile类型关于BufferedImage转MultipartFile最近用到了需要生成图片的开发，作为一个没有接触过这个的后端，实在头秃，记录一下
Linux下载Google Chrome OKay_J linux chrome 经验分享笔记
不同发行版上安装GoogleChrome在Ubuntu、Debian和LinuxMint上安装在RedHat、CentOS和Fedora上安装在ArchLinux和Manjaro上安装首先更新安装包sudoapt-getupdate在Ubuntu、Debian和LinuxMint上安装输入以下命令wgethttps://dl.google.com/linux/direct/google-chrom
WSL快速在Ubuntu或者Debian安装golang、python、deno、nodejs、java前后端全栈一体化开发环境配置怪我冷i 云原生 ubuntu debian golang AI写作 AI编程
安装golang#移除旧版本（如有）sudoaptremove--autoremove-ygolang#下载最新版（替换为官网最新版本号）wgethttps://go.dev/dl/go1.24.4.linux-amd64.tar.gz#解压到/usr/localsudorm-rf/usr/local/gosudotar-C/usr/local-xzfgo1.24.4.linux-amd64.ta
Git安装前的准备工作及避坑指南 zzywxc787 开发语言人工智能大数据
一、安装前的准备工作检查系统环境Windows：建议使用Windows10/11，64位系统。macOS：确保系统版本≥10.15（Catalina）。Linux：推荐Ubuntu20.04+、Debian10+或CentOS7+。卸载旧版本安装前删除旧版Git：bash#Linux/macOSsudoapt-getremovegit#Debian/Ubuntusudoyumremovegit#C
【大模型学习 | BLIP2原理】九年义务漏网鲨鱼人工智能深度学习语言模型多模态大模型
BLIP-2:BootstrappingLanguage-ImagePre-trainingwithFrozenImageEncodersandLargeLanguageModels目前（2023）的图文模型都是基于端到端训练方式，大规模的模型和数据集导致了在预训练过程需要的大量计算。作者提出一种从离线、梯度冻结的图像、语言模型中提升图文的预训练模型。为了联系两个不同模态预训练模型，作者提出一种使
【大模型学习 | BLIP原理】九年义务漏网鲨鱼 pytorch 人工智能深度学习大模型多模态
BLIP:BootstrappingLanguage-ImagePre-trainingforUnifiedVision-LanguageUnderstandingandGeneration作者指出，现有的视觉-语言预训练（Vision-LanguagePre-training,VLP）模型在语言理解与生成任务上难以同时取得优异表现：一方面，基于编码器（encoder-based）的模型在生成任务
CVPR2024 分割Segmentation相关论文37篇速览木木阳 CVPR2024 Segmentation 分割论文
Paper1MFP:MakingFullUseofProbabilityMapsforInteractiveImageSegmentation摘要小结:最近的交互式分割算法中，将先前的概率图作为网络输入，以帮助当前分割轮次的预测。然而，尽管使用了先前的掩膜，概率图中包含的有用信息并没有很好地传播到当前预测中。在本文中，为了克服这一局限性，我们提出了一种新颖有效的基于点击的交互式图像分割算法MFP，
Ubuntu下使用ffmpeg封装h264裸流为MP4文件
最近在研究ffmpeg封装h264裸流为MP4相关问题，这里需要解释下为什么要封装h264视频，通过编码器得到的h264视频流仅仅是裸流，只包含一些流的头信息和视频数据，没有时间戳的概念，所以使用播放器播放h264视频时，会出现播放速度不正常的现象（我遇到的是快进现象），所以将h264封装成MP4格式可以添加时间戳的信息进去，即可使用播放器正常播放视频。参考网上的代码（https://blog.c
【图像去噪】论文精读：Linear Combinations of Patches Are Unreasonably Effective for Single-Image Denoising 十小大深度学习图像处理计算机视觉图像去噪人工智能
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言AbstractI.INTRODUCTIONII.APARAMETRICVIEWOFTWO-STEPNON-LOCALMETHODSFORSINGLE-IMAGEDE
输入hadoop version时，解决Cannot execute /home/hadoop/libexec/hadoop-config.sh.的方法有奇妙能力吗 ubuntu hadoop hdfs linux 大数据分布式
在ubuntu用hadoopversion遇到了一个错误：Cannotexecute/home/hadoop/hadoop2.8/libexec/hadoop-config.sh.解决方法：在/etc/profile中找到了这个HADOOP_HOME全局变量，将其删除运行source/etc/profile输入vim.bashrc命令，在最后一行输入unsetHADOOP_HOMEsource.b
Linux软件包管理器命令 lianghu666 Linux命令 linux 服务器 ubuntu
以下是Ubuntu24.04（Debian系）和RedHatEnterpriseLinux9（RedHat系）的软件包管理器命令详解对比表，涵盖核心操作、依赖管理、仓库配置及高级功能：软件包管理器命令对比表（Ubuntu24.04vs.RHEL9）功能Ubuntu24.04(APT/dpkg)RHEL9(DNF/RPM)说明与注意事项核心操作更新软件源sudoaptupdatesudodnfmak
image-webpack-loader 使用教程毛炎宝Gardener
image-webpack-loader使用教程image-webpack-loaderImageloadermoduleforwebpack项目地址:https://gitcode.com/gh_mirrors/im/image-webpack-loader1.项目目录结构及介绍image-webpack-loader是一个用于Webpack的图片压缩加载器。由于该仓库主要是npm包而非独立的应
flutter滑块验证 zqwily flutter android
import'dart:convert';import'dart:math';import'package:flutter/cupertino.dart';import'package:flutter/material.dart';import'package:toptongpin/app/common/widgets/image/local_image.dart';import'package:
（25.07）解决——ubuntu20.04系统开机黑屏，左上角光标闪烁 kikikidult 报错记录 ubuntu 笔记
前面一些碎碎念：电脑装的双系统，之前都还好着，今天突然ubuntu开机的时候黑屏了，左上角有光标在闪烁，也查了一些资料，基本上大家的都是驱动有问题，还有内存问题。（个人建议：谨慎删除驱动或重装之类的操作，防止因操作不当导致一系列的麻烦）看了一些教程，说下我的调试之路吧。。。在黑屏，光标闪烁的那一页，ctrl+shift+f1，然后出现login，输入用户名和密码，下面就会出现和终端一样的界面，我尝
【T2I】R&B: REGION AND BOUNDARY AWARE ZERO-SHOT GROUNDED TEXT-TO-IMAGE GENERATION Akttt T2I 计算机视觉人工智能 text2img 深度学习
CODE:2309https://github.com/StevenShaw1999/RnBABSTRACT近期的文本到图像（T2I）扩散模型在以文本提示作为输入生成高质量图像方面取得了显著进展。然而，这些模型无法传达布局指令所指定的合适空间构图。在这项工作中，我们探索了使用扩散模型进行零样本接地T2I生成，即无需训练辅助模块或微调扩散模型就能生成与输入布局信息相对应的图像。我们提出了一种区域与边
ubuntu安装配置fail2ban 你都会上树？ Linux ubuntu linux 运维
Fail2Ban概述Fail2Ban是一种用于防止暴力破解攻击的安全工具，它通过监控系统的日志文件（如/var/log/auth.log）来检测异常的登录尝试，并自动将可疑的IP地址加入黑名单，从而阻止其进一步的访问请求。Fail2Ban的工作原理日志监控：Fail2Ban持续监控指定的日志文件，寻找失败的登录尝试记录。规则匹配：根据预设的规则（如连续失败的次数和时间间隔），Fail2Ban识别出
MFC小例子说明千里修行 MFC Windows
目录一.枚举窗口EnumDialog1.枚举方式2.查找窗口3.检测当前应用程序是否存在二.按钮激活ButtonActive1.原理2.实现三.星形查看器AsterPassword1.原理2.实现四.图片浏览器ImageExplore1.原理2.实现五.模拟键鼠消息MouseKeboardClick1.原理2.实现六.屏幕放大镜ScreenMagnify1.原理2.实现七.屏幕截图功能SCreen
Dimba: Transformer-Mamba Diffusion Models————3 Methodology
图解图片中的每个模块详解1.文本输入(Text)描述：输入的文本描述了一个具有具体特征的场景。功能：提供关于要生成图像的详细信息。2.T5模型(TexttoFeature)描述：使用T5模型将文本转换为特征向量。功能：提取文本中的语义信息，为后续的图像生成提供条件。3.图像输入(Image)描述：输入图像通过变分自编码器(VAE)编码器处理。功能：将图像转换为潜在表示，用于添加噪声并进行扩散过程。
OpenCV CUDA模块设备层-----双曲正切函数tanh() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV的CUDA模块（cudev）中的一个设备函数，用于在GPU上对uchar4类型的向量（如RGBA像素）进行双曲正切（hyperbolictangent）运算，并返回一个float4类型的结果。函数原型__device____forceinline__f
OpenCV CUDA模块设备层-----二值化阈值操作函数thresh_binary_func()
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV的CUDA模块（cudev）中的一个设备和主机通用函数（host/devicefunction），用于创建一个二值化阈值操作函数对象（functor）。这个函数返回一个仿函数（functor），用于在GPU上执行二值化阈值处理（ThresholdBin
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

HOG Detector ~ Training OLTbinaries

你可能感兴趣的:(image,ubuntu,Parameters,compiler,Descriptor,Training)