Pre_Con

Faster-RCNN+ZF用自己的数据集训练模型(Matlab版本)

本文为转载，仅供本人学习，如有侵权，本人将立刻删除：

原博客地址链接：http://blog.csdn.net/sinat_30071459/article/details/50546891

[置顶] Faster-RCNN+ZF用自己的数据集训练模型(Matlab版本)

目录(?)[+]

说明：本博文假设你已经做好了自己的数据集，该数据集格式和VOC2007相同。下面是训练前的一些修改。

（做数据集的过程可以看http://blog.csdn.net/sinat_30071459/article/details/50723212）

Faster-RCNN源码下载地址：

Matlab版本：https://github.com/ShaoqingRen/faster_rcnn

python版本:https://github.com/rbgirshick/py-faster-rcnn

本文用到的是Matlab版本，在Windows下运行。

python版本的训练过程：http://blog.csdn.net/sinat_30071459/article/details/51332084

资源下载：https://github.com/ShaoqingRen/faster_rcnn，网页最后有所有的资源。

准备工作：

（1）

安装vs2013；

安装Matlab；

安装CUDA；

上面的安装顺序最好不要乱，否则可能出现Matlab找不到vs的情况，在Matlab命令行窗口输入：mbuild -setup，如果出现：

说明Matlab可以找到vs2013。CUDA应在安装vs2013后再安装。

（2）

如果你的cuda是6.5，那么，运行一下：

[plain]  view plain 
       copy 
      
 fetch_data/fetch_caffe_mex_windows_vs2013_cuda65.m  

（运行代码下载失败的话，用百度云下载：https://pan.baidu.com/s/1i3m0i0H ，解压到faster_rcnn-master下）

得到mex文件。如果不是cuda6.5（如我的是cuda7.5），则需要自己编译mex文件，编译过程参考这里：Caffe for Faster R-CNN，按步骤做就行了。

也可以下载我编译得到的文件（注意cuda版本）。

下载地址：Faster-RCNN(Matlab) external文件夹

建议还是自己编译，因为版本问题可能会出错。在训练前，可以先下载作者训练好的模型，测试一下，如果可以的话，就不用自己编译了。

测试过程：

（1）运行faster_rcnn-master\faster_rcnn_build.m

（2）运行faster_rcnn-master\startup.m

（3）运行faster_rcnn-master\fetch_data\fetch_faster_rcnn_final_model.m 下载训练好的模型

（下载失败的话，可以用百度云下载：https://pan.baidu.com/s/1hsFKmeK ，解压到faster_rcnn-master下）

（4）修改faster_rcnn-master\experiments\script_faster_rcnn_demo.m的model_dir为你下载的模型，然后运行。

最终得到：

在训练前请确保你的路径faster_rcnn-master\external\caffe\matlab\caffe_faster_rcnn下有以下文件：

Faster-RCNN+ZF用自己的数据集训练模型(Matlab版本)_第4张图片

（我的opencv版本是2.4.9，cuda版本是7.5，因版本不同上述文件和你的编译结果可能会有差异。+caffe文件夹是从caffe-master或caffe-faster-R-CNN里拷贝过来的。）

如果你没有按上面说的测试过，请先运行：

（1）faster_rcnn-master\faster_rcnn_build.m

（2）faster_rcnn-master\startup.m

然后再进行下面的修改。

1 、VOCdevkit2007\VOCcode\VOCinit.m的修改

（1）路径的修改

[plain]  view plain 
       copy 
      
 VOCopts.annopath=[VOCopts.datadir VOCopts.dataset '/Annotations/%s.xml'];  
 VOCopts.imgpath=[VOCopts.datadir VOCopts.dataset '/JPEGImages/%s.jpg'];  
 VOCopts.imgsetpath=[VOCopts.datadir VOCopts.dataset '/ImageSets/Main/%s.txt'];  
 VOCopts.clsimgsetpath=[VOCopts.datadir VOCopts.dataset '/ImageSets/Main/%s_%s.txt'];  
 VOCopts.clsrespath=[VOCopts.resdir 'Main/%s_cls_' VOCopts.testset '_%s.txt'];  
 VOCopts.detrespath=[VOCopts.resdir 'Main/%s_det_' VOCopts.testset '_%s.txt'];  

上面这些路径要正确，第一个是xml标签路径；第二个是图片的路径；第三个是放train.txt、val.txt、test.txt和trainval.txt的路径；第四、五、六个不需要；一般来说这些路径不用修改，你做的数据集格式和VOC2007相同就行。（图片格式默认是jpg，如果是png，修改上面第二行的代码即可。）

（2）训练集文件夹修改

[plain]  view plain 
        copy 
       
 VOCopts.dataset = '你的文件夹名';   

然后将VOC2007路径注释掉，上面“你的文件夹名”是你放Annotations、ImageSets、JPEGImages文件夹的文件夹名。

（3）标签的修改

[plain]  view plain 
       copy 
      
 VOCopts.classes={...  
    '你的标签1'  
    '你的标签2'  
    '你的标签3'  
    '你的标签4'};  

将其改为你的标签。

2 、VOCdevkit2007\results

results下需要新建一个文件夹，名字是1. (2)中“你的文件夹名”。“你的文件夹名”下新建一个Main文件夹。(因为可能会出现找不到文件夹的错误)

3 、VOCdevkit2007\local

local下需要新建一个文件夹，名字是1. (2)中“你的文件夹名”。（同上）

4 、function\fast_rcnn\fast_rcnn_train.m

[plain]  view plain 
       copy 
      
 ip.addParamValue('val_iters',       500,            @isscalar);   
 ip.addParamValue('val_interval',    2000,           @isscalar);  

可能在randperm(N,k)出现错误，根据数据集修改。（VOC2007中val有2510张图像，train有2501张，作者将val_iters设为500，val_interval设为2000，可以参考作者的设置修改，建议和作者一样val_iters约为val的1/5，val_interval不用修改）

5、function\rpn\proposal_train.m

这里的问题和fast_rcnn_train.m一样。

6.imdb\imdb_eval_voc.m

[plain]  view plain 
       copy 
      
 %do_eval = (str2num(year) <= 2007) | ~strcmp(test_set,'test');  
 do_eval = 1;  

注释掉

[plain]  view plain 
       copy 
      
 do_eval = (str2num(year) <= 2007) | ~strcmp(test_set,'test');  

并令其为1，否则测试会出现精度全为0的情况

7. imdb\roidb_from_voc.m

[plain]  view plain 
        copy 
       
 ip.addParamValue('exclude_difficult_samples',       true,   @islogical);  

不包括难识别的样本，所以设置为true。(如果有就设置为false)

8.网络模型的修改

（1） models\ fast_rcnn_prototxts\ZF\ train_val.prototxt

[plain]  view plain 
        copy 
       
 input: "bbox_targets"  
 input_dim: 1  # to be changed on-the-fly to match num ROIs  
 input_dim: 84 # 根据类别数改，该值为（类别数+1）*4  #################  
 input_dim: 1  
 input_dim: 1  

[plain]  view plain 
        copy 
       
 input: "bbox_loss_weights"  
 input_dim: 1  # to be changed on-the-fly to match num ROIs  
 input_dim: 84 # 根据类别数改，该值为（类别数+1）*4   ############  
 input_dim: 1  
 input_dim: 1  

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "cls_score"  
     name: "cls_score"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     type: "InnerProduct"  
     inner_product_param {  
         num_output: 21 #根据类别数改该值为类别数+1   #########  

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "bbox_pred"  
     name: "bbox_pred"  
     type: "InnerProduct"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     inner_product_param {  
         num_output: 84  #根据类别数改，该值为（类别数+1）*4  ##########  

（2） models\ fast_rcnn_prototxts\ZF\ test.prototxt

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "cls_score"  
     name: "cls_score"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     type: "InnerProduct"  
     inner_product_param {  
         num_output: 21  #类别数+1  ##########  

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "bbox_pred"  
     name: "bbox_pred"  
     type: "InnerProduct"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     inner_product_param {  
         num_output: 84  #4*(类别数+1)  ##########  

（3） models\ fast_rcnn_prototxts\ZF_fc6\ train_val.prototxt

[plain]  view plain 
        copy 
       
 input: "bbox_targets"  
 input_dim: 1  # to be changed on-the-fly to match num ROIs  
 input_dim: 84 # 4*(类别数+1)  ###########  
 input_dim: 1  
 input_dim: 1  

[plain]  view plain 
        copy 
       
 input: "bbox_loss_weights"  
 input_dim: 1  # to be changed on-the-fly to match num ROIs  
 input_dim: 84 # 4*(类别数+1)  ###########  
 input_dim: 1  
 input_dim: 1  

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "cls_score"  
     name: "cls_score"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     type: "InnerProduct"  
     inner_product_param {  
         num_output: 21 #类别数+1   ############  

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top:"bbox_pred"  
     name:"bbox_pred"  
     type:"InnerProduct"  
     param {  
        lr_mult:1.0  
     }  
     param {  
        lr_mult:2.0  
     }  
     inner_product_param{  
        num_output: 84   #4*（类别数+1）   ###########  

（4） models\ fast_rcnn_prototxts\ZF_fc6\ test.prototxt

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "cls_score"  
     name: "cls_score"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     type: "InnerProduct"  
     inner_product_param {  
         num_output: 21  类别数+1 #######  

[plain]  view plain 
        copy 
       
 layer {  
     bottom: "fc7"  
     top: "bbox_pred"  
     name: "bbox_pred"  
     type: "InnerProduct"  
     param {  
         lr_mult: 1.0  
     }  
     param {  
         lr_mult: 2.0  
     }  
     inner_product_param {  
         num_output: 84  #4*（类别数+1） ##########  

9.solver的修改

solver文件有3个，默认使用的solver是solver_30k40k.prototxt，如下stage 1 rpn，可以在faster_rcnn-master\experiments\+Model\ZF_for_Faster_RCNN_VOC2007.m中更换。

[plain]  view plain 
        copy 
       
 model.stage1_rpn.solver_def_file                = fullfile(pwd, 'models', 'rpn_prototxts', 'ZF', 'solver_30k40k.prototxt');%solver_60k80k.prototxt  
 model.stage1_rpn.test_net_def_file              = fullfile(pwd, 'models', 'rpn_prototxts', 'ZF', 'test.prototxt');  
 model.stage1_rpn.init_net_file                  = model.pre_trained_net_file;  

！！！为防止与之前的模型搞混,训练前把output文件夹删除（或改个其他名），还要把imdb\cache中的文件删除（如果有的话）

更为简便的方法是直接用你的数据集的Annotations、ImageSets、JPEGImages文件夹替换VOC2007对应文件夹，那么上面只需进行1.（3）、4、5、7、8的修改。

10.开始训练

（1）.下载预训练的ZF模型： fetch_data/fetch_model_ZF.m

（下载失败的话用百度云下载：https://pan.baidu.com/s/1o6zipPS ，解压到faster_rcnn-master下，预训练模型参数用于初始化）

（2）.运行：

[plain]  view plain 
        copy 
       
 experiments/script_faster_rcnn_VOC2007_ZF.m  

经过一会的准备工作，就进入迭代了：

11.训练完后

训练完后，不要急着马上测试，先打开output/faster_rcnn_final/faster_rcnn_VOC2007_ZF文件夹，打开detection_test.prototxt，作如下修改：

将relu5（包括relu5）前的层删除，并将roi_pool5的bottom改为data和rois。并且前面input: "data"下的input_dim:分别改为1,256,50,50(如果是VGG就是1,512,50,50,其他修改基本一样)，具体如下

[plain]  view plain 
         copy 
        
 input: "data"  
 input_dim: 1  
 input_dim: 256  
 input_dim: 50  
 input_dim: 50  

[plain]  view plain 
         copy 
        
 # ------------------------ layer 1 -----------------------------  
 layer {  
     bottom: "data"  
     bottom: "rois"  
     top: "pool5"  
     name: "roi_pool5"  
     type: "ROIPooling"  
     roi_pooling_param {  
         pooled_w: 6  
         pooled_h: 6  
         spatial_scale: 0.0625  # (1/16)  
     }  
 }  

12.测试

训练完成后，打开\experiments\script_faster_rcnn_demo.m，将模型路径改成训练得到的模型路径：

[plain]  view plain 
         copy 
        
 model_dir                   = fullfile(pwd, 'output', 'faster_rcnn_final', 'faster_rcnn_VOC2007_ZF')  

将测试图片改成你的图片：

[plain]  view plain 
         copy 
        
 im_names = {'001.jpg', '002.jpg', '003.jpg'};  

注意：

如果你的数据集类别比voc2007数据集多，把script_faster_rcnn_demo.m中的showboxes(im, boxes_cell, classes, 'voc')作如下修改：

改为：

[plain]  view plain 
         copy 
        
 showboxes(im, boxes_cell, classes);  

或者：

[plain]  view plain 
         copy 
        
 showboxes(im, boxes_cell, classes, 'default');  

即去掉‘voc’或将其改为‘default’。

如果测试发现出现的框很多，且这些框没有目标，可以将阈值设高一些（默认是0.6）：

[html]  view plain 
         copy 
        
 thres = 0.9;  

结果如下：

Faster-RCNN+ZF用自己的数据集训练模型(Matlab版本)_第6张图片

遥感影像目标检测：从CNN（Faster-RCNN）到Transformer（DETR）岁月如歌，青春不败生态遥感目标检测 cnn transformer 遥感遥感影像
我国高分辨率对地观测系统重大专项已全面启动，高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成，将成为保障国家安全的基础性和战略性资源。未来10年全球每天获取的观测数据将超过10PB，遥感大数据时代已然来临。一：深度卷积网络知识1.深度学习在遥感图像识别中的范式和问题2.深度学习的历史发展历程3.机器学习，深度学习等任务的基本处理流程4.卷积神经网络的基本原理5
目标检测实践过程中，遇到“No module named ‘torch._six’”报错的一个快速解决方案（无需重装PyTorch） Cold_Rain02 深度学习 Python 目标检测人工智能计算机视觉
很多人在按照网络、书籍教程中的流程尝试自己实现一个基于Faster-RCNN的目标检测模型时，如果调用了PyTorch官方github上的文件时，coco_eval.py文件中会触发报错。1.报错原因PyTorch在2.0之后的版本中移除了_six，导致在coco_eval.py中调用torch._six失败2.解决方案（1）直接根据代码内容修改代码我们仔细观察coco_eval.py的代码，发现
c++读取图片_四、faster-rcnn源码阅读：数据流读取 weixin_39719078 c++读取图片 img标签读取本地图片 os如何读取图片 torch dataloader 数据并行
数据读取在faster-rcnn源码里是比较简单的部分，但也是非常重要的部分，不了解数据，就不可能了解算法。另一方面，由于python环境碎片话化，源码调用的库在你的电脑上如果碰巧（其实概率还蛮大，特别是windows下）不能用，完全可以用另外一种等价的方式取代。一、图片读取就是把图片转化成矩阵，等待下一个流程进一步处理。图片读取要注意不是所有都是RGB顺序读取1.cv2（OpenCV-Pytho
Transformer实战-系列教程13：DETR 算法解读机器学习杨卓越 Transformer实战 transformer 深度学习 DETR 物体检测
Transformer实战-系列教程总目录有任何问题欢迎在下面留言本篇文章的代码运行界面均在Pycharm中进行本篇文章配套的代码资源已经上传点我下载源码1、物体检测说到目标检测你能想到什么faster-rcnn系列，开山之作，各种proposal方法YOLO肯定也少不了，都是基于anchor这路子玩的NMS那也一定得用上，输出结果肯定要过滤一下的如果一个目标检测算法，上面这三点都木有，你说神不神
目标检测SSD：训练自己的数据集 BigCowPeking 目标检测算法安装 SSD
最近一直在搞objectdetection玩，之前用的是faster-rcnn，准确率方面73.2%，效果还不错，但是识别速度有点欠缺，我用的GPU是GTX980ti,识别速度大概是15fps.最近发现SSD(singleshotmultiboxdetector)这篇论文效果和速度都不错，我自己实验了一下，速度确实比faster-rcnn快不少。下面分两部分来介绍。第一部分介绍SSD的安装，第二部
YOLO系列 Array902 YOLO python 深度学习
深度学习经典检测方法two-stage（两阶段）：Faster-rcnn\Mask-Rcnn系列（两阶段即多了一步预选操作）one-stage（单阶段）：YOLO系列（直接处理，不需要对数据进行预选）one-stage:最核心的优势：速度非常快，适合做实时监测任务！但是缺点也是有的，效果通常情况下不会太好！（速度越快效果越差，二者相互有些矛盾）mAP：效果好坏FPS：速度快慢two-stage:速
目标检测 Faster-RCNN 石中璇深度学习
文章目录标题目标检测算法：Faster-RCNNR-CNNRegionProposals候选区域RCNN结构原理RCNN存在的问题用SPP-Net改进（spatialpyramidpoolinglayer空间金字塔池化）FastR-CNNFastR-CNN结构图FastR-CNN的缺陷FasterR-CNN标题目标检测算法：Faster-RCNNR-CNNRegionProposals候选区域原先
caffe版本Faster-RCNN：py-faster-rcnn-master/lib/datasets/factory.py ->用于集成程序默认提供的数据集 a1103688841
分析：这个代码分两个部分：1）首先往__sets()字典的key中注入名字，往对应的val中注入对应的初始化函数。下次只要在__sets()字典中输入key的名字就可以执行对应的初始化函数。__sets（）的具体情况如下：2）get_imdb(name)用于配套__sets()的初始化，输入__sets（）中存在key，调用他对应的val进行初始化list_imdbs()用于配套__sets()，
Multi-adversarial Faster-RCNN with Paradigm Teacher for Unrestricted Object Detection 宇来风满楼目标检测目标检测人工智能计算机视觉算法深度学习机器学习神经网络
GRLmeans‘gradientreversedlayer’，SRMmeans‘ScaleReduceModule’.DiscriminatorsubmoduleatthemmmthblockisdenotedasDm^mm作者未提供代码
R-C3D论文详解 ce0b74704937
论文链接：R-C3D:RegionConvolutional3DNetworkforTemporalActivityDetection代码地址（论文提供地址）：http://ai.bu.edu/r-c3d/该论文借鉴图像物体检测中的Faster-RCNN的思想，文章采用3D卷积来获取视频的时序信息，然后通过类似Faster-RCNN的rpn层和roi层输出时间维度的boundingbox，也就是视
【Digest】YOLO系列：YOLOv1,YOLOv2,YOLOv3,YOLOv4,YOLOv5简介 gikod YOLO
1.前言论文下载：http://arxiv.org/abs/1506.02640代码下载：https://github.com/pjreddie/darknet核心思想：将整张图片作为网络的输入（类似于Faster-RCNN），直接在输出层对BBox的位置和类别进行回归。目标检测之YOLO算法：YOLOv1,YOLOv2,YOLOv3,TinyYOLO,YOLOv4,YOLOv5,YOLObile
学习笔记：Pytorch 搭建自己的Faster-RCNN目标检测平台 hongyuyahei vqa 学习笔记 pytorch
B站学习视频up主的csdn博客1、什么是FasterR-CNN2、pytorch-gpu环境配置（跳过）3、FasterR-CNN整体结构介绍Faster-RCNN可以采用多种的主干特征提取网络，常用的有VGG，Resnet，Xception等等。Faster-RCNN对输入进来的图片尺寸没有固定，但一般会把输入进来的图片短边固定成600.4、Resnet50-主干特征提取网络介绍具体学习见：R
MMdetection3.0 报错data[‘category_id‘] = self.cat_ids[label] IndexError: list index out of range MZYYZT MMdetection python 深度学习 MMdetection3.0
MMdetection3.0问题报错data[‘category_id’]=self.cat_ids[label]IndexError:listindexoutofrange痛苦，希望各位大佬看到后可以指教一下：问题：在使用MMdetection3.0训练NWPU-VHR-10数据时，使用Yolov3模型可以正常训练测试，但是当使用Faster-rcnn模型训练的时候，一直如下图所示错误。1、按照
MMdetection3.0 问题 MZYYZT MMdetection python 目标检测 MMdetection3.0 python 深度学习目标检测
MMdetection3.0问题希望各位路过的大佬指教一下：问题：1、NWPU-VHR-10有标注的数据一共650张，我将其分为了455张训练集，195张验证集。2、然后使用MMdetection3.0框架中的Faster-rcnn网络进行训练，设置训练参数batch-size=2,num_worker=2。3、那么问题来了：为什么下图中的画圈的地方不是【**/228or227】，也就是datal
YOLO系列/20230903 lucharaar YOLO
深度学习经典检测方法1.two-stage（分两阶段）：Faster-Rcnn和Mask-Rcnn系列-------检测过程中加了预选框步骤速度通常较慢（5FPS），但是效果通常不错非常实用的通用框架Mask-Rcnn，需要了解2.one-stage（单阶段）：YOLO系列------当我们想做检测任务，一个cnn网络直接做一个回归任务就可以，中间不需要加额外的补充最核心的优势：速度非常快，适合做
目标检测｜实战总结 voice_an
1.实现ssd-keras实时目标检测算法，并制作十张图片的测试集。效果一般。ssd算法是继faster-rcnn与yolo之后的又一力作。来自UNC团队2016年发表在ECCV上。SSD最大的特点就是在较高的准确率下实现较好的检测准确度。并非为两种模型：SSD300（300*300输入图片），SSD500（512*512输入图片）。当然输入图片的尺寸越大，往往会得到更好的检测准确率，但同时也带来
第五章目标检测中K-means聚类生成Anchor box(工具) 小酒馆燃着灯目标检测深度学习工具目标检测 kmeans 聚类
基础理论在基于anchor的目标检测算法中，anchor一般都是通过人工设计的。例如，在SSD、Faster-RCNN中，设计了9个不同大小和宽高比的anchor。然而，通过人工设计的anchor存在一个弊端，就是并不能保证它们一定能很好的适合数据集，如果anchor的尺寸和目标的尺寸差异较大，则会影响模型的检测效果。在论文YOLOv2中提到了这个问题，作者建议使用K-means聚类来代替人工设计
YOLO系列详解（YOLO1-YOLO5）陈子迩深度学习学习笔记 python pandas 机器学习
目录前言二、YOLOv1举例说明：三、YOLOv2四、YOLOv3五、YOLOv4框架原理5.4.5余弦模拟退火5.5.2DIoU-NMS六YOLOv5七、YOLOv6前言一、前言YOLO系列是one-stage且是基于深度学习的回归方法，而R-CNN、Fast-RCNN、Faster-RCNN等是two-stage且是基于深度学习的分类方法。YOLO官网：GitHub-pjreddie/dark
pkl文件的简介（Python中的Pickle）北岛寒沫 Python python 开发语言
文章目录Pickle模块简介Pickle模块的使用最近从Github上下载了一个预训练好的Faster-RCNN模型用于科研任务，突然对该文件的格式，.pkl文件产生了一丝疑惑，便去特意了解了一下该格式的文件的含义，下面与大家共享。Pickle模块简介.pkl是Python中pickle模块的默认文件扩展名。pickle是Python中的一个模块，它允许您序列化和反序列化Python对象结构。“序
SSD安装及训练自己的数据集 zhang_shuai12 深度学习 ssd caffe
最近一直在搞objectdetection玩，之前用的是faster-rcnn，准确率方面73.2%，效果还不错，但是识别速度有点欠缺，我用的GPU是GTX980ti,识别速度大概是15fps.最近发现SSD(singleshotmultiboxdetector)这篇论文效果和速度都不错，我自己实验了一下，速度确实比faster-rcnn快不少。下面分两部分来介绍。第一部分介绍SSD的安装，第二部
在AI Studio中配置faster-rcnn pytorch环境 ForesterZz cuda
在AIStudio中配置faster-rcnnpytorch环境AIStudio自带cuda版本faster-rcnn的pytorch版本支持AIStudio自带cuda版本AIStudio目前有两个版本的cuda（cuda9.2和cuda10），不过我从没分配到过cuda10，大部分都是cuda9.2。使用以下语句查看cuda版本。cat/usr/local/cuda/version.txtfa
使用mmdetection训练模型--记faster-rcnn不同backbone性能比较 hedgehogbb 工作总结深度学习目标检测 pytorch
使用mmdetection训练模型一、安装采用的是直接安装，并未使用在conda中建虚拟环境。主要安装的有mmcv和mmdet，其中mmcv的安装与下载的mmdetction版本有关，参考https://mmdetection.readthedocs.io/zh_CN/v2.18.1/get_started.html#id官网安装依赖教程中的mmdetection版本和mmcv版本的对应关系安装。
基于Pytorch的从零开始的目标检测金戈鐡馬深度学习 pytorch 目标检测人工智能深度学习 python
引言目标检测是计算机视觉中一个非常流行的任务，在这个任务中，给定一个图像，你预测图像中物体的包围盒(通常是矩形的)，并且识别物体的类型。在这个图像中可能有多个对象，而且现在有各种先进的技术和框架来解决这个问题，例如Faster-RCNN和YOLOv3。本文讨论将讨论图像中只有一个感兴趣的对象的情况。这里的重点更多是关于如何读取图像及其边界框、调整大小和正确执行增强，而不是模型本身。目标是很好地掌握
YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进【NO.78】引入2023年华为诺亚提出Gold-YOLO模型中Gatherand-Distribute 人工智能算法研究院 YOLO算法改进系列 YOLO 算法
前言作为当前先进的深度学习目标检测算法YOLOv8，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv8的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv8，YOLOv7、YOLOv5算法2020年至今已经涌现出大
YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进【NO.79】改进损失函数为VariFocal Loss 人工智能算法研究院 YOLO算法改进系列 YOLO 算法目标跟踪
前言作为当前先进的深度学习目标检测算法YOLOv8，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv8的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv8，YOLOv7、YOLOv5算法2020年至今已经涌现出大
CV综述OCR任务---目录慕一Chambers 图像分类 CNN 深度学习机器学习
CV综述OCR任务---目录图像任务OCR任务图像分类目标检测图像分割图像增强视频任务正文：OCR学习OCR参考资料:参考博客:典型应用常见挑战比赛经典OCR方法单字符识别方法序列识别方法tessernet文字检测模型Part(thinkaboutCV中的目标检测)faster-RCNN/YOLO/SSDCTPN(2016):ConnectionistTextProposalNetworkEAST
第五章目标检测中K-means聚类生成Anchor box(工具) 小酒馆燃着灯机器学习工具深度学习目标检测 kmeans 聚类
第一种做法在基于anchor的目标检测算法中，anchor一般都是通过人工设计的。例如，在SSD、Faster-RCNN中，设计了9个不同大小和宽高比的anchor。然而，通过人工设计的anchor存在一个弊端，就是并不能保证它们一定能很好的适合数据集，如果anchor的尺寸和目标的尺寸差异较大，则会影响模型的检测效果。在论文YOLOv2中提到了这个问题，作者建议使用K-means聚类来代替人工设
YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进【NO.77】引入百度最新提出RT-DETR模型中AIFI模块人工智能算法研究院 YOLO算法改进系列 YOLO 算法目标跟踪
前言作为当前先进的深度学习目标检测算法YOLOv8，已经集合了大量的trick，但是还是有提高和改进的空间，针对具体应用场景下的检测难点，可以不同的改进方法。此后的系列文章，将重点对YOLOv8的如何改进进行详细的介绍，目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。由于出到YOLOv8，YOLOv7、YOLOv5算法2020年至今已经涌现出大
mmdetection安装与训练不减到100斤不吃锅包肉深度学习 pytorch 深度学习
一、什么是mmdetection商汤科技（2018COCO目标检测挑战赛冠军）和香港中文大学最近开源了一个基于Pytorch实现的深度学习目标检测工具箱mmdetection，支持Faster-RCNN，Mask-RCNN，Fast-RCNN等主流的目标检测框架，后续会加入Cascade-RCNN以及其他一系列目标检测框架。二、mmdetection安装本人安装环境：系统环境：Ubuntu20.0
安装yolo,mmlab，等工具时pycocotools报错 zRezin YOLO 深度学习人工智能计算机视觉
安装yolo的时候，因为是白板机，很多依赖都没有安装。安装yolo的依赖时候会报错。其实如果安装其他的视觉框架，例如yolov系列，mmlab，faster-rcnn等只要是用到了coco数据集的预置框架，都需要安装pycocotools。conda环境下依赖安装可能报错，可能是因为环境版本不匹配。需要手动安装报错语句如下ERROR:Couldnotbuildwheelsforpycocotool
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb