baobei0112

Fast RCNN 训练自己的数据集（3训练和检测）

时间 2015-10-24 13:33:00 博客园精华区

原文 http://www.cnblogs.com/louyihang-loves-baiyan/p/4906690.html

主题技术

在之前两篇文章中我介绍了怎么编译Fast RCNN，和怎么修改Fast RCNN的读取数据接口，接下来我来说明一下怎么来训练网络和之后的检测过程

先给看一下极好的检测效果

1.预训练模型介绍

首先在data目录下，有两个目录就是之前在1中解压好

fast_rcnn_models/
imagenet_models/

fast_rcnn_model文件夹下面是作者用fast rcnn训练好的三个网络,分别对应着小、中、大型网络，大家可以试用一下这几个网络，看一些检测效果，他们训练都迭代了40000次，数据集都是pascal_voc的数据集。

caffenet_fast_rcnn_iter_40000.caffemodel
vgg_cnn_m_1024_fast_rcnn_iter_40000.caffemodel
vgg16_fast_rcnn_iter_40000.caffemodel

imagenet_model文件夹下面是在Imagenet上训练好的通用模型，在这里用来初始化网络的参数

CaffeNet.v2.caffemodel
VGG_CNN_M_1024.v2.caffemodel
VGG16.v2.caffemodel

在这里我比较推荐先用中型网络训练，中型网络训练和检测的速度都比较快，效果也都比较理想，大型网络的话训练速度比较慢，我当时是5000多个标注信息，网络配置默认，中型网络训练大概两三个小时，大型网络的话用十几个小时，需要注意的是网络训练最好用GPU，CPU的话太慢了，我当时用的实验室的服务器，有16块Tesla K80，用起来真的是灰常爽！

2. 修改模型文件配置

模型文件在models下面对应的网络文件夹下，在这里我用中型网络的配置文件修改为例子

因此，首先打开网络的模型文件夹，打开train.prototxt

修改的地方重要有三个

分别是个地方

首先在data层把num_classes 从原来的21类 20类+背景，改成 2类车+背景
接在在cls_score层把num_output 从原来的21 改成 2
在bbox_pred层把num_output 从原来的84 改成8，为检测类别个数乘以4，比如这里是2类那就是2*4=8

OK，如果你要进一步修改网络训练中的学习速率，步长，gamma值，以及输出模型的名字，需要在同目录下的solver.prototxt中修改。如下图：

train_net: "models/VGG_CNN_M_1024/train.prototxt"
base_lr: 0.001
lr_policy: "step"
gamma: 0.1
stepsize: 30000
display: 20
average_loss: 100
momentum: 0.9
weight_decay: 0.0005
# We disable standard caffe solver snapshotting and implement our own snapshot
# function snapshot: 0 # We still use the snapshot prefix, though snapshot_prefix: "vgg_cnn_m_1024_fast_rcnn" #debug_info: true

3.启动Fast RCNN网络训练

启动训练：
./tools/train_net.py --gpu 11 --solver models/VGG_CNN_M_1024_LOUYIHANG/solver.prototxt --weights data/imagenet_models/VGG_CNN_M_1024.v2.caffemodel --imdb KakouTrain

参数讲解：

这里的--是两个-，markdown写的，大家不要输错
train_net.py是网络的训练文件，之后的参数都是附带的输入参数
--gpu 代表机器上的GPU编号，如果是nvidia系列的tesla显卡，可以在终端中输入nvidia-smi来查看当前的显卡负荷，选择合适的显卡
--solver 代表模型的配置文件，train.prototxt的文件路径已经包含在这个文件之中
--weights 代表初始化的权重文件，这里用的是Imagenet上预训练好的模型，中型的网络我们选择用VGG_CNN_M_1024.v2.caffemodel
--imdb 这里给出的训练的数据库名字需要在factory.py的__sets中，我在文件里面有__sets['KakouTrain']，train_net.py这个文件会调用factory.py再生成kakou这个类，来读取数据

4.启动Fast RCNN网络检测

我修改了tools下面的demo.py这个文件，用来做检测，并且将检测的坐标结果输出到相应的txt文件中可以看到原始的demo.py 是用网络测试了两张图像，并做可视化输出，有具体的检测效果，但是我是在Linux服务器的终端下，没有display device，因此部分代码要少做修改

下面是原始的demo.py：

#!/usr/bin/env python
# --------------------------------------------------------
# Fast R-CNN
# Copyright (c) 2015 Microsoft
# Licensed under The MIT License [see LICENSE for details]
# Written by Ross Girshick
# --------------------------------------------------------
""" Demo script showing detections in sample images. See README.md for installation instructions before running. """
import _init_paths
from fast_rcnn.config import cfg
from fast_rcnn.test import im_detect
from utils.cython_nms import nms
from utils.timer import Timer
import matplotlib.pyplot as plt
import numpy as np
import scipy.io as sio
import caffe, os, sys, cv2
import argparse
CLASSES = ('__background__',
     'aeroplane', 'bicycle', 'bird', 'boat',
     'bottle', 'bus', 'car', 'cat', 'chair',
     'cow', 'diningtable', 'dog', 'horse',
     'motorbike', 'person', 'pottedplant',
     'sheep', 'sofa', 'train', 'tvmonitor')
NETS = {'vgg16': ('VGG16',
      'vgg16_fast_rcnn_iter_40000.caffemodel'),
  'vgg_cnn_m_1024': ('VGG_CNN_M_1024',
         'vgg_cnn_m_1024_fast_rcnn_iter_40000.caffemodel'),
  'caffenet': ('CaffeNet',
      'caffenet_fast_rcnn_iter_40000.caffemodel')}
def vis_detections(im, class_name, dets, thresh=0.5):
 """Draw detected bounding boxes."""
 inds = np.where(dets[:, -1] >= thresh)[0]
 if len(inds) == 0:
  return
 im = im[:, :, (2, 1, 0)]
 fig, ax = plt.subplots(figsize=(12, 12))
 ax.imshow(im, aspect='equal')
 for i in inds:
  bbox = dets[i, :4]
  score = dets[i, -1]
  ax.add_patch(
   plt.Rectangle((bbox[0], bbox[1]),
        bbox[2] - bbox[0],
        bbox[3] - bbox[1], fill=False,
        edgecolor='red', linewidth=3.5)
   )
  ax.text(bbox[0], bbox[1] - 2,
    '{:s} {:.3f}'.format(class_name, score),
    bbox=dict(facecolor='blue', alpha=0.5),
    fontsize=14, color='white')
 ax.set_title(('{} detections with '
      'p({} | box) >= {:.1f}').format(class_name, class_name,
              thresh),
      fontsize=14)
 plt.axis('off')
 plt.tight_layout()
 plt.draw()
def demo(net, image_name, classes):
 """Detect object classes in an image using pre-computed object proposals."""
 # Load pre-computed Selected Search object proposals
 box_file = os.path.join(cfg.ROOT_DIR, 'data', 'demo',
       image_name + '_boxes.mat')
 obj_proposals = sio.loadmat(box_file)['boxes']
 # Load the demo image
 im_file = os.path.join(cfg.ROOT_DIR, 'data', 'demo', image_name + '.jpg')
 im = cv2.imread(im_file)
 # Detect all object classes and regress object bounds
 timer = Timer()
 timer.tic()
 scores, boxes = im_detect(net, im, obj_proposals)
 timer.toc()
 print ('Detection took {:.3f}s for '
     '{:d} object proposals').format(timer.total_time, boxes.shape[0])
 # Visualize detections for each class
 CONF_THRESH = 0.8
 NMS_THRESH = 0.3
 for cls in classes:
  cls_ind = CLASSES.index(cls)
  cls_boxes = boxes[:, 4*cls_ind:4*(cls_ind + 1)]
  cls_scores = scores[:, cls_ind]
  dets = np.hstack((cls_boxes,
        cls_scores[:, np.newaxis])).astype(np.float32)
  keep = nms(dets, NMS_THRESH)
  dets = dets[keep, :]
  print 'All {} detections with p({} | box) >= {:.1f}'.format(cls, cls,
                 CONF_THRESH)
  vis_detections(im, cls, dets, thresh=CONF_THRESH)
def parse_args():
 """Parse input arguments."""
 parser = argparse.ArgumentParser(description='Train a Fast R-CNN network')
 parser.add_argument('--gpu', dest='gpu_id', help='GPU device id to use [0]',
      default=0, type=int)
 parser.add_argument('--cpu', dest='cpu_mode',
      help='Use CPU mode (overrides --gpu)',
      action='store_true')
 parser.add_argument('--net', dest='demo_net', help='Network to use [vgg16]',
      choices=NETS.keys(), default='vgg16')
 args = parser.parse_args()
 return args
if __name__ == '__main__':
 args = parse_args()
 prototxt = os.path.join(cfg.ROOT_DIR, 'models', NETS[args.demo_net][0],
       'test.prototxt')
 caffemodel = os.path.join(cfg.ROOT_DIR, 'data', 'fast_rcnn_models',
         NETS[args.demo_net][1])
 if not os.path.isfile(caffemodel):
  raise IOError(('{:s} not found.\nDid you run ./data/script/'
        'fetch_fast_rcnn_models.sh?').format(caffemodel))
 if args.cpu_mode:
  caffe.set_mode_cpu()
 else:
  caffe.set_mode_gpu()
  caffe.set_device(args.gpu_id)
 net = caffe.Net(prototxt, caffemodel, caffe.TEST)
 print '\n\nLoaded network {:s}'.format(caffemodel)
 print '~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~'
 print 'Demo for data/demo/000004.jpg'
 demo(net, '000004', ('car',))
 print '~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~'
 print 'Demo for data/demo/001551.jpg'
 demo(net, '001551', ('sofa', 'tvmonitor'))
 plt.show()

复制这个demo.py 修改成CarFaceTest.py，下面是修改后的文件修改后的文件主要是添加了outputDetectionResult和runDetection两个函数，添加了部分注释

#!/usr/bin/env python
# --------------------------------------------------------
# Fast R-CNN
# Copyright (c) 2015 Microsoft
# Licensed under The MIT License [see LICENSE for details]
# Written by Ross Girshick
# --------------------------------------------------------
""" Demo script showing detections in sample images. See README.md for installation instructions before running. """
import _init_paths
from fast_rcnn.config import cfg
from fast_rcnn.test import im_detect
from utils.cython_nms import nms
from utils.timer import Timer
import matplotlib.pyplot as plt
import numpy as np
import scipy.io as sio
import caffe, os, sys, cv2
import argparse
#CLASSES = ('__background__','aeroplane','bicycle','bird','boat',
# 'bottle','bus','car','cat','chair','cow','diningtable','dog','horse'
# 'motorbike','person','pottedplant','sheep','sofa','train','tvmonitor')
CLASSES = ('__background__','car') #需要跟自己训练的数据集中的类别一致，原来是21类的voc数据集，自己的数据集就是car和background
NETS = {'vgg16': ('VGG16',
      'vgg16_fast_rcnn_iter_40000.caffemodel'),
  'vgg_cnn_m_1024': ('VGG_CNN_M_1024',
         'vgg_cnn_m_1024_fast_rcnn_iter_40000.caffemodel'),
 'vgg_cnn_m_1024_louyihang': ('VGG_CNN_M_1024_LOUYIHANG',
      'vgg_cnn_m_1024_fast_rcnn_louyihang_iter_40000.caffemodel'),
  'caffenet': ('CaffeNet',
      'caffenet_fast_rcnn_iter_40000.caffemodel'),
 'caffenet_louyihang':('CaffeNet_LOUYIHANG',
    'caffenet_fast_rcnn_louyihang_iter_40000.caffemodel'),
 'vgg16_louyihang':('VGG16_LOUYIHANG',
      'vgg16_fast_rcnn_louyihang_iter_40000.caffemodel')}#映射到对应的模型文件
def outputDetectionResult(im, class_name, dets, thresh=0.5): #打开相应的输出文件
 outputFile = open('CarDetectionResult.txt')
 inds = np.where(dets[:,-1] >= thresh)[0]
 if len(inds) == 0:
  return
def runDetection (net, basePath, testFileName,classes):#这个函数是自己后加的，取代了demo函数，给定测试数据列表
 ftest = open(testFileName,'r')
 imageFileName = basePath+'/' + ftest.readline().strip()
 num = 1
 outputFile = open('CarDetectionResult.txt','w')
 while imageFileName:
 print imageFileName
 print 'now is ', num
 num +=1
 imageFileBaseName = os.path.basename(imageFileName)
 imageFileDir = os.path.dirname(imageFileName)
 boxFileName = imageFileDir +'/'+imageFileBaseName.replace('.jpg','_boxes.mat')
 print boxFileName
 obj_proposals = sio.loadmat(boxFileName)['boxes']
 #obj_proposals[:,2] = obj_proposals[:, 2] + obj_proposals[:, 0]#这里也需要注意，OP里面的坐标数据是否为x1y1x2y2还是x1y1wh
 #obj_proposals[:,3] = obj_proposals[:, 3] + obj_proposals[:, 1]
 im = cv2.imread(imageFileName)
 timer = Timer()
 timer.tic()
 scores, boxes = im_detect(net, im, obj_proposals)#检测函数
 timer.toc()
 print ('Detection took {:.3f} for '
      '{:d} object proposals').format(timer.total_time, boxes.shape[0])
 CONF_THRESH = 0.8
 NMS_THRESH = 0.3#NMS参数用来控制非极大值抑制
  for cls in classes:
   cls_ind = CLASSES.index(cls)
   cls_boxes = boxes[:, 4*cls_ind:4*(cls_ind + 1)]
   cls_scores = scores[:, cls_ind]
   dets = np.hstack((cls_boxes,
        cls_scores[:, np.newaxis])).astype(np.float32)
   keep = nms(dets, NMS_THRESH)
   dets = dets[keep, :]
   print 'All {} detections with p({} | box) >= {:.1f}'.format(cls, cls,
                 CONF_THRESH)
  inds = np.where(dets[:, -1] >= CONF_THRESH)[0]
  print 'inds.size', inds.size
  if len(inds) != 0:
   outputFile.write(imageFileName+' ')
  outputFile.write(str(inds.size)+' ')将检测的结果写出相应的文件里
   for i in inds:
   bbox = dets[i, :4]
   outputFile.write(str(int(bbox[0]))+' '+ str(int(bbox[1]))+' '+ str(int(bbox[2]))+' '+ str(int(bbox[3]))+' ')
   outputFile.write('\n')
  else:
   outputFile.write(imageFileName +' 0' '\n')
 temp = ftest.readline().strip()
 if temp:
  imageFileName = basePath+'/' + temp
 else:
  break
def vis_detections(im, class_name, dets, thresh=0.5):#这个函数需要加以说明，这个函数虽然没有用，但是我的服务器上没有输出设备
 """Draw detected bounding boxes."""#因此要将部分用到显示的函数给注释掉，否则运行会报错
 inds = np.where(dets[:, -1] >= thresh)[0]
 print 'inds.shape', inds.shape
 print inds
 print 'inds.size', inds.size
 if len(inds) == 0:
  return
  #im = im[:, :, (2, 1, 0)]
 #fig, ax = plt.subplots(figsize=(12, 12))
 #ax.imshow(im, aspect='equal')
 #for i in inds:
 # bbox = dets[i, :4]
 # score = dets[i, -1]
 # ax.add_patch(
 # plt.Rectangle((bbox[0], bbox[1]),
 # bbox[2] - bbox[0],
 # bbox[3] - bbox[1], fill=False,
 # edgecolor='red', linewidth=3.5)
 # )
 # ax.text(bbox[0], bbox[1] - 2,
 # '{:s} {:.3f}'.format(class_name, score),
 # bbox=dict(facecolor='blue', alpha=0.5),
 # fontsize=14, color='white')
 #ax.set_title(('{} detections with '
 # 'p({} | box) >= {:.1f}').format(class_name, class_name,
 # thresh),
 # fontsize=14)
 #plt.axis('off')
 #plt.tight_layout()
 #plt.draw()
def demo(net, image_name, classes):#原来的demo函数，没有修改
 """Detect object classes in an image using pre-computed object proposals."""
 # Load pre-computed Selected Search object proposals
 #box_file = os.path.join(cfg.ROOT_DIR, 'data', 'demo',image_name + '_boxes.mat')
 basePath='/home/chenjie/DataSet/500CarTestDataSet2'
 box_file = os.path.join(basePath,image_name + '_boxes.mat')
 obj_proposals = sio.loadmat(box_file)['boxes']
 # Load the demo image
 #im_file = os.path.join(cfg.ROOT_DIR, 'data', 'demo', image_name + '.jpg')
 im_file = os.path.join(basePath, image_name + '.jpg')
 im = cv2.imread(im_file)
 # Detect all object classes and regress object bounds
 timer = Timer()
 timer.tic()
 scores, boxes = im_detect(net, im, obj_proposals)
 timer.toc()
 print ('Detection took {:.3f}s for '
     '{:d} object proposals').format(timer.total_time, boxes.shape[0])
 # Visualize detections for each class
 CONF_THRESH = 0.8
 NMS_THRESH = 0.3
 for cls in classes:
  cls_ind = CLASSES.index(cls)
  cls_boxes = boxes[:, 4*cls_ind:4*(cls_ind + 1)]
  cls_scores = scores[:, cls_ind]
  dets = np.hstack((cls_boxes,
        cls_scores[:, np.newaxis])).astype(np.float32)
  keep = nms(dets, NMS_THRESH)
  dets = dets[keep, :]
  print 'All {} detections with p({} | box) >= {:.1f}'.format(cls, cls,
                 CONF_THRESH)
  vis_detections(im, cls, dets, thresh=CONF_THRESH)
def parse_args():
 """Parse input arguments."""
 parser = argparse.ArgumentParser(description='Train a Fast R-CNN network')
 parser.add_argument('--gpu', dest='gpu_id', help='GPU device id to use [0]',
      default=0, type=int)
 parser.add_argument('--cpu', dest='cpu_mode',
      help='Use CPU mode (overrides --gpu)',
      action='store_true')
 parser.add_argument('--net', dest='demo_net', help='Network to use [vgg16]',
      choices=NETS.keys(), default='vgg16')
 args = parser.parse_args()
 return args
if __name__ == '__main__':
 args = parse_args()
 prototxt = os.path.join(cfg.ROOT_DIR, 'models', NETS[args.demo_net][0],
       'test.prototxt')
 #caffemodel = os.path.join(cfg.ROOT_DIR, 'data', 'fast_rcnn_models',
 # NETS[args.demo_net][1])
 #caffemodel = '/home/chenjie/fast-rcnn/output/default/KakouTrain/vgg16_fast_rcnn_louyihang_iter_40000.caffemodel'
 #caffemodel = '/home/chenjie/louyihang/fast-rcnn/output/default/KakouTrain/caffenet_fast_rcnn_louyihang_iter_40000.caffemodel'
 caffemodel = '/home/chenjie/fast-rcnn/output/default/KakouTrain/vgg_cnn_m_1024_fast_rcnn_louyihang_iter_40000.caffemodel'#我在这里直接指定了训练好的模型文件，训练好的模型文件是在工程根目录下的，output/default/对应的数据库名字下面
 if not os.path.isfile(caffemodel):
  raise IOError(('{:s} not found.\nDid you run ./data/script/'
        'fetch_fast_rcnn_models.sh?').format(caffemodel))
 if args.cpu_mode:
  caffe.set_mode_cpu()
 else:
  caffe.set_mode_gpu()
  caffe.set_device(args.gpu_id)
 net = caffe.Net(prototxt, caffemodel, caffe.TEST)
 print '\n\nLoaded network {:s}'.format(caffemodel)
 #demo(net, 'Target0/000001', ('car',))
 #输入对应的测试图像列表，需要在同级目录下摆放同名的_boxes.mat文件，它会自动的替换后缀名！
 #runDetection(net, '/home/chenjie/DataSet/temptest','/home/chenjie/DataSet/temptest/Imagelist.txt',('car',))
 runDetection(net, '/home/chenjie/DataSet/500CarTestDataSet2','/home/chenjie/DataSet/500CarTestDataSet2/Imagelist.txt',('car',))
 #runDetection(net, '/home/chenjie/DataSet/Kakou_Test_Scale0.25/','/home/chenjie/DataSet/Kakou_Test_Scale0.25/imagelist.txt',('car',))
 #runDetection(net, '/home/chenjie/DataSet/Images_Version1_Test_Boxes','/home/chenjie/DataSet/Images_Version1_Test_Boxes/ImageList_Version1_List.txt',('car',))
 #plt.show()

5.检测结果

训练数据集

首先给出我的训练数据集，其实我的训练数据集并不是太复杂的

测试数据集

输出检测结果到txt文件中，

测试效果

**在复杂场景下的测试效果非常好，速度也非常快，中型网络监测平均每张在K80显卡下时0.1~0.2S左右，图像的尺寸是480*640，6000张测试数据集下达到的准确率是98%!!!**

大数据项目-Django基于大数据技术实现的农产品销售系统 IT实战课堂-玲琳娜计算机毕业设计大数据 java spark 爬虫
《[含文档+PPT+源码等]Django基于大数据技术实现的农产品销售系统》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、包运行成功以及课程答疑与微信售后交流群、送查重系统不限次数免费查重等福利！数据库管理工具：phpstudy/Navicat或者phpstudy/sqlyog后台管理系统涉及技术：后台使用框架：Django前端使用技术：Vue,HTML5,CSS3、JavaScrip
LangChain4j在Java企业应用中的实战指南-2 在未来等你大模型应用开发 AI 技术编程 Java Spring
LangChain4j在Java企业应用中的实战指南文章标签langchain4j,JavaAI,RAG系统,智能应用开发,LangChain4j实战,企业级AI应用,Java微服务,检索增强生成文章简述随着大语言模型（LLM）的广泛应用，企业对智能应用的需求日益增长。LangChain4j作为一款专为Java生态打造的LLM集成框架，正在成为构建RAG（检索增强生成）系统和智能应用的重要工具。本
Nginx反向代理、使用OneinStack配置Nginx、多网站配置、多域名配置 2401_86637663 nginx 运维
cdoneinstacksudoshvhost.sh如果出现以下异常：vhost.sh:23:pushd:notfoundvhost.sh:40:./include/check_os.sh:[[:notfoundvhost.sh:40:./include/check_os.sh:vhost.sh:40:./include/check_os.sh:^RedHat$:notfound^Rocky:no
产品背景知识——在线推理和离线推理爱吃芝麻汤圆 #产品背景知识推理
产品背景知识——在线推理和离线推理一、核心区别：从4个维度对比1.数据处理方式与时效性在线推理（实时推理）数据特点：处理实时流入的单条或小批量数据（如用户点击、交易请求）。时效性要求：需在毫秒级到秒级内返回结果，延迟直接影响用户体验或业务决策。典型场景：电商推荐系统（用户浏览商品时实时推荐）、金融风控（交易时实时欺诈检测）。离线推理（批量推理）数据特点：处理历史累积的大规模数据集（如TB级日志、数
产品背景知识——Region和Zone 爱吃芝麻汤圆 #产品背景知识分布式
产品背景知识——Region和Zone一、基本定义1.Region（区域）含义：通常指较大范围的地理区域，可包含多个物理位置或数据中心。例子：在云计算中，如AWS的“亚太地区（东京）”“北美地区（弗吉尼亚）”就是不同的region，每个region是一个独立的地理区域，包含多个可用区（zone）。地图服务中，“华东地区”“欧洲地区”也属于region范畴。2.Zone（可用区/区域）含义：范围小于
产品背景知识——API、SDK、Library、Framework、Protocol 爱吃芝麻汤圆 #产品背景知识 api sdk 产品背景知识
产品背景知识——API、SDK、Library、Framework、ProtocolAPI和SDKAPI（ApplicationProgrammingInterface，应用程序编程接口）和SDK（SoftwareDevelopmentKit，软件开发工具包）是软件开发中的两个核心概念，它们既有区别又有紧密联系。以下是详细解释：1.API与SDK的区别特性APISDK定义一组预定义的规则和协议，用
Vue3组件通信 whhhhhhhhhw vue.js 前端 javascript vue组件通信学习前端框架
前言：在组件化开发中，需要将页面抽离成组件的形式，抽离之后就涉及到了组件中数据传递，可分为：父传子（props）、子传父（emits）、祖孙通信（provide和inject）、兄弟通信、全局通讯（pinia）。这次我就以博客的形式复习一下前三种通讯，想了解pinia可点击看我前面写的博客。1.父传子首先需要在父组件中的子组件标签中添加自定义属性，将需要传递的值放如自定义属性中，在子组件中通过de
axios的使用以及封装 whhhhhhhhhw 前端 vue.js javascript 学习 axios
前言：在现代前端开发中，网络请求是不可避免的核心功能之一。无论是获取后端数据、提交表单信息，还是与第三方API交互，高效且可靠的HTTP请求库至关重要。axios作为一款基于Promise的HTTP客户端，凭借其简洁的API设计、强大的拦截器机制以及广泛的浏览器和Node.js兼容性，成为开发者首选的工具之一。axios不仅提供了基础的GET、POST等请求方法，还支持请求和响应的拦截、取消请求、
嵌入式AI模型压缩技术：让大模型变小 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
嵌入式AI模型压缩技术：让大模型变小关键词：嵌入式AI、模型压缩、剪枝、量化、知识蒸馏、轻量化网络、端侧部署摘要：当我们用手机拍照时，AI能瞬间识别出“这是一只猫”；智能摄像头能在0.1秒内检测到“有人闯入”。这些“快如闪电”的AI功能背后，藏着一项关键技术——嵌入式AI模型压缩。本文将用“给盆栽修剪枝叶”“用简笔画代替油画”等生活类比，带您一步步理解模型压缩的核心技术（剪枝、量化、知识蒸馏、轻量
python:assert和raise区别 Covirtue python
assert和raise是在错误处理方面的两个不同的用法。assert是一种断言语句，用于在代码中检查一个条件是否为True。如果条件为False，它会引发一个AssertionError异常。assert主要用于调试目的，以确保代码的正确性。当代码被优化时，assert语句可能会被自动忽略。例如：```pythonx=5assertx>0,"x必须大于0"```如果x不大于0，将引发Assert
Python读取红外图像 - 实现红外图像的读取和处理程序员杨弋 Python全栈工程师学习指南 python 计算机视觉 opencv
在许多工业、安防等领域中，红外图像无疑是一种不可或缺的重要资源，因此，能够快速、准确地读取和处理红外图像，对于工程师和科学家来说非常必要。Python作为一种强大的编程语言，提供了丰富的图像处理库，允许我们轻松地读取和处理红外图像，本文将介绍如何使用Python读取红外图像，并对其进行简单的处理。首先需要准备一个目标红外图像文件，这里我们以bmp格式的文件为例：importcv2img=cv2.i
Netty和gRPC区别不曾高瞻远瞩 rpc
1.框架类型Netty:Netty是一个异步事件驱动的网络应用框架，用于开发高性能的网络服务器和客户端应用程序。它是一个低级别的网络框架，主要用于处理TCP、UDP、HTTP等协议。Netty提供了灵活的API来构建自定义的网络协议和传输层逻辑。gRPC:gRPC是一个基于HTTP/2和ProtocolBuffers的高性能RPC（远程过程调用）框架。它是一个高级别的通信框架，专注于提供简单易用且
python raise和assert的区别 40kuai
python中raise和assert的区别一、使用raise抛出异常python可以自动触发异常，raise（内置函数）的定义为显示的抛出异常，用户可以使用raise进行判断，显式的引发异常，raise执行后程序将不再向下执行。式例：#!/usr/bin/envpython#-*-coding:utf-8-*-__author__='40kuai'books_dict={'name':'pyth
pyhton气象探空图绘制
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、探空图绘制总结前言提示：这里可以添加本文要记录的大概内容：探空图是通过探空仪器测得的实时数据绘制而成的。探空仪器通常搭载在探空气球上，随着气球升空，仪器会测定不同高度和经纬度的温度、气压、空气湿度等数据，并通过无线电信号将这些数据发送回地面。地面接收系统接收到这些数据后，进行处理和分析，最终绘制成探空图‌。提示：以下是
python解析风云4B生成真彩云图小天丶1 气象数据处理 python 开发语言
文章目录概要话不多数开整小结概要真彩色云图需要根据通道Channel01,通道Channel02,通道Channel03进行通道融合处理,大致思路:三个通道对于RGB三个颜色管道，然后合并成一个三通道图像,其余云图在历史文档里有python解析风云4B,生成红外云图、可见光云图、水汽云图https://blog.csdn.net/qq_38197010/article/details/146549
【Linux】Linux常用命令韩悸桉服务器 linux 服务器运维
一、cd：切换目录（Changedirectory）1.1cd~和cd：返回用户目录[root@izwz94jtz9hbdq165vpxpxzapp1]#cd~[root@izwz94jtz9hbdq165vpxpxz~]#[root@izwz94jtz9hbdq165vpxpxzapp1]#cd[root@izwz94jtz9hbdq165vpxpxz~]#1.2cd.：停留在当前目录[root
【go从入门到精通】rpc和grpc的使用前网易架构师-高司机 golang从入门到精通 golang rpc 开发语言 golang从入门到精通 go从入门到精通 grpc
RPC简介远程过程调用（RemoteProcedureCall，RPC）是一个计算机通信协议该协议允许运行于一台计算机的程序调用另一台计算机的子程序，而程序员无需额外地为这个交互作用编程如果涉及的软件采用面向对象编程，那么远程过程调用亦可称作远程调用或远程方法调用RPC应用场景RPC的应用场景通常是在复杂的系统中，当单一应用无法承受高流量和复杂业务时，系统会被拆分成多个服务，这些服务可能需要部署在
基于大模型的地中海贫血全流程预测与治疗管理研究报告 LCG元围术期危险因子预测模型研究人工智能
目录一、引言1.1研究背景与意义1.2研究目的与目标1.3研究方法与数据来源二、地中海贫血概述2.1疾病定义与分类2.2病因与发病机制2.3流行病学特征2.4临床表现与诊断方法三、大模型技术原理与应用现状3.1大模型基本原理3.2在医疗领域的应用案例3.3应用于地中海贫血预测的优势四、术前风险预测与手术方案制定4.1术前风险因素分析4.2大模型预测模型构建与验证4.3根据预测制定个性化手术方案五、
2025华为od机试真题B卷【停车场费用统计】Python实现 MISAYAONE OD机试华为od python 开发语言华为od机试 2025B卷
目录题目思路Code题目停车场统计当日总收费，包月的车不统计，不包月的车半个小时收一块钱，不满半小时不收钱，如果超过半小时，零头不满半小时按半小时算，每天11:30-13:30时间段不收钱，如果一辆车停车时间超过8小时后不收费。现提供停车场进出车辆的统计信息，需要你来计算停车场统计当日的总收费。输入描述第一行输入一个整数n表示今日进出停车场的包月的车辆数下一个行输入包月车的车牌号，以空格分割接下来
基于大模型的胆囊结石全流程预测与诊疗系统技术方案
目录一、系统架构设计1.1数据采集与预处理模块1.2大模型核心算法模块二、全流程系统流程图三、系统集成方案3.1模块交互流程3.2数据流示意图四、系统部署拓扑图五、核心模块实现细节5.1术前风险预测算法5.2术中监测算法5.3术后并发症预测模型六、关键技术验证方案6.1模型验证流程6.2临床试验设计框架七、典型应用场景流程7.1腹腔镜手术决策流程一、系统架构设计1.1数据采集与预处理模块#数据采集
成为高级Python开发人员的完整学习路线与核心知识体系
引言Python已成为全球最受欢迎的编程语言之一，其简洁的语法和强大的生态系统使其在数据科学、Web开发、自动化、人工智能等领域占据重要地位。然而，从初级Python程序员到真正的高级开发人员，需要掌握一系列深入的知识点和实践经验。本文将详细介绍成为高级Python开发人员必备的核心知识体系，并提供系统化的学习资源，帮助你规划专业发展路径。第一部分：Python语言基础进阶1.Python语言特性
【安卓笔记】注解反射，优雅的findViewById liosen 安卓笔记笔记
0.环境：电脑：Windows10AndroidStudio:2024.3.2编程语言:Java上一篇：注解的创建（重要提示，安卓新版本不再支持下面的代码。以下仅提供思路）如果需要使用findViewById的工具，推荐使用ButterKnife如果是需要优雅简单使用框架，可以使用MVVM框架，Android官方推荐的ViewBinding1.创建工具类，用于实现findViewById我这里直接
C++ Vector的使用(上) 叶羽西 C++c++开发语言
注：这里以C++11版本为基础，简单介绍vector的特性和常见使用。目录vector简介vector特性vector的定义vector对象的构造和初始化1.构造一个空的vector2.构造一个容量大小为n的vector3.构造一个vector，初始值为指定的数据片段4.拷贝构造一个vector对象5.移动构造一个vector对象6.直接使用列表初始化&构造vector对象vector中元素的遍历
15、云原生安全的核心原则二进制温柔云原生安全：从理论到实践云原生安全最小权限原则深度防御
云原生安全的核心原则1.引言在当今数字化的世界中，信息安全已成为企业生存和发展的重要组成部分。随着云计算的普及，云原生安全（CloudNativeSecurity）逐渐成为信息安全领域的新焦点。云原生安全不仅继承了传统安全的基本原则，还结合了云计算的独特特点，为企业提供了更高效、更灵活的安全解决方案。本文将深入探讨云原生安全的核心原则，帮助读者理解和掌握这些原则在实际应用中的意义和方法。2.云原生
MongoDB 常见查询语法与命令详解夜影风大数据（Big Data）mongodb 数据库
MongoDB作为文档型数据库，其查询语言基于BSON（二进制JSON）格式，与传统关系型数据库的SQL语法有较大差异。一、基本查询命令1.find()：查询文档语法：db.collection.find(查询条件,投影)示例：//查询users集合中所有文档db.users.find()//查询年龄大于25岁的用户，只返回姓名和年龄db.users.find({age:{$gt:25}},{na
做独立站只需1小时学会搭建独立站 Bowcen 独立站
独立站搭建攻略：开启线上业务的完整指南在数字化浪潮中，独立站已成为企业和个人拓展业务、塑造品牌的有力工具。无论你是想开展跨境电商，还是打造专业的品牌展示平台，搭建独立站都是关键的第一步。以下将为你详细介绍搭建独立站的全流程攻略，助你顺利开启线上之旅。一、明确建站目标与受众（一）确定网站类型与目标在着手搭建独立站之前，首要任务是明确建站目标与网站类型。网站类型大致可分为电商站、品牌官网、内容驱动型网
【MongoDB】基础知识全面解析：从入门到核心概念韩悸桉数据库 mongodb 数据库
一、MongoDB是什么？MongoDB是一种开源文档型NoSQL数据库，以灵活的JSON格式（BSON）存储数据，无需固定表结构，适合处理半结构化和非结构化数据。与传统关系型数据库（如MySQL）相比，它具有以下特点：灵活的数据模型：文档结构可动态调整，适应业务需求变化。水平扩展性：支持分片集群，轻松应对海量数据存储。高性能读写：通过索引优化和内存缓存提升查询效率。二、核心概念与术语对比Mong
安全左移（Shift Left Security）：软件安全的演进之路秋说 Security 安全建设软件安全
文章目录一、背景：传统安全的尴尬处境二、安全左移：让安全成为开发的“第一等公民”三、安全左移的关键实施阶段1.需求阶段：嵌入安全需求建模2.设计阶段：威胁建模与架构审计3.编码阶段：安全编码规范与静态分析4.构建与测试阶段：自动化安全检测5.发布阶段：容器与CI/CD安全审计6.运营阶段：安全监控与持续响应四、实现路径：从理念到落地的三步走Step1：安全理念转型Step2：工具链集成与自动化保障
C语言控制结构深度解析：从底层原理到高效实战技巧 Bryan Ding c语言开发语言
一、程序逻辑的核心密码程序设计的本质是对现实问题的抽象和逻辑表达。C语言作为结构化编程语言的典范，其控制结构构成了程序逻辑的骨架。三大基本结构构成所有程序的逻辑基础：顺序结构：代码的自然执行顺序选择结构：if/else语句实现分支判断循环结构：for/while实现重复操作二、选择结构的底层实现1.if语句的机器级实现if (condition){ //代码块}编译后的汇编代码示例： cmp
Golang Channel 详细原理和使用技巧
1.简介Channel(一般简写为chan)管道提供了一种机制:它在两个并发执行的协程之间进行同步，并通过传递与该管道元素类型相符的值来进行通信,它是Golang在语言层面提供的goroutine间的通信方式.通过Channel在不同的goroutine中交换数据，在goroutine之间发送和接收消息,并且可以通过Channel实现Go依赖的CSP的并发模型这种同步模式chan可以理解为一个管道
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

Fast RCNN 训练自己的数据集（3训练和检测）

Fast RCNN 训练自己的数据集（3训练和检测）

1.预训练模型介绍

2. 修改模型文件配置

3.启动Fast RCNN网络训练

启动训练： ./tools/train_net.py --gpu 11 --solver models/VGG_CNN_M_1024_LOUYIHANG/solver.prototxt --weights data/imagenet_models/VGG_CNN_M_1024.v2.caffemodel --imdb KakouTrain

参数讲解：

4.启动Fast RCNN网络检测

5.检测结果

训练数据集

测试数据集

测试效果

你可能感兴趣的:(Fast RCNN 训练自己的数据集（3训练和检测）)

启动训练：
./tools/train_net.py --gpu 11 --solver models/VGG_CNN_M_1024_LOUYIHANG/solver.prototxt --weights data/imagenet_models/VGG_CNN_M_1024.v2.caffemodel --imdb KakouTrain