基于Faster Rcnn实现的E字符的形态识别

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、制作自己的数据集
    • 1、图片获取
    • 2、进行标注
    • 3、制作数据集
  • 二、训练自己的目标监测网络与利用自己的模型进行预测
  • 三、具体的步骤


前言

本文章是基于已有的Faster Rcnn代码完成的对E字符的四种形态进行画框识别。

一、制作自己的数据集

1、图片获取

可以百度获得差不多20多张E的图片,然后再对这些图片进行旋转、翻转等操作获得一个较大的数据集(具体多大没有规定)。

2、进行标注

可以利用标注工具labelimg对图片进行标注,可以得到一个.xml文件夹,其中的数据就是对图片的标注信息,便于后续的训练模型。

3、制作数据集

在Faster Rcnn代码中的数据集格式是VOC2007的格式,
在这里插入图片描述
Annotations里面存储的就是标注数据的文件,JPEGImages里面存储的是对应的图片,而下载的代码中有一个部分,运行可以生成ImageSets里的Main的东西。在这里插入图片描述

二、训练自己的目标监测网络与利用自己的模型进行预测

1.需要更改多个地方的地址,分类等。例如图片大小,以及各种地址分类等。
2.利用训练好的权值文件,更改model_path与classes_path的地址,还要在classes_path中更改分类。

三、具体的步骤

可以在B站观看Bubbliiiing的基于pytorch实现Faster Rcnn的视频
视频讲的非常清楚,我一个初学者也能很快理解。
地址:https://www.bilibili.com/video/BV1BK41157Vs?from=search&seid=5716594295222086544

代码也是在该博主的gittub上面下载的。

你可能感兴趣的:(笔记)