论文是Real-time Scene Text Detection with Differentiable Binarization,关于论文讲解有很多。
代码来自https://github.com/WenmuZhou/DBNet.pytorch
网络结构如下图。
按照README.MD去安装,需另外安装natsort,addict这两个包
pip install -r requirement
下载icdar2015数据集,结构如下。
其中test.txt,train.txt需要自己生成,格式如下。
代码见generate_path.py
参考代码
需要修改的文件:config文件夹中的
icdar2015_resnet18_FPN_DBhead_polyLR.yaml,
open_dataset_resnet18_FPN_DBhead_polyLR.yaml
在控制台输入
python tools/train.py --config_file "config/icdar2015_resnet18_FPN_DBhead_polyLR.yaml"
训练好的模型会保存在output/DBNet_resnet18_FPN_DBHead/checkpoint中
包括最好的和最后一次的模型
训练好模型,就可以测试文本检测效果啦