CTPN的demo.py实现过程记录

CTPN的demo.py实现过程记录

最近又开始ocr相关的任务了,记录一下过程。
本次使用的代码来自CTPN
一,下载代码
这个是tensorflow版本的代码,先看一下环境配置要求吧。
CTPN的demo.py实现过程记录_第1张图片
备注:gcc与g++也要求在6.0以上,否则会报错。
二,编译
在根目录下输入以下:

cd utils / bbox
chmod + x make.sh
./make.sh

目的是生成.os文件。如图:
CTPN的demo.py实现过程记录_第2张图片
三,下载作者训练好的ckpt
1.ckpt文件
2.将checkpoints_mlt /放在text-detection-ctpn /中
CTPN的demo.py实现过程记录_第3张图片
3.将图片放入data / demo,结果将保存在data / res中,并在根目录中运行demo(本身也自带了几张图)
4.python ./main/demo.py

备注:CTPN对水平文字的检测效果不错,但是对于竖直和倾斜文字的检测效果不佳,这是由于程序中对于标签数据进行的水平切分(宽为16的矩形框),在利用rnn进行文本行合并时,一直是水平方向导致的。

你可能感兴趣的:(CTPN的demo.py实现过程记录)