文本识别text-detection-ctpn环境搭建

最近做文本识别需要用到CTPN,window下搭建环境花了不少功夫,做个笔记

项目GitHub地址

简介

CTPN在文本识别上表现优异,因为把RNN引入目标检测问题,加入了LSTM层,使其对连续文本的序列特征具有敏感性,增加了文本检测的精确度。

环境搭建

源码下载,python包环境就不多说,看requirements.txt就行

只提一下遇到的几个问题

1.import问题 报错No module named 'utils.rpn_msr'

在原项目utils文件下新建一个__init__.py文件,内容为空

文本识别text-detection-ctpn环境搭建_第1张图片

2.bbox包编译问题,报错No module named nms

这个问题折腾了很久,作者给出的make.sh是在Linux下的编译方式,解决方法可以参考,不过源码更新之后有许多地方不一样了,我是按下面步骤解决的。

首先在文件 bbox\ nms.pyx的第25行“np.int_t”更改为“np.intp_t”

bbox文件夹下新建一个setup_cpu.py文件,文件代码如下所示:

import numpy as np
from distutils.core import setup
from Cython.Build import cythonize
from distutils.extension import Extension
numpy_include = np.get_include()
setup(ext_modules=cythonize("bbox.pyx"),include_dirs=[numpy_include])
setup(ext_modules=cythonize("nms.pyx"),include_dirs=[numpy_include])

在命令行执行

python setup_cpu.py build_ext --inplace

 

 

其他地方按照README说明做就行了,贴一下成果

文本识别text-detection-ctpn环境搭建_第2张图片

 

你可能感兴趣的:(深度学习,机器学习,深度学习,CTPN,文本识别)