https://arxiv.org/pdf/1703.01086.pdf
摘要 - 本文介绍了一种新颖的基于旋转的自然场景图像中任意导向文本检测框架。 我们提出了旋转区域提议网络(RRPN),其目的是生成带有文本方向角度信息的倾斜提案。 角度信息然后适用于边界框回归,以使得提案在方向上更准确地适合文本区域。 提出旋转兴趣区域(RRoI)池层以将任意导向的提议投影到文本区域分类器的特征映射。 整个框架建立在基于区域提议的架构之上,与以前的文本检测系统相比,该架构可确保任意导向的文本检测的计算效率。 我们在三个真实世界场景文本检测数据集上使用基于旋转的框架进行实验,并证明其在先前方法的有效性和效率方面的优势。
索引术语 - 场景文本检测,任意定向,旋转方案。
2、全文翻译
https://www.jianshu.com/p/379dede5979c
3、git地址
https://github.com/mjq11302010044/RRPN#demo
4、使用
pip install cython
2、在虚拟环境中安装numpy:
pip install numpy
进入setup代码当中,将iteritems,修改为items
cd $RRPN_ROOT/caffe-fast-rcnn
make -j4 && make pycaffe
出现问题,没有找到makefile.config
回到软件要求,需要安装caffe和pycaffe
5、安装caffe和pycaffe
官网:http://caffe.berkeleyvision.org/installation.html#compilation
教程:https://blog.csdn.net/yhaolpz/article/details/71375762
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install git cmake build-essential
sudo apt-get install git cmake build-essential
sudo cp Makefile.config.example Makefile.config
sudo gedit Makefile.config
# In your Makefile.config, make sure to have this line uncommented
WITH_PYTHON_LAYER := 1
# Unrelatedly, it's also recommended that you use CUDNN
USE_CUDNN := 1
6、回到步骤4继续编译
cd $RRPN_ROOT/caffe-fast-rcnn
make -j4 && make pycaffe
下载地址: https://drive.google.com/open?id=0B5rKZkZodGIsV2RJUjVlMjNOZkE
我是直接打开网页下载后移动到文件夹当中的。
7、测试demo
cd $RRPN_ROOT
python ./tools/rotation_demo.py
结果出错,于是从pycharm打开代码查看具体情况,之后将在pycharm中进行操作。
8、pycharm配置环境
pip install utils
2、