CTPN: Detecting Text in Natural Image with Connectionist Text Proposal Network
papercode1.区别本文工作基于fasterRCNN,区别在于改进了rpn,anchor产生的window的宽度固定为3。rpn后面不是直接接全连接+分类/回归,而是再通过一个LSTM,再接全连接层。坐标仅仅回归一个y,而不是x1,y1,x2,y2添加side-refinementoffsets(可能这个就是4个回归值中的其中2个)2.问题分析文字目标的特殊性,一个很大的先验是,文字总是水平