分割版本的seglink--Character Region Awareness for Text Detection

核心思想
  • 提出单字分割以及单字间分割的方法,类似分割版本的seglink

  • 提出如何利用char level合成数据得到真实数据的char box 标注的弱监督方法

标签构造
标签构造
  • char box以及box间的region

  • 使用高斯map,为提高速度,使用一个正常的gaussian map(方的) ,计算其与char box之间的仿射变换,然后直接得到标注的gaussian map.

模型结构
模型结构
  • vgg_bn

  • 采样至原图1/2

word标注生成char标注
  1. 弱监督学习过程
弱监督学习
  1. 如何得到切分好的char-box
CropBox
后处理
  • 通过阈值筛选字符文本区域与字符间区域,然后通过通过阈值筛选字符文本区域与字符间区域,然后通过opencv 中连通方法得当外界轮廓
数据处理
  • 正常的CROP, rotated, 随机尺度变换等
思考
  • 方法依赖字符级别的标注

  • 后处理依赖字符的分割以及字符间区域的分割。因此对于较大间隔文本的间隔无法准确分割,容易完成断裂

  • 后处理依赖逐像素操作,因此速度较慢

文章链接

Character Region Awareness for Text Detection

你可能感兴趣的:(分割版本的seglink--Character Region Awareness for Text Detection)