合成中文识别数据集的相关repo

介绍合成中文识别数据集的相关repo

SynthText_Chinese_version

修改自SynthText(CVPR2016),用于生成自然场景文本图像。
备注:但代码给人的感觉是很混乱,没有清晰结构,目前作者也停止了维护,代码基于OpenCV2.4,版本过旧无法pip直接安装或者需要自己改动一些代码。

TextRecognitionDataGenerator

一个合成数据生成器用于文本识别
备注:代码结构清晰,作者一直在维护,有官方文档。

注意事项

参数说明有官方手册,这里不再赘述。说一下实际遇到的几个问题:

  1. 倾斜角度问题:倾斜角不宜过大,过大会导致它为了在指定高度框中容下倾斜文本,将字体缩的很小。建议5度>以内。
  2. 模糊问题:模糊参数仅支持整型,设为1合适。
  3. 标签问题:源代码中仅有三种标签,不支持img_id to label_id,可以修改string_generator.py中的create_strings_from_dict,使其同时返回生成字符串的对应ID。
  4. 边界问题:建议将边界设为0,字体大一些。
  5. 字体问题:直接将你想要的字体丢入fonts的cn文件夹,建议还是添加同时支持简体和繁体的字体。

text_renderer

准确的说也是生成文本图像用于文字识别
备注:代码结构清晰,但很久没维护了。

你可能感兴趣的:(Deep,Learning)