字符识别算法SWT实现中的一些经验总结

自然场景中的文字识别,不得不提SWT算法【 Boris Epshtein , etc. Detecting Text in Natural Scenes with Stroke Width Transform. CVPR, 2010】,

该算法主要思想是通过canny提取边缘和梯度,然后通过梯度方向去搜索相反方向的边缘,搜索过程中的记录的路径长度就是该路径上所有像素对应的笔画宽度

在实现该算法过程中发现在计算中文字符过程中会有很多细节上的问题出现:

1.就是即使在边缘都被准确提取到的情况下,在查找边缘计算像素宽度仍然有问题,

如下图所示,在逐个像素点计算时,会出现跳过边缘点的情况,导致搜索路径长于实际值

字符识别算法SWT实现中的一些经验总结_第1张图片     字符识别算法SWT实现中的一些经验总结_第2张图片    字符识别算法SWT实现中的一些经验总结_第3张图片

2.文章中给定的pi/6阈值来确定搜索方向的一个评估范围对于中文字符来讲,太严苛,造成很多边缘方向定位越界,因为中文字符的笔画远比英文字符复杂的

结合上面2点,中文字符,比较适合从上下左右方向去搜索边缘,确定像素宽度,以最小值作为宽度值

后续有更新在补充

你可能感兴趣的:(字符识别算法SWT实现中的一些经验总结)