抖音中文点选验证码识别方案

最近研究了一下抖音中文点选验证码的识别,居然正确率高达98%。

首先我们来看一下效果

抖音中文点选验证码识别方案_第1张图片抖音中文点选验证码识别方案_第2张图片抖音中文点选验证码识别方案_第3张图片

一、识别方法

1、数据集准备

我们需要借助爬虫去下载大量的验证码图片。这些有两种图片,一种是小图,包含需要点选的中文和顺序,还有一种是大图,需要进行点选的地方,如下图:

抖音中文点选验证码识别方案_第4张图片

2、标注中文位置

使用labelimg标注中文位置,之后会进行中文位置识别训练,如下图

抖音中文点选验证码识别方案_第5张图片

3、标记每一个中文小图

抖音中文点选验证码识别方案_第6张图片

4、训练识别模型

抖音中文点选验证码识别方案_第7张图片

5、测试验证

我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。

如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。

二、免费使用地址

我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云

你可能感兴趣的:(验证码识别,人工智能,深度学习,python,图像处理,机器学习,神经网络,目标检测)