python简单验证码识别两种方法

既然是要简单,当然是pip一下现成库就能用的。

ddddocr

Github地址:https://github.com/sml2h3/ddddocr
谐音带带弟弟OCR,环境要求python >= 3.8 Windows/Linux/Macox..
而且你也可以使用自己的数据集对它进行训练!并且把训练好的模型给ddddocr使用,请看这里:
sml2h3/dddd_trainer: ddddocr训练工具

安装

pip install ddddocr

代码

以下代码识别当前目录的36个jpg验证码文件:

import ddddocr

ocr = ddddocr.DdddOcr()
for i in range(36):
    try:
        with open(f'./{i}.jpg', 'rb') as f:
            img_bytes = f.read()
    except IOError as ercode:
        print('文件打开错误,错误代码:%s',str(ercode))
    else:
        print("识别中......")
        res = ocr.classification(img_bytes)
        print(f'Image{i}识别结果:{res}')
        f.close()

muggle-ocr库(麻瓜OCR)

这个号称轻量级,但是其实它还依赖400M+的tensorflow
使用起来也有好几个坑。环境要求Python >=3.6

安装

第1个坑:
由于未知原因(相信我,已经google过了),它已经从官方pip源撤掉了,包括清华,中科大。但是豆瓣/阿里云源镜像仍然可以下载。(我终于看到更新慢的一个优势了…)。然后我顺手在github上做了一个备份simonliu009/muggle-ocr: A backup of muggle-ocr pip package

pip install muggle-ocr -i https://pypi.douban.com/simple/

第2个坑:
安装依赖的tensorfow的时候可能会提示rehash/pip: line 20: 109037 Killed
原因:内存不足。
解决方法:增加虚拟机内存(现在的机器内存不足通常是因为使用了虚拟机而分配的内存不够)。或者使用参数--no-cache-dir

第3个坑:
运行的时候提示libGL.so.1: cannot open shared object file: No such file or directory
解决方法: Ubuntu下sudo apt install libgl1-mesa-glx即可。其他环境请自行搜索。

代码

import time
​
# 1. 导入包
import muggle_ocr # 本地文件"""
使用预置模型,预置模型包含了[ModelType.OCR, ModelType.Captcha] 两种
其中 ModelType.OCR 用于识别普通印刷文本, ModelType.Captcha 用于识别4-6位简单英数验证码
​
"""# 打开印刷文本图片
with open(r"test1.png", "rb") as f:
    ocr_bytes = f.read()# 打开验证码图片
with open(r"test2.jpg", "rb") as f:
    captcha_bytes = f.read()# 2. 初始化;model_type 可选: [ModelType.OCR, ModelType.Captcha]
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.OCR)# ModelType.Captcha 可识别光学印刷文本
for i in range(5):
    st = time.time()
    # 3. 调用预测函数
    text = sdk.predict(image_bytes=ocr_bytes)
    print(text, time.time() - st)# ModelType.Captcha 可识别4-6位验证码
sdk = muggle_ocr.SDK(model_type=muggle_ocr.ModelType.Captcha)
for i in range(5):
    st = time.time()
    # 3. 调用预测函数
    text = sdk.predict(image_bytes=captcha_bytes)
    print(text, time.time() - st)"""
使用自定义模型
支持基于 https://github.com/kerlomz/captcha_trainer 框架训练的模型
训练完成后,进入导出编译模型的[out]路径下, 把[graph]路径下的pb模型和[model]下的yaml配置文件放到同一路径下。
将 conf_path 参数指定为 yaml配置文件 的绝对或项目相对路径即可,其他步骤一致,如下示例:
"""
with open(r"test3.jpg", "rb") as f:
    b = f.read()
sdk = muggle_ocr.SDK(conf_path="./ocr.yaml")
text = sdk.predict(image_bytes=b)

你也可以通过如下仓库使用docker部署muggle-ocr。

  1. land007/docker_muggle_ocr: docker_muggle_ocr
  2. 20142995/muggle_ocr_flask

你可能感兴趣的:(#,Python,#,OpenCV,#,tensorflow,python,验证码,ocr,ddddocr,muggle-ocr)