Python验证码图片去噪并识别,tesserocr,image,numpy库的应用

import tesserocr
from PIL import Image
import numpy as np

if __name__ == '__main__':
    # step1 实例化一个图片对象 返回值是一个标签
    image = Image.open('./picture1.png')
    print(image)

    # step2 把图片对象转换为八位数的灰度图像 返回值是一个标签
    image = image.convert('L')
    print(image)
    
    # step3 把图片用他的数组形式表示
    image_array = np.array(image)

    # step4 提供数组形式把图片转化为黑白图
    # 处理数组(灰度大于五十的像素点转化为255白色,其余转为黑色)
    threshold = 50
    image_array = np.where(image_array > threshold, 255, 0)

    # step5 把新的图片数组转化为图片
    new_image = image_array.astype('uint8')
    image = Image.fromarray(new_image)

    # step6 提取图片中的文本信息并打印
    print(image_array)
    print(tesserocr.image_to_text(image))

    # 显示图片
    image.show()
    # 保存图片
    image.save('./picture2.png')

运行结果:

Python验证码图片去噪并识别,tesserocr,image,numpy库的应用_第1张图片


 

你可能感兴趣的:(python,python,爬虫)