EasyOCR是一个OCR三方库,可以方便地使用Python进行文字识别。
在命令提示符中,使用 pip 安装 EasyOCR 稳定版本
pip install easyocr
进入GitHub地址https://github.com/JaidedAI/EasyOCR,下载目标文件
在命令提示符中使用cd命令进入目标文件夹地址,在使用 Python setup.py install 命令进行预安装
完成安装的样子
随后使用pip命令对所需要的库进行安装
torch
torchvision>=0.5
opencv-python
scipy
numpy
Pillow
scikit-image
python-bidi
PyYAML
例如
pip install torch
import easyocr
reader = easyocr.Reader(['ch_sim','en']) # 只需要运行一次就可以将模型加载到内存中
result = reader.readtext('chinese.jpg')
输出将采用列表格式,每个项目分别表示边界框,文本和置信度。
#result 如下所示
[([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.3754989504814148),
([[86, 80], [134, 80], [134, 128], [86, 128]], '西', 0.40452659130096436),
([[517, 81], [565, 81], [565, 123], [517, 123]], '东', 0.9989598989486694),
([[78, 126], [136, 126], [136, 156], [78, 156]], '315', 0.8125889301300049),
([[514, 126], [574, 126], [574, 156], [514, 156]], '309', 0.4971577227115631),
([[226, 170], [414, 170], [414, 220], [226, 220]], 'Yuyuan Rd.', 0.8261902332305908),
([[79, 173], [125, 173], [125, 213], [79, 213]], 'W', 0.9848111271858215),
([[529, 173], [569, 173], [569, 213], [529, 213]], 'E', 0.8405593633651733)]
注1:[‘ch_sim’,‘en’]是您要阅读的语言列表。 您可以一次传递几种语言,但并非所有语言都可以一起使用。 英语与每种语言都兼容。 共享公共字符的语言通常相互兼容。
注2:您也可以将OpenCV图像对象(numpy数组)或图像文件作为字节传递,而不是filepath chinese.jpg。 原始图片的网址也是可以接受的。
注3:行reader = easyocr.Reader([‘ch_sim’,‘en’])用于将模型加载到内存中。 这需要一些时间,但只需要运行一次。
您还可以将detail设置为0,以简化输出。
reader.readtext('chinese.jpg', detail = 0)
Result:
['愚园路', '西', '东', '315', '309', 'Yuyuan Rd.', 'W', 'E']
如果您没有GPU或GPU的内存不足,则可以通过添加gpu = False在CPU模式下运行它
reader = easyocr.Reader(['ch_sim','en'],gpu = False)