python 图片提取文字

目录

一. 环境准备

二.  安装pytesseract和PIL package 

1、pip命令安装

 2、使用pycharm编辑器安装

  3.代码和尝试运行

三、安装识别引擎tesseract-ocr

四. 执行 ok


一. 环境准备

1.1 python , pycharm

windows 7 

python-3.8.10-amd64.exe

PyCharm Community Edition 2023.1

download pycharm

https://www.jetbrains.com/pycharm/download/download-thanks.html?
platform=windows&code=PCC

download python
https://www.python.org/downloads/release/python-3113/

二.  安装pytesseract和PIL package 

1、pip命令安装

安装pytesseract

pip install pytesseract

python 图片提取文字_第1张图片

 

 2、使用pycharm编辑器安装

python 图片提取文字_第2张图片python 图片提取文字_第3张图片

 

  3.代码和尝试运行

源码如下:

python 图片提取文字_第4张图片

三、安装识别引擎tesseract-ocr

 download

tesseract-ocr-setup-4.00.00dev.exe

chi_sim.traineddata

python 图片提取文字_第5张图片

 

 2,安装完成tesseract-ocr后,需要做一下配置 。

python 图片提取文字_第6张图片

 python 图片提取文字_第7张图片

将tessdata目录的上级目录所在路径:(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中

 

python 图片提取文字_第8张图片 

四. 执行 ok

 重新启动pycharm 

执行ok

python 图片提取文字_第9张图片

 

你可能感兴趣的:(pycharm,ide,python)