OCR中英文识别

sudo apt update
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
pip install pytesseract
whereis tesseract-ocr
sudo nautilus

下载中文包,放进安装文件夹。

https://github.com/tesseract-ocr/tessdata

/usr/local/share/tessdata/

tesseract --list-langs

 

举例

OCR中英文识别_第1张图片

import pytesseract
import cv2

img = cv2.imread('poet.jpeg')
text = pytesseract.image_to_string(img,lang='chi_sim', config='-psm 7')

print(text)

相 思
【 清 】 纳 兰 性 德
山 一 程 , 水 一 程 。 身 向 榆
关那畔行′ 夜 深 千 帐 灯 。
一 更 , 雪 一 更 。 聘 碎 乡
心梦不成】 故 园 无 此 声 。

还凑和。。

文本模式为7,代表是单行的文本。

你可能感兴趣的:(OCR中英文识别)