这个模块ddddocr用于OCR识别还是不错的,安装也很简单
直接pip install ddddocr 即可
安装好后,测试一下:
在1.2.0开始,ddddocr的识别部分进行了一次beta更新,主要更新在于网络结构主体的升级,其训练数据并没有发生过多的改变,所以理论上在识别结果上,原先可能识别效果的很好的图形在1.2.0上有一小部分概率会有一定程度的下降,也有可能原本识别不好的图形在1.2.0之后效果却变得特别好。 测试代码:
import ddddocr
ocr = ddddocr.DdddOcr()
with open("test.jpg", 'rb') as f:
image = f.read()
res = ocr.classification(image)
print(res)
由于事实上确实在一些图片上老版本的模型识别效果比新模型好,特地这次更新把老模型也加入进去了,通过在初始化ddddocr的时候使用old参数即可快速切换老模型
import ddddocr
ocr = ddddocr.DdddOcr(old=True)
with open("test.jpg", 'rb') as f:
image = f.read()
res = ocr.classification(image)
print(res)
个人用的是旧的
是不是发现默认打印了三行文字,那怎么更改呢?
下面就来简单的说一下哈
我用的是vscode IDE
摁着Ctrl+鼠标点击下面截图 圈中的ddddocr模块
就跳到了 相关文件里面去了,然后把下图中圈中的后两行注销掉,第一行咱们就保留前面几个字符:
在运行一下,看下结果:
符合预期,搞定