python+pytesseract本地pdf识别转文字,图片识别转文字,避坑大量识别转文字时的内存泄露问题解决
需求背景1.调用第三方接口存在调用量限制,还需要付费,识别量比较大,所以需要本地识别技术实现采用python+pytesseract+pdf2image+poppler实现pdf和图片转文字具体代码【main.py】importpytesseractfrompdf2imageimportconvert_from_pathimportosimporttimetry:importImageexcept