DDDD-OCR二次开发【增强版】- 支持指定字符集

DDDD-OCR增强版,就增加了一个功能:支持指定字符集。

你们是否在使用过程中遇到1识别成l,0识别成o的情况,但是实际上你所需要识别的文本中并不存在字符l和o,你需要识别的内容可能是纯数字的文本却经常识别成英文,如果遇到这种困扰,这一版增强中,便为你们解决了这个难点,

DDDD-OCR二次开发【增强版】- 支持指定字符集_第1张图片
DDDD-OCR二次开发【增强版】- 支持指定字符集_第2张图片
DDDD-OCR二次开发【增强版】- 支持指定字符集_第3张图片

能够看到两个对比图,限定字符集之后,便只在这个字符集中选取最优结果了。

项目的源码基于 https://github.com/kerlomz/muggle-dl-deploy 项目,编译脚本使用test_compile.py 进行编译,模型来源于DDDD-OCR(https://github.com/sml2h3/ddddocr)提供的模型。部署采用的是FaskAPI+Gradio前端,部署之后可以用浏览器访问:http://127.0.0.1:19199/preview ,进行可视化测试,该部署服务还可以同时部署麻瓜系列框架的识别项目。

上述使用的测试代码

import base64
import grequests
import time

st = time.time()
with open(r"D:\Workplaces\Python\Framework\muggle-dl-deploy\projects\ddddocr\demo\image.png", "rb") as f:
    b = f.read()
req_list = [grequests.post("http://127.0.0.1:19199/runtime/text/invoke", json={
        "image": base64.b64encode(b).decode(),
        "project_name": "ddddocr",
        "extra": {"label_map": ["级", "速", "焕", "新"]}
    }) for i in range(10)]
res_list = grequests.map(req_list)
for response in res_list:
    if not response:
        continue
    print(response.text)
print(time.time() - st)

下载地址:

链接:https://pan.baidu.com/s/1Pr2s_2tIByDNM1uiiO-oSA?pwd=3a5b
提取码:3a5b
–来自百度网盘超级会员V5的分享

你可能感兴趣的:(OCR,验证码识别,深度学习,OCR,验证码识别)