1、支持对二代居民身份证正反面的关键字段识别,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限,识别准确率可达98%以上。
2、支持对营业执照关键字段的识别,包括单位名称、法人、地址、有效期、证件编号、社会信用代码等,准确率达94%以上。
整套OCR服务可以分为服务端与客户端。服务端搭建在私人云服务器上(当前配置为1核cpu,2GB内存,0GPU),使用流行的darknet模型对目标区域进行识别标记而后通过循环卷积神经网络进行文本识别。服务端对输入数据进行预处理(对于超大图片进行降采样、Base64编码等操作),通过系列的预处理操作降低服务器的压力,最后对于不同版面的识别,开发了对应的文本优化。核心服务端使用:tensorflow/ pytorch/ opencv等撸码。客户端借助hutool工具类解析和编码。
1、完美封装、真正的一行代码就可以调用高大上的服务(相比“某du”要方便些)。
OcrTask.run("front","D:\\Temp\\Dataset\\IdCard\\front\\1.jpg","D:\\Temp\\Dataset\\Output")
2、文字识别服务端可以局域网部署,保护用户隐私,而不是把证件提交到第三方服务器端,本文所提供的jar包只是让大家伙感受一下。