asp识别增值税发票,利用百度ocr识别,专票,全电发票,普票等用asp编写

昨天接到一个写asp的朋友信息,他领导让他写一个识别增值税发票的代码,把电子发票pdf文件上传后,能把所有信息识别完导入数据库。看似简单的需求可把我这位朋友难为到了,昨晚非拉着我去吃喝洗,一条龙伺候,我都给他说了,这是小事,有吃饭的时间就写完了,他非不听,非要排面,整的我一晚上晕头转向的,今天研究了半天,说难不难,说不难吧又好多坑,先说遇到的坑,由于是接入了百度的ocr,他的开发文档做的全靠猜,绕来绕去的,搞两小时。然后上传pdf文件,又遇到坑了,需要先转成二进制后,在去识别,直接识别不行,这个坑又玩了1个多小时,用了半天才搞定,有这个需求的可以直接拷代码,对于asp用户来说,搞这些确实有些难了,但是asp用户量还很大,估计用的人比较多,不说了,上代码:

下面就是asp写的ocr识别增值税发票的代码,不光是增值税发票,专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票等全可以识别:

Set objStream = Server.CreateObject("ADODB.Stream")'创建了一个ADODB.Stream对象,并将其赋值给objStream变量。

    ' 设置Stream对象属性
    objStream.Type = 1 ' adTypeBinary,将objStream对象的Type属性设置为1,表示二进制数据。
    objStream.Open'打开objStream对象。
    objStream.LoadFromFile Server.MapPath(filePath)'从指定的文件加载数据到objStream对象中。Server.MapPath(filePath)用于将相对路径转换为服务器上的绝对路径。

    ' 读取二进制数据
    Dim binaryData
    binaryData = objStream.Read'读取objStream对象中的二进制数据,并将其存储在binaryData变量中

    ' 关闭Stream对象
    objStream.Close
    Set objStream = Nothing

    ' 将二进制数据转换为Base64格式
    Dim base64, dm, elen, i
    Set dm = Server.CreateObject("MSXML2.DomDocument")
    Set elen = dm.CreateElement("tmp")'创建了一个MSXML2.DomDocument对象,并利用其将二进制数据转换为Base64格式的字符串。
    elen.dataType = "bin.base64"
    elen.nodeTypedValue = binaryData
    base64 = elen.text
    Set elen = Nothing
    Set dm = Nothing

    ' 返回Base64编码结果
    FileToBase64 = base64'将Base64编码的结果赋值给FileToBase64函数,并作为函数的返回值。

set obj = getjson(res)
        if isobject(obj) Then
            response.Write(obj.words_result.PurchaserName)&"
"
            response.Write(obj.words_result.AmountInFiguers)&"
"
            response.Write(obj.words_result.AmountInWords)&"
"
            response.Write(obj.words_result.SellerBank)&"
"
            response.Write(obj.words_result.InvoiceCode)&"
"
            response.Write(obj.words_result.SellerName)&"
"
        End If
    set obj = Nothing

asp编写的代码可实现对增值税普票、专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票等的识别,包括发票基本信息、销售方及购买方信息、商品信息、价税信息等,其中五要素字段的识别准确率超过 99.9%; 同时,支持对增值税卷票的 21 个关键字段进行识别,包括发票类型、发票代码、发票号码、机打号码、机器编号、收款人、销售方名称、销售方纳税人识别号、开票日期、购买方名称、购买方纳税人识别号、项目、单价、数量、金额、税额、合计金额(小写)、合计金额(大写)、校验码、省、市,四要素字段的识别准确率可达95%。

你可能感兴趣的:(ocr,asp识别百度ocr,asp识别增值税发票,asp识别发票,asp百度识别)