调用阿里API实现图片中的文字识别

作者介绍

王雪玉,女,西安工程大学电子信息学院,2022级研究生
研究方向:机器视觉与人工智能
电子邮件:[email protected]

王泽宇,男,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组
研究方向:机器视觉与人工智能
电子邮件:[email protected]

一. 阿里云OCR算法介绍

1.1 阿里云OCR介绍

文字识别(OCR)可以将图片中的文字信息转换为可编辑文本,阿里云根据客户的业务场景和需求,将产品分为了通用文字识别、个人证照识别、发票凭证识别、教育场景识别、车辆物流识别、企业资质识别、小语种文字识别等几大类商品,可以满足各种客户的图片识别需求。

1.2 基于阿里云的OCR算法介绍

阿里云OCR是一款由阿里巴巴达摩院权威AI团队打造的全栈全场景OCR文本识别类产品。多年来, 通过持续整合前沿AI技术和行业实战经验,阿里云OCR打磨出了能够承载跨行业敏捷应用的技术架构,具备图像文字定位、文字识别和文字理解的全栈技术体系,形成了包含通用文本识别、卡证票据自动化分类及结构化识别、卡证票据混贴识别、表格文档批量结构化识别以及试题作业智能识别等全量OCR原子能力矩阵。支持公有云调用、私有化部署、终端 SDK 等云边端全业务场景服务能力。

二.调用阿里API实现网络图片中的文字识别实验过程

2.1 实验过程

进入阿里云官网(https://www.aliyun.com/)注册账号并登录
调用阿里API实现图片中的文字识别_第1张图片
在控制台搜索网络图片文字识别,选择目标产品
调用阿里API实现图片中的文字识别_第2张图片
领取免费的api,有效试用30天
调用阿里API实现图片中的文字识别_第3张图片
调用阿里API实现图片中的文字识别_第4张图片
往控制台,查看AppCode
调用阿里API实现图片中的文字识别_第5张图片

2.2 代码实现

# coding=UTF-8
import requests
host = 'https://imgurlocr.market.alicloudapi.com'
path = '/urlimages'
method = 'POST'
appcode = '你自己的AppCode'#开通服务后 买家中心-查看AppCode
querys = ''
bodys = {}
url = host + path
data = {'image':'http://img3.fegine.com/image/urlimage.png'}
# 或者base64
# data = {'image':'data:image/jpeg;base64,/9j/4A......'}
header = {"Authorization":'APPCODE ' + appcode}
try:
    res = requests.post(url,data,headers=header)
except :
    print("URL错误")
    exit()
httpStatusCode = res.status_code

if(httpStatusCode == 200):
    print("正常请求计费(其他均不计费)")
    print(res.text)
else:
    httpReason = res.headers['X-Ca-Error-Message']
    if(httpStatusCode == 400 and httpReason == 'Invalid Param Location'):
        print("参数错误")
    elif(httpStatusCode == 400 and httpReason == 'Invalid AppCode'):
        print("AppCode错误")
    elif(httpStatusCode == 400 and httpReason == 'Invalid Url'):
        print("请求的 Method、Path 或者环境错误")
    elif(httpStatusCode == 403 and httpReason == 'Unauthorized'):
        print("服务未被授权(或URL和Path不正确)")
    elif(httpStatusCode == 403 and httpReason == 'Quota Exhausted'):
        print("套餐包次数用完")
    elif(httpStatusCode == 403 and httpReason == 'Api Market Subscription quota exhausted'):
        print("套餐包次数用完,请续购套餐")
    elif(httpStatusCode == 500 ):
        print("API网关错误")
    else:
        print("参数名错误 或 其他错误")
        print(httpStatusCode)
        print(httpReason)

2.3 实验结果

调用阿里API实现图片中的文字识别_第6张图片

2.4 参考链接

1.https://help.aliyun.com/product/252763.html?spm=a2c4g.295338.0.0.18dd1defYQOBZX
2.https://blog.csdn.net/m0_37758063/article/details/123643861#:~:text=%E4%BD%BF%E7%94%A8python%E5%AF%B9%E9%98%BF%E9%87%8C%E4%BA%91%E7%9A%84,%E5%9B%BE%E7%89%87%E8%AF%86%E5%88%AB%20%E7%AE%97%E6%B3%95%E6%8E%A5%E5%8F%A3API%EF%BC%8C%E8%AF%86%E5%88%AB%E9%AA%8C%E8%AF%81%E7%A0%81%E4%B8%AD%E6%96%87%E5%AD%97%EF%BC%8C%E5%9B%BE%E5%83%8F%E6%95%B0%E6%8D%AE%E5%8F%AF%E4%BD%BF%E7%94%A8base64%E7%BC%96%E7%A0%81%E5%92%8Curl%E5%8F%82%E6%95%B0%EF%BC%88%E5%8F%AA%E8%83%BD%E5%90%8C%E6%97%B6%E4%BD%BF%E7%94%A8%E4%B8%80%E7%A7%8D%E6%A0%BC%E5%BC%8F%EF%BC%89%EF%BC%8C%E8%A6%81%E6%B1%82base64%E7%BC%96%E7%A0%81%E5%90%8E%E5%A4%A7%E5%B0%8F%E4%B8%8D%E8%B6%85%E8%BF%874M%EF%BC%8C%E5%9B%BE%E5%83%8F%E8%B6%8A%E5%B0%8F%E6%95%88%E7%8E%87%E8%B6%8A%E9%AB%98%EF%BC%8C%E6%94%AF%E6%8C%81jpg%2Fpng%2Fbmp%E6%A0%BC%E5%BC%8F%E3%80%82

你可能感兴趣的:(阿里云,云计算)