AI初探——百度、阿里、腾讯开放平台OCR功能解析

最近有个小程序的项目,要求使用OCR对名片及车辆的照片进行智能识别。该文会将BAT AI平台OCR功能试用的情况进行详细说明。OCR测试源码已共享,具体参见文末。

AI初探——百度、阿里、腾讯开放平台OCR功能解析

网站初览

  1. 百度

百度AI平台也叫做百度大脑,分为开放能力、开发平台、行业应用、生态合作、AI市场、开发与教学等栏目。

百度在开发平台上较有特色:比如命名为飞桨的开源深度学习平台等

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第1张图片

百度开源深度学习平台

2、阿里

阿里的AI服务与阿里云深度集成:主要有文字、大数据、图影像、视觉、三维场景、机器学习、及各种行业场景的AI解决方案。比如阿里云AI助力新冠新药的研发。

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第2张图片

云计算

3、腾讯

腾讯AI开放平台主要分为技术引擎、解决方案、AI加速器、AI资讯、AI在腾讯、文档中心等 。

腾讯AI平台的特点是三大实验室:Ai Lab致力于人工智能;优图致力于识别技术;微信AI致力于微信生态链的人工智能技术。

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第3张图片

三大实验室


OCR功能初探

初步了解了BAT AI平台的情况后,接下来回到文章的主题,通过名片识别与车牌识别对三大平台OCR情况作逐一说明:

1、注册及开通

在BAT平台上使用AI开放能力都需要先进行注册,注册后可进入控制台开通对应的API接入。

调用OCR

考虑在windows桌面平台上进行测试调用,OCR调用客户端源码为C#,通过平台提供的Web Api接入方式进行Web调用及测试:具体可参见源码。首先看一下三大平台调用的效果情况:为保证测试的公平性,特地在平台页面下载了例图(百度和腾讯AI的名片图片与车牌图片,阿里云网站未找到例图)

AI初探——百度、阿里、腾讯开放平台OCR功能解析

名片例图1识别情况(百度AI网站下载 --名片测试.jpg,例图较模糊):

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第4张图片

  • 百度识别结果:”姓名“,”地址“能识别,电话号码识别错误,”公司“、”手机“、”邮箱“、”网址“,”部门“等未识别出

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第5张图片

  • 阿里识别结果: ”公司“,”地址“,”邮箱“,”部门“,”网址“,”姓名“,”移动电话“能识别,”工作电话"未识别

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第6张图片

  • 腾讯识别结果:几乎都识别出来了(“手机”将186误识为166),识别的“电话”也能带格式。

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第7张图片

名片例图2识别情况(腾讯AI网站下载 --名片测试.jpg,例图较清晰):

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第8张图片

  • 百度识别结果:能识别。

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第9张图片

  • 阿里识别结果:能识别。

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第10张图片

  • 腾讯识别结果:能识别“QQ”、“微信”。

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第11张图片

车牌例图1识别情况(百度AI网站下载 --车牌测试.jpg,车牌较近):

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第12张图片

  • 百度识别结果:能识别蓝牌与车牌号

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第13张图片

  • 阿里识别结果:能识别车辆类型与车牌号

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第14张图片

  • 腾讯识别结果:能识别车牌号

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第15张图片

车牌例图2识别情况( 腾讯AI网站下载 --车牌测试.jpg,车牌较小):

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第16张图片

  • 百度识别结果:

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第17张图片

  • 阿里识别结果:

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第18张图片

  • 腾讯识别结果:

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第19张图片

以上测试受限于电脑环境、网络情况等,仅做参考,无排名之分。


接入代码解析

  • 百度:
HTTP 方法: POST  
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/license_plate  
URL参数:ccess_token	(通过API Key和Secret Key获取的access_token)  
Header如下:  
Content-Type	application/x-www-form-urlencoded  
Body请求参数  
image	:	图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第20张图片

百度OCR调用源码截图

  • 阿里:
车牌调用地址:http(s)://ocrcp.market.alicloudapi.com/rest/160601/ocr/ocr_vehicle_plate.json  
请求方式:POST  
返回类型:JSON  
请求参数(Body):  
{  
    "image": "图片二进制数据的base64编码或者图片url"      #图片以base64编码的string  
}

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第21张图片

阿里OCR调用源码截图

  • 腾讯
传输方式	HTTPS  
请求方法	POST  
字符编码	统一采用UTF-8编码  
响应格式	统一采用JSON格式  
请求参数:  
app_id		应用标识(AppId)  
time_stamp		请求时间戳(秒级)  
nonce_str	随机字符串  
sign	签名信息,详见接口鉴权  
image	原始图片的base64编码数据(原图大小上限1MB,支持JPG、PNG、BMP格式)

AI初探——百度、阿里、腾讯开放平台OCR功能解析_第22张图片


该文对应的源码下载可参见 :https://github.com/zhuhuix/AITest

特别声明:该文为原创。(如有任何疑问可留言)

你可能感兴趣的:(AI)