百度AI开放平台:图像中的文字识别入门demo(Python)

0. 环境

Win Xp,Python2.7,百度云账号

1. 目标

体验百度AI开放平台的文字识别。效果还可以,不少服务对个人用户每天都有免费使用次数。

2. 百度智能云配置

需要有一个百度账号。百度云、百度文库等的账号其实是通用的。在这里https://ai.baidu.com/直接登录。在文字识别中,新建应用如下图所示。

百度AI开放平台:图像中的文字识别入门demo(Python)_第1张图片

以下需要用到的是AppID、API KEY、Secret Key这三个。

3. 安装Python版SDK

cmd中使用以下指令安装sdk:

python -m pip install baidu-aip

我之前已经安装过了。

百度AI开放平台:图像中的文字识别入门demo(Python)_第2张图片

4. 通用文字识别(高精度版)代码

这里我们体验一下通用文字识别(高精度版)。

新建一个文件:main.py并将以下代码复制进去。

# coding=utf-8

# 通用文字识别(高精度版)

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = '11019520'
API_KEY = '5yc5VWEpChFRlKq0ROZma4kj'
SECRET_KEY = '********'

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

image = get_file_content('example3.png')

""" 调用通用文字识别(高精度版) """
result = client.basicAccurate(image);
print str(result).decode('unicode_escape')  

""" 如果有可选参数 """
options = {}
options["detect_direction"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别(高精度版) """
result = client.basicAccurate(image, options)
print str(result).decode('unicode_escape')  

5. 试验

随便把一张带有文字的图片与main.py放在同一个目录下,并命名为example3.png

example3.png

百度AI开放平台:图像中的文字识别入门demo(Python)_第3张图片

命令行中运行:

python main.py

得到:

百度AI开放平台:图像中的文字识别入门demo(Python)_第4张图片

图中的文字基本都识别出来的。顺序是从上到下,英文和中文都可以。

你可能感兴趣的:(AI开放平台)