百度AI中定额发票识别------莫的感情的学习笔记

人工智能应用基础

人工智能在身边的很多地方都开始普及,如:收集的面孔解锁、支付宝面孔支付、红绿灯违法人员身份等,人工智能出现在我们身边大大小小的地方。有了它,生活会变得也来越方便,那这门课便是初步学习及应用,创造自己的人工智能

主题:定额发票识别(文字识别)

首先,我们来观察一张定额发票
上面有指定省份税务局的盖章、发票代码、发票号码等,我们的任务就是截取下来(也不知道干嘛,又不能知道中没中奖),我们要接触到百度AI这个DD。

百度AI

百度AI是AI大开放平台,在这里,你可以接触到目前我们通常用的人工智能AI服务,是AI小白的好帮手。
百度AI:http://ai.baidu.com/
1、建立自己的百度账号(逛贴吧的各位不可能没有吧)
百度AI中定额发票识别------莫的感情的学习笔记_第1张图片
注册完后登陆控制台
百度AI中定额发票识别------莫的感情的学习笔记_第2张图片
进入控制界面,跟我选修的华为云服务控制太界面差不多…
百度AI中定额发票识别------莫的感情的学习笔记_第3张图片
现在可以在左边目录中选择你要创建的应用。这里我选择文字识别
百度AI中定额发票识别------莫的感情的学习笔记_第4张图片
这里我已经创建了一个应用,不过再演示一下
百度AI中定额发票识别------莫的感情的学习笔记_第5张图片
进入创建应用界面
百度AI中定额发票识别------莫的感情的学习笔记_第6张图片
这里说明,你在哪一个里面建立应用,百度AI会自动为你锁定与之相关的接口,其他相关的选项可以任意,这些基础的是不收费的,起码目前吧。
百度AI中定额发票识别------莫的感情的学习笔记_第7张图片
这是我的应用,这就是个百度AI的一个接口,你可以通过python等与之交互。

SDK下载

百度AI有与之对应的数据库需要下载
百度AI中定额发票识别------莫的感情的学习笔记_第8张图片
如图,我用的是python而且安装了pip最新版本,pip不是最新版本会提示要先安装pip最新版本
pycharm里安装baidu-aip
百度AI中定额发票识别------莫的感情的学习笔记_第9张图片
大体步骤文档百度AI有给:https://ai.baidu.com/docs#/OCR-Python-SDK/top
反正我没用懂URL,有点蒙,用的是自己的方法,走一步看一步吧。

from aip import AipOcr

# 定义常量
APP_ID = '你的AppID'
API_KEY = '你的API Key'
SECRET_KEY = '你的Secret Key 
# 据说老用户有个API_KEY对应百度云的“Access Key ID”,SECRET_KEY对应百度云的“Access Key Secret”

# 初始化文字识别分类器
aipOcr=AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
filePath = "./你的图片.jpg"
# ./的意思就是你py的当前目录

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 定义参数变量
options = {
    'detect_direction': 'true',
    'language_type': 'CHN_ENG',
}
# options={}
# options['language_type'] = 'CHN_ENG'
# options['detect_direction'] = 'true'
# options['detect_language'] = 'true'
# options['probability'] = 'false'

# 网络图片文字文字识别接口
result = aipOcr.webImage(get_file_content(filePath),options)
print(result)

代码行略有借鉴,之前CTRL+C的百度AI文档,但没弄懂
附上地址:https://blog.csdn.net/wc781708249/article/details/78559448

运行没问题的话,这是结果
{‘log_id’: 1993677554664198882, ‘direction’: 0, ‘words_result_num’: 19, ‘words_result’: [{‘words’: ‘Www.997788.cc中国收藏热线’}, {‘words’: ‘四川省德阳市地务’}, {‘words’: ‘额发票(有奖)’}, {‘words’: ‘兑奖联’}, {‘words’: ‘四川德阳市’}, {‘words’: ‘发票代码251061162003’}, {‘words’: ‘发票代码251061162003’}, {‘words’: ‘发票号码00337997’}, {‘words’: ‘票号码00337997’}, {‘words’: ‘密码’}, {‘words’: ‘密码’}, {‘words’: ‘奖区’}, {‘words’: ‘壹佰元整’}, {‘words’: ‘1刮开奖区覆盖层后显示中奖后中’}, {‘words’: ‘奖金额或“谢谢您’}, {‘words’: ‘加盖发票专用章有效)’}, {‘words’: ‘2在兑奖前不得将发票联和兑奖联’}, {‘words’: ‘撕开。否则,不予兑奖’}, {‘words’: ‘四川金税数码印务有限公司2011年6月印8000本(0500000100400000’}]}
很多我自己也没看到的DD,但目前我还没能做到文字检测,充其量就是图片文字识别,正在努力把字放在定额发票上,估计下一篇里我就差不多了吧(有那么一丁点头绪,用image库,在图片上写字,但就是不知道检测后写点什么上去,总不能写作者到此一游…)
一个计算机网络专业的新生,正在一点一点学习中,

你可能感兴趣的:(人工智能)