App Inventor2图像文字识别篇:找书神器

Idea源来:在图书馆中,找书虽然都有索引号,但是也只能知道一个大概的方位,在书海中寻找自己想要的那本书是需要一定时间的,是否可以利用人工智能对书架上的书籍进行批量识别,快速,准确地找出自己想要的书?

功能实现:

APK下载:

AIA下载:


所需Extension准备:

图片处理组件

下载

用于修改图片尺寸,加快上传速度。

图片编码Base64组件

下载

图片使用Base64编码上传。

逻辑设计说明:此应用是基于百度通用文字识别(高精度含位置版)API(网址:http://ai.baidu.com/),此API每日可免费调用50次。

点击右上角“控制台”,进入后,点击创建应用

创建时,关注接口选择是否包含“通用文字识别(高精度含位置版)”:

创建成功后,便可在应用列表看到应用对应的“API Key”和“Secret Key”

进入app inventor逻辑设计页面,修改Screen1.初始化模块组里的网址为

https://aip.baidubce.com/oauth/2 ... dentials&client_id=你的API Key&client_secret=你的Secret Key

百度API的调用需要Access Token参数,这个网址是为了获取你的用户对应的Access Token,为后续的API调用作准备

将图片上传到http://appbbs.gzjkw.net/others/ocr/index.php?ac=你的Access Token

进行处理,将会返回图片中包含的文本以及文本在图片中的坐标。以下是对WEB客户端返回文本json解码后的示例:

((log_id 6712369639687074622) (words_result (((location ((height 23) (left 36) (top 364) (width 18))) (words 2))

((location ((height 41) (left 49) (top 358) (width 71))) (words 223))

((location ((height 43) (left 600) (top 484) (width 20))) (words 大学)))) (words_result_num 3))

我们所需要的信息在键值对为“words_result”的列表中。

将这些信息储存在一个全局变量中,方便后续“搜索”的调用

以下模块是“搜索”功能的实现:

当搜索完毕时,在图片相应的坐标上写上文本“我在这里”

提升方向:

优化“搜索“功能的算法

你可能感兴趣的:(App Inventor2图像文字识别篇:找书神器)