通过 Serverless Framework Component 和 OCR SDK, 我们能够快速部署一个基于 COS + API + SCF 的通用文字识别 OCR 应用,在部署之前,先来了解一下什么是 OCR。
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。
衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
腾讯云 OCR 基于腾讯优图实验室的深度学习技术,能够将图片上的文字内容,智能识别成为可编辑的文本。支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息,具有以下几个方面的优势:
而 Serverless Framework 与 OCR 的结合,为用户提供了方便快捷、成本更低的通用文字识别应用部署方案。
(1). 安装 Node.js
官网下载
https://nodejs.org/en/download/
xz -d node-v14.17.0-linux-x64.tar.xz
tar -xvf node-v14.17.0-linux-x64.tar
进入解压文件夹
cd node-v14.17.0-linux-x64
设置 node 和 npm 为全局变量
ln -s /tmp/upload/node-v14.17.0-linux-x64/bin/node /usr/local/bin/node
ln -s /tmp/upload/node-v14.17.0-linux-x64/bin/npm /usr/local/bin/npm
运行命令进行测试
node -v
正常输出版本号说明安装成功
(2). 开通 OCR 通用文字识别服务
打开官方链接
https://console.cloud.tencent.com/ocr/overview
安装 Serverless Framework
npm install -g serverless
设置 serverless 为全局变量
ln -s /tmp/upload/node-v14.17.0-linux-x64/bin/serverless /usr/local/bin/serverless
验证是否安装成功
serverless -v
结果如下
新建本地文件夹,使用 serverless init 命令,下载相关 template
mkdir ocr
cd ocr
serverless init ocr-app
创建完成
在 ocr-app 目录下找到 .env.example 文件,改名为 .env
mv .env.example .env
在里面输入账户、密钥信息和指定存储桶(用于存放上传的图像)
其中,账户、密钥信息可以在以下链接中找到
https://console.cloud.tencent.com/cam/capi
npm run bootstrap
执行以下命令进行部署
serverless deploy --all
部署成功后,可以使用浏览器访问项目的 website 链接(以下图片中绿色字体的上一行)
选择图片上传,项目即可通过 OCR SDK 自动完成文字识别
执行以下语句,可移除项目
serverless remove --all
【本文正在参与 “100%有奖 | 我的Serverless 实战”征稿活动】