【你一定用的上】利用图片文字识别技术轻松解决复制粘贴文本困扰

工作中,我们经常会遇到需要复制PDF文档、或者图片中大段文字的需求。通常的办法只能老老实实的一个字一个字的手动打出来,但是这种方法效率极低,打字快的话还可以接受,最多落个手酸而已,如果打字比较慢的话这种方式简直不可忍受。不过,利用图片文字识别技术,我们可以轻松的解决这种烦恼。接下来就让我们来看一下比较常用的几种图文识别的方式吧!

方式一:通过tesseract-ocr识别

注意:该方法需要对有一定的计算机基础,不建议小白使用。

Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。

下载地址
具体的安装过程网上一大堆,这里就不重复介绍了。
使用很简单,在命令行输入tesseract input.png result -l chi_sim,其中input.png是你需要识别的图片,result指定识别结果的文件名,-l chi_sim指定使用中文识别。程序执行结束之后,再当前文件夹会有一个result.txt文件,即为识别结果。

输入图片.png

识别结果.png

可以看到,识别的结果还是可以的。

方式二:通过百度AI图文识别接口识别

注意:该方法需要有少量的编程基础,不建议小白使用。
百度AI开放平台
点击上方链接,进入百度AI开放平台,然后点击右上角控制台进入百度智能云-管理中心,需要登录,没有账号的话注册一个账号。

image.png

点击左侧导航的文字识别,创建应用。
image.png

image.png

创建成功之后,进入应用列表,获取AppIDAPI KeySecret Key,调用API需要使用这三个参数。
image.png

接下来,我们需要安装一下百度的SDK pip install baidu-aip,安装好之后就可以开始coding了,直接上代码:

from tkinter import *
import tkinter.filedialog
from os import path
from aip import AipOcr

# 百度OCR AppID  API Key  Secret Key
APP_ID = '**'
API_KEY = '**'
SECRECT_KEY = '**'

#利用百度api识别文本,并保存提取的文字
def baiduOCR(picfile):
    filename = path.basename(picfile)
    client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)
    i = open(picfile, 'rb')
    img = i.read()
    #message = client.basicGeneral(img)  # 通用文字识别,每天 50000 次免费
    message = client.basicAccurate(img)  # 通用文字高精度识别,每天 800 次免费
    i.close()
    # 获取文本内容
    result = []
    for text in message.get('words_result'):
        result.append(text.get('words') + '\n')
    return result  


def chooseFile():
    picfile = tkinter.filedialog.askopenfilename(
        initialdir='C',
        title='选择图片',
        filetypes=(("所有图片", ("*.jpg", "*.jpeg", "*.png")), ('All file', '*.*')))
    if picfile != '':
        label.config(text="开始文字识别处理...")
        words = baiduOCR(picfile)
        for word in words:
            text.insert("insert",word)
        label.config(text="图片文本提取结束!")
    else:
        label.config(text="您未选择文件!")

if __name__ == '__main__':
    root = Tk()
    root.title("图片文本提取")
    root.geometry("400x220")
    label = Label(root, text='')
    label.pack()
    button = Button(root, text='图片识别文字提取', command=chooseFile)
    button.pack()
    text = Text(root, width=45, height=10)
    text.pack(pady=5)
    root.mainloop()

运行程序,测试一下识别效果:


[图片上传中...(文字识别截图.png-45fade-1600836208610-0)]
文字识别截图.png

嗯,识别的是比方式一强了许多。

方式三:通过钉钉的拍图识字功能识别

简单易用,推荐。
操作很简单,准备好要识别的图片,发送到手机钉钉,打开文档的拍图识字功能选择图片识别后复制出文字即可。

截图.png

识别结果.png

综上来看,使用钉钉是最简单的方式了,唯一不方便之处在于只支持手机版App,但瑕不掩瑜,推荐大家使用该方式。

你可能感兴趣的:(【你一定用的上】利用图片文字识别技术轻松解决复制粘贴文本困扰)