Python:截取图片后识别文字输出至剪切板


1. 背景

  偶尔截取了一张图片,需要拷贝其中的文字(如下图),用键盘打字嫌麻烦,又容易出错。现希望对截图进行文字识别,并将结果保存至剪切板,方便直接粘贴。

需要拷贝其中文字的截图

2. 搭建环境

1、 安装keyboard、Pillow、baidu-aip和pyperclip四个第三方库。

第三方库 作用
keyboard 获取鼠标键盘输入的内容
当截图后按ctrl+v,程序才会进行后续操作
Pillow 从剪切板获取图片并保存
baidu-aip 识别图片中的文字并输出
pyperclip 保存文字至剪切板
程序运行所需第三方库

2、 打开百度API网络图片文字识别,点击 “立即使用” 。登录百度账号,点击 “创建应用” 。记录APP_ID,API_KEY和SECRET_KEY这3个关键信息。详细创建和调用过程可以参考python怎么使用百度文字识别功能和百度API接口说明。

百度API网络图片文字识别
百度API创建应用界面
应用列表

3. 源代码

import keyboard  # 用于获取鼠标键盘输入
from PIL import ImageGrab  # 用于从剪切板获取图片并保存
from aip import AipOcr  # 用于识别图片中的文字并输出
import pyperclip  # 用于将识别出的文字放置到剪切板中方便直接粘贴

if __name__ == '__main__':
    # 按ctrl+c后才执行下面的语句
    keyboard.wait(hotkey='ctrl+c')
    # ctrl+c保存截图至剪切板, ImageGrab从剪切板读取图片
    img1 = ImageGrab.grabclipboard()
    # print(type(img))
    # 文件保存的名字
    img_path = '1.png'
    # 保存图片
    img1.save(img_path)
    # 百度api执行所需数据,运行需换成自己的APP_ID,API_KEY,SECRET_KEY
    APP_ID = '18083249'
    API_KEY = '27uw73zNq9iE8PYKOCbBaxpI'
    SECRET_KEY = 'cHBY3hDcsnV4cEQZib0VBHlGo75TMMCj'
    # 初始化AipOcr
    aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    with open(img_path, 'rb') as f:
        img2 = f.read()
    # print(type(img2))
    # 识别图片并返回结果
    result = aipOcr.basicAccurate(img2)
    data = ''
    for r in result['words_result']:
        data = data + r['words'] + '\n'
    print(data)
    # 将文本复制到剪切板
    pyperclip.copy(data)

4. 使用步骤

  1. 点击运行程序;
  2. 使用截图工具截取图片,ctrl+c保存至剪切板;
  3. ctrl+v将剪切板内容粘贴到记事本。

5. 运行结果

控制台输出结果
Ctrl+V粘贴至记事本

你可能感兴趣的:(Python:截取图片后识别文字输出至剪切板)