偶尔截取了一张图片,需要拷贝其中的文字(如下图),用键盘打字嫌麻烦,又容易出错。现希望对截图进行文字识别,并将结果保存至剪切板,方便直接粘贴。
1、 安装keyboard、Pillow、baidu-aip和pyperclip四个第三方库。
第三方库 | 作用 |
---|---|
keyboard | 获取鼠标键盘输入的内容 当截图后按ctrl+v,程序才会进行后续操作 |
Pillow | 从剪切板获取图片并保存 |
baidu-aip | 识别图片中的文字并输出 |
pyperclip | 保存文字至剪切板 |
2、 打开百度API网络图片文字识别,点击 “立即使用” 。登录百度账号,点击 “创建应用” 。记录APP_ID,API_KEY和SECRET_KEY这3个关键信息。详细创建和调用过程可以参考python怎么使用百度文字识别功能和百度API接口说明。
import keyboard # 用于获取鼠标键盘输入
from PIL import ImageGrab # 用于从剪切板获取图片并保存
from aip import AipOcr # 用于识别图片中的文字并输出
import pyperclip # 用于将识别出的文字放置到剪切板中方便直接粘贴
if __name__ == '__main__':
# 按ctrl+c后才执行下面的语句
keyboard.wait(hotkey='ctrl+c')
# ctrl+c保存截图至剪切板, ImageGrab从剪切板读取图片
img1 = ImageGrab.grabclipboard()
# print(type(img))
# 文件保存的名字
img_path = '1.png'
# 保存图片
img1.save(img_path)
# 百度api执行所需数据,运行需换成自己的APP_ID,API_KEY,SECRET_KEY
APP_ID = '18083249'
API_KEY = '27uw73zNq9iE8PYKOCbBaxpI'
SECRET_KEY = 'cHBY3hDcsnV4cEQZib0VBHlGo75TMMCj'
# 初始化AipOcr
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
with open(img_path, 'rb') as f:
img2 = f.read()
# print(type(img2))
# 识别图片并返回结果
result = aipOcr.basicAccurate(img2)
data = ''
for r in result['words_result']:
data = data + r['words'] + '\n'
print(data)
# 将文本复制到剪切板
pyperclip.copy(data)