python学习⑥|基于tesseract的视频字幕提取

文章目录

  • 一、准备工作
    • 1、正常流程
    • 2、持续报错及解决
      • jupyter持续路径报错
      • 解决jupyter环境变量问题
      • 如何找到特定的路径
  • 二、正式开始
    • 1、最基本的识别-从读图开始
      • 基本思路
    • 2、提取字幕

一、准备工作

1、正常流程

参考教程链接:Tesseract OCR V5.0安装教程(Windows)

流程概览:

  • 下载tesseract程序
  • 设置环境变量
  • 检查是否安装成功
  • 使用拓展语言包-中文
  • 查看支持语言是否ok

2、持续报错及解决

jupyter持续路径报错

  pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH

用教程里的代测试了一些自己是否有安装成功,但jupyter一直报错。

反复订正自己的安装流程,确定没有一点点问题,但偏偏就给我整这么一出。
思来想去,可能是jupyter和原生python不一样(之前也遇到过同样的问题)。

于是在原生python中试了一下。

python学习⑥|基于tesseract的视频字幕提取_第1张图片
python学习⑥|基于tesseract的视频字幕提取_第2张图片

成了!!

解决jupyter环境变量问题

找到了问题所在,但解决仍然艰巨。
千辛万苦找到了这个教程:Jupyter notebok 环境配置,与kernel切换(切换虚拟环境)

python学习⑥|基于tesseract的视频字幕提取_第3张图片

新建了这两个环境变量。

如何找到特定的路径

C:\Users\ouoli\anaconda3\pkgs\python-

你可能感兴趣的:(python,jupyter,开发语言)