基于ocr的硬字幕提取

在某些场景下,我们需要提取视频文件中的字幕信息。

视频字幕分为两种,硬字幕和软字幕。硬字幕就是固定在画面上的,不能关闭的。 软字幕就是可以开关的。

软字幕是有单独的文件存储,所以想要做其他用处是比较方便的;硬字幕的提取就比较麻烦了,需要使用一些特别的方法。

本文给大家介绍一款软件,可以将视频的硬字幕提取出来。

该软件主要实现了以下功能:

  • 提取视频中的关键帧
  • 检测视频帧中文本的所在位置
  • 识别视频帧中文本的内容
  • 过滤非字幕区域的文本,去除水印(台标)文本
  • 去除重复字幕行,生成 srt 字幕文件
  • 支持视频字幕批量提取(打开文件的时候选择多个视频)
  • 多语言:支持中文/英文日语韩语阿拉伯语繁体中文法语德语俄语西班牙语葡萄牙语意大利语字幕的提取
  • 多模式:
    • 快速 - 快速提取字幕但可能丢字幕(推荐)
    • 精准 - 不丢字幕但速度较慢

注意:视频以及程序路径请不要带中文和空格,否则可能出现未知错误!!!

软件开启方法如下

  1. 在本文最下方的链接中下载程序包;

  2. 打开解压好的文件夹,在地址栏输入 cmd 打开命令行窗口

    注意:确保电脑安装了Python解释器;

    基于ocr的硬字幕提取_第1张图片

  3. 在命令行窗口输入以下命令,点击 Enter运行指令安装对应模块,安装成功后,之后使用软件只需要执行第4步即可

    pip install -r requirements.txt
    
  4. 在终端执行以下命令开启软件

    python gui.py
    

操作方法

点击【打开】后选择视频文件,调整字幕区域,点击【运行】等待即可。

运行时间较长,耐心等待即可,命令行窗口可以看到大概进度。

完成后可以在视频目录中看到生成的字幕文件。

基于ocr的硬字幕提取_第2张图片

软件特点

  • 采用本地进行 OCR 识别,无需设置调用任何 API
  • 支持 GPU 加速,有兴趣可以阅读文件夹中的说明文档探索一下,GPU 加速后可以获得更高的准确率与更快的提取速度
  • ( CLI 版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
  • ( GUI 版本) 图形化界面

提取速度

  • ( CLI 版本) 无需用户手动设置字幕区域,项目通过文本检测模型自动检测字幕区域
  • ( GUI 版本) 图形化界面

下载链接

你可能感兴趣的:(软件教程,视觉检测,计算机视觉)