python提取视频字幕_GitHub - jiulinxiri/video-timeline-and-subtitle-extract: 视频时间轴及字幕提取...

视频时间轴及字幕提取

能帮助你:

1、识别字幕的时间轴

通过帧差法判断是否相同帧, 进而由相同帧得出字幕时间轴

计算时间轴对应帧的 SSIM , 合并相同的时间轴

2、利用OCR识别字幕

将指定字幕区域二值化得到只包含字幕的图片, 之后利用 OCR 精准识别字幕

目前使用百度 OCR , 腾讯 OCR 的接口

有生之年的目标是引入 tesseract-ocr

如何使用

系统环境

Windows 系统 ( macOS 未经测试, 但是理论上没有问题)

Python 3.x (建议 Python 3.7)

获取代码

1.下载 Source code 并手动安装所需模块

在 Release

页面下载 Zip 格式的 Source code 并解压

在命令行执行

pip install setuptools

pip install opencv-python Pillow scikit-image scipy requests ttkthemes

将会自动安装所依赖的模块

2.下载包含完整模块的压缩包

还可以 点击这里

下载包含完整模块的压缩包,可以无需安装模块直接运行

申请OCR

百度OCR

点击这里

在百度智能云创建文字识别应用, 在应用列表页面可以看到 API Key 和 Secret Key

你可能感兴趣的:(python提取视频字幕)