javaCV文字识别之2:视频文字识别和视频提取字幕文字字符

javacv文字识别系列:

javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别

javaCV文字识别之2:视频文字识别和视频提取字幕文字字符

前言

上一章我们实现了图片的文字识别和提取,本章基于javacv中的tesserac 和ffmpeg实现视频文字识别和提取

javacv中包含ffmpeg和tesserac两个库以及tesserac的依赖库leptonica。

读取视频帧javacv已经帮我们封装好了,直接就可以读取到视频帧,麻烦的是,测试的时候发现javacv设置像素格式不起效果,所以我们只能通过BufferedImage进行转换后才能进行图片文字识别,性能上肯定会有折扣,后面我会放出基于ffmpeg的解码并转换为rgb像素后提供给tesserac进行识别。

那么,就让我们开始吧。

注意:由于我们是每一帧都进行识别,而且视频播放和识别是相同线程,会阻塞,所以视频播放速度会很慢。

实现功能

1、视频读取

2、视频帧获取

3、视频帧转换为java的BuffredImage图片

4、图片转像素

5、使用像素数据进行tesserac ocr文字识别

 

完整阅读本章:https://eguid.blog.csdn.net/article/details/106044521

你可能感兴趣的:(javaCV文字识别之2:视频文字识别和视频提取字幕文字字符)