Python练手项目之字幕识别

是这样子的,女朋友晚上突然翻到了自己喜欢看的一个电影,但是没有字幕,这让她很苦恼。

我急中生智,紧急地解决了我女朋友的需求。想到了使用 Python 做一个可以识别语音,然后翻译出来文字的软件。

 

Python练手项目之字幕识别_第1张图片

 

下图就是本篇文章所要完成的效果:

 

《甄嬛传》第一集的某一小段:

 

Python练手项目之字幕识别_第2张图片

 

Python练手项目之字幕识别_第3张图片

 

二、开发前的准备工作

 

首先,是需要在有道智云的个人页面上创建实例、创建应用、绑定应用和实例,获取调用接口用到的应用的 id 和密钥。具体个人注册的过程和应用创建过程详见文章不到 100 行代码搞定 Python 做 OCR 识别身份证,文字等各种字体

 

Python练手项目之字幕识别_第4张图片

 

三、开发过程详细介绍

下面介绍具体的代码开发过程。

 

1)接口规范说明

 

首先分析有道智云的 API 输入输出规范。根据文档来看,调用接口格式如下:

 

有道语音识别 API HTTPS 地址:

https://openapi.youdao.com/asrapi

 

接口调用参数:

字段名

类型

含义

必填

备注

q

text

要翻译的音频文件的 Base64 编码字符串

True

必须是 Base64 编码

langType

text

源语言

你可能感兴趣的:(Python,python,编程语言,程序人生,经验分享,机器学习)