神经网络实用工具(整活)系列---使用OpenAI的翻译模型whisper实现语音(中、日、英等等)转中字,从此生肉变熟肉---基础篇

最近在做神经网络的研究,偶然间看到OpenAI开源出了一个多国语音转文字的模型,脑海里突然想到余大嘴在华为发布会发布实时语音翻译时满屏弹幕的“???”和“!!!”,于是决定做一个多国语音转简体中文字幕的软件来玩一玩。

想法是这样的:通过OpenAI最新发布的翻译模型whisper(可以翻译200多种语言,且其中部分语言的翻译效果已然接近甚至超过人类的神器)加上自己写的一点点程序,做一个傻瓜化的多国语言转中文字幕的软件。完成操作后,只需要通过简单的点击就可实现字幕的生成,从此告别生肉,不用苦等美剧、日剧字幕组的解救,或者毅然决然去学习该国语言。

PS:后续如果有空会出一个提高篇,直接将所有东西整合在一起,打包成大部分Windows电脑可直接双击运行的软件。

废话不多说,下面是计划的实施细节。

软件环境的搭建

1. 安装conda

地址如下:https://www.anaconda.com
下载完双击安装即可,安装完在程序列表中会出现一个叫做"Anaconda Prompt (Anaconda)"的东西,就是我们刚刚装的虚拟环境。

2. 创建虚拟环境

打开刚刚安装的Anaconda,输入如下指令:

conda create -n whisper python

你可能感兴趣的:(神经网络实用工具(整活)系列,神经网络,whisper,ffmpeg)