关于python 语音转字幕,字幕转语音大杂烩

文字转语音

关于python 语音转字幕,字幕转语音大杂烩_第1张图片

Python语音合成之第三方库gTTs/pyttsx3/speech横评(内附使用方法)_python_脚本之家

代码示例

 from gtts import gTTS
 tts = gTTS('你好你在哪儿!',lang='zh-CN')
 tts.save('hello.mp3')
 import pyttsx3
 engine = pyttsx3.init() #创建对象
 """语速"""
 rate = engine.getProperty('rate') #获取当前语速的详细信息
 print(rate) #打印当前语速
 engine.setProperty('rate',200) #重设语速
  engine.say('Hello world!')
  engine.say('My current speaking rate is '+str(rate))
  engine.runAndWait()
 engine.stop()
 engine.save_to_file('你好,世界!明天你要去哪儿玩','test.mp3')
 engine.runAndWait()

相比之下gtts播报效果好一些,局限新大点,pyttsx3出了播报效果差点其他还行,灵活性比较好

语音转字幕,用的是whisper

whisper现有还不错的语音识别,里面有很多模型,看网上很多教程写的很杂,很蒙。此处简化操作。

import whisper
whisper_model = whisper.load_model("tiny")
result = whisper_model.transcribe(r"D:\xy_fs_try\video_to_deal\audio_realize\hello.mp3")
print(", ".join([i["text"] for i in result["segments"] if i is not None]))

此处需要安装ffmpeg ,不知道安装方法的自己去搜索。此处还有坑就是安装torch的问题,卸载原有的torch 安装一下命令即可

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

你可能感兴趣的:(语音识别,人工智能)