前言
早就写好了这个文章,今天就顺便发啦~
之前有个小的demo需要让程序说话,于是就研究了一下。
今天搞图像的萌新要开始搞语音生成。很奇怪。
首先在网上浏览,看到很多的大厂都有API,可以提供语音生成。
但是,仔细一想,我们开发的应用并不能保证一直处于联网状态。
依赖API比较麻烦。于是我决定调用python提供的包进行开发。
ps:语音生成是根据你提供的文字内容,机器自动念白,而非其他语音播放之类。有个小笨单就听岔了。
环境: python3 + pyttsx3(python的一个包,可以直接pip)
可能会有报错:
import win32com.client
ModuleNotFoundError: No module named 'win32com'
解决方案:
第一种 https://github.com/mhammond/pywin32/releases 下载对应python版本的文件
第二钟 直接安装 pywin32(pip install pywin32)
代码:
#coding: UTF-8
import pyttsx3
engine = pyttsx3.init()#初始化
engine.say(u"汉语:我爱你")#汉语
engine.say(u"英 语:I love you")#英语
engine.runAndWait()
这样子就可以说话啦~
因为是语音生成的新人,目前就研究出会说英语和汉语~
未来再学习吧~
看看还有什么补充