Python语音合成探究(二、朗读文本的编码问题)

        语音合成时,选取的朗读文本大多是网上收集来的TXT 文件,有些文件会因为编码原因打开不了,程序运行出错。

        如同样是 “离骚.txt ”文档,用 with open('离骚.txt') as file:  则提示错误:

Python语音合成探究(二、朗读文本的编码问题)_第1张图片

         如换成  with open('离骚.txt',encoding='utf-8') as file: 则运行正常:

Python语音合成探究(二、朗读文本的编码问题)_第2张图片

       有些文档则相反,前一行代码可以正常运行,后一行代码则提示错误。 上图中程序正常运行时边读音边出现相应文字字幕,是我在里边加入了相关代码,这个留待以后解决。

        究竟选择哪条代码,肯定是视文档编码而定。也可用代码来判断文档的编码,用if语句或try-except 来解决。

       对普通人而言,判断文档编码过于复杂,可以手工对文档转码,根据我的试验,大多可行,也有少数不行的。有时一段古文,很多段文字都可以,只要加入某段文字就会出错,估计是里面有语音“不认识”的字在里面,感觉有点玄学了。

      手工转码的方法,就是把TXT文档另存,在另存时选择其他编码,操作图示如下:

Python语音合成探究(二、朗读文本的编码问题)_第3张图片

你可能感兴趣的:(菜鸟学python,python,语音识别)