世界总是因为懒人才开始变得越来越智能,看书、读报等诸如此类的事情,本身就是一个很放松的事情了,某一天懒人想用耳朵来完成看书、读报的事情,也就是将书和报纸的内容通过语音播放出来,文本转语音(Text to Speech以下简称TTS)的需求大概就是从此处开始的。后来去新公司上班时,也遇到了此类的需求延伸,大概需求内容是:当有新的订单时,需要使用语音播报新订单的内容。由此下面来记录下TTS的功能使用。
iOS平台在iOS7.0之前不支持TTS功能,如果开发者想使自己的App具有TTS功能,可配置工程最低支持版本为iOS7.0或更高的系统版本。如果需要兼容iOS7.0以下的版本,则可使用好用的第三方TTS库。
目前支持iOS平台的TTS有以下几个
1.Google的在线语音合成服务
2.iOS7及其以上的系统自带的TTS功能(条件)
一、Google的在线语音合成服务
请求接口地址:http://translate.google.com/translate_tts
请求接口参数:
Item | Value |
---|---|
tl | 语言码(例如:en、zh) |
q | 需要播报的内容 |
例子:按要求拼接请求地址
http://translate.google.com/translate_tts?tl=en&q=English
访问该地址就能获取到一个mp3格式的文件,得到mp3文件后并在本地进行播放就达到了TTS的功能要求了。
总结:如果App中需要的是固定的语音播报,使用google的这个在线服务是个不错的选择,只需要一次请求,将返回的mp3保存在本地,以后直接读取本地mp3即可。但是大部分场景都是需要转换为语音的文本不固定,我们就只能选择别的办法了。
二、iOS7及其以上的系统自带的TTS功能
iOS7及其以上的系统自带TTS很简单,不用设置任何权限,也没有一大堆代码。
具体步骤:
第一步:在工程中导入AVFoundation.Framework框架
第二步:添加调用TTS功能的代码
源代码块:
/**
系统支持的语言及其语言码(language)
"th-TH":[], "pt-BR":[], "sk-SK":[], "fr-CA":[],
"ro-RO":[], "no-NO":[], "fi-FI":[], "pl-PL":[],
"de-DE":[], "nl-NL":[], "id-ID":[印尼语], "tr-TR":[],
"it-IT":[], "pt-PT":[], "fr-FR":[], "ru-RU":[],
"es-MX":[], "zh-HK":[中文香港], "sv-SE":[], "hu-HU":[],
"zh-TW":[中文台湾], "es-ES":[], "zh-CN":[中文大陆], "nl-BE":[],
"en-GB":[英语国标], "ar-SA":[], "ko-KR":[], "cs-CZ":[],
"en-ZA":[], "en-AU":[], "da-DK":[], "en-US":[英语美国],
"en-IE":[], "hi-IN":[], "el-GR":[], "ja-JP":[]
**/
AVSpeechUtterance *utterance = nil;
AVSpeechSynthesizer *speech = [[AVSpeechSynthesizer alloc] init];
utterance = [[AVSpeechUtterance alloc] initWithString:@"这只是简单使用文本转语音功能"];
utterance.voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"en-US"];
utterance.rate = AVSpeechUtteranceDefaultSpeechRate; //设置语速
utterance.volume = 1.0f; //设置音量
utterance.pitchMultiplier = 1.0f; //设置语调
[speech speakUtterance:utterance];
虽然在语速、停顿上效果都很生硬,但对于使用简单的语音播报需求来说,真是一大幸事,无需第三方库就完成了,也不需要联网,语音合成功能在手机上完成,这样在没有wifi与流量的情况下也可以使用了。
三、后续追加的其他TTS库使用
第一个:OpenEars和FliteTTS服务
OpenEars和FliteTTS。OpenEars是开源的iOS库,支持离线的语音识别和TTS,但它主要是针对英语。而FliteTTS比较小巧,也不支持中文。
第二个:科大讯飞语音以及百度语音
暂时还没使用过,如果哪位同学使用过,也可以分享下。