一.语音合成是什么
语音合成也就是TextToSpeech,简称TTS,即把文本转换成语音的意思。安卓系统自带TTS引擎,默认为Pico引擎,如下图所示:
可惜的是Pico引擎不支持中文, 你也可以装上支持中文的第三方引擎,比如著名的科大讯飞,然后在在默认引擎那里把它勾选上,就可以了。
二. 实现语音合成
1.我们先用系统自带的TTS来实现吧.
代码很简单,创建一个TextToSpeech对象,先初始化配置,然后调用speak方法,传入三个参数就可以了,第一个参数为文本内容,第二个为发音模式,第三个传null即可.
// 实例并初始化TTS对象
mTextToSpeech = new TextToSpeech(this,new TextToSpeech.OnInitListener() {
@Override
public void onInit(int status) {
if (status == TextToSpeech.SUCCESS) {
// 设置朗读语言
int supported = mTextToSpeech.setLanguage(Locale.ENGLISH);
if ((supported != TextToSpeech.LANG_AVAILABLE)
&& (supported != TextToSpeech.LANG_COUNTRY_AVAILABLE)) {
Toast.makeText(MainActivity.this, "不支持当前语言",0).show();
}
}
}
});
调用speak方法
//朗读
mTextToSpeech.speak(content,TextToSpeech.QUEUE_FLUSH, null);
2.使用科大讯飞实现
先去科大讯飞SDK官网创建应用,然后下载在线语音合成SDK,导入工程,进行一些配置。详细可以去查官网.
主要代码如下:
SpeechUtility.createUtility(context, SpeechConstant.APPID + "=571dd0b9");
// 1.创建SpeechSynthesizer对象, 第二个参数:本地合成时传InitListener
SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer(context,
null);
// 2.合成参数设置,详见《科大讯飞MSC API手册(Android)》SpeechSynthesizer 类
mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");// 设置发音人
mTts.setParameter(SpeechConstant.SPEED, "50");// 设置语速
mTts.setParameter(SpeechConstant.VOLUME, "80");// 设置音量,范围0~100
mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD); // 设置云端
// 设置合成音频保存位置(可自定义保存位置),保存在“./sdcard/iflytek.pcm”
// 保存在SD卡需要在AndroidManifest.xml添加写SD卡权限
// 如果不需要保存合成音频,注释该行代码
mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./sdcard/iflytek.pcm");
// 3.开始合成
mTts.startSpeaking(content, mSynListener);
需要传入一个合成监听器SynthesizerListener对象,可以监听开始播放、暂停播放等事件.
// 合成监听器
private SynthesizerListener mSynListener = new SynthesizerListener() {
// 会话结束回调接口,没有错误时,error为null
public void onCompleted(SpeechError error) {
}
// 缓冲进度回调
// percent为缓冲进度0~100,beginPos为缓冲音频在文本中开始位置,endPos表示缓冲音频在文本中结束位置,info为附加信息。
public void onBufferProgress(int percent, int beginPos, int endPos,
String info) {
}
// 开始播放
public void onSpeakBegin() {
}
// 暂停播放
public void onSpeakPaused() {
}
// 播放进度回调
// percent为播放进度0~100,beginPos为播放音频在文本中开始位置,endPos表示播放音频在文本中结束位置.
public void onSpeakProgress(int percent, int beginPos, int endPos) {
}
// 恢复播放回调接口
public void onSpeakResumed() {
}
// 会话事件回调接口
public void onEvent(int arg0, int arg1, int arg2, Bundle arg3) {
}
};
这样就可以了。科大讯飞语音SDK还有很多功能,有兴趣的朋友可以去看看。
这是我自己做的Demo截图:
附上Demo下载地址:点击打开链接