最近有需求,在原有的h5新闻页面顶部添加一个语音播报功能,播放出当前页的文章,要两个方案,一个免费的一个收费的。就开始了解在线语音合成,最后决定免费用百度,收费的用讯飞。这篇将百度语音合成api的使用
本来的思路是在线请求,然后返回音频播放,然后了解到不论是百度的还是讯飞的一次转换数量都有限,这样的话分割文章会返回多个语音,然后上面的进度条就是一条语音的进度条,这样不行,后来想到先合成多个mp3音频,然后再合并成一个,那样在线合成会很慢。
最后就采用在上传文章时候一并上传合成好的MP3音频,然后一起上传到服务器,也就是一个html文章对应一个mp3,只需给路径就可以。这样就是一个完整的音频,进度条也就正确了。
其实发这个博客也想问问大家,如果在线的话如何解决慢的问题,或者有什么别的办法,还有就是打开文章时候得加载一个MP3文件很慢,如何使用缓存技术,没有弄过。希望弄过的 说一下,或者给出一些相关文章在评论中。谢谢QAQ
第一步:先去百度ai开放平台登录:(http://ai.baidu.com/),然后点击控制台,进去创建一个应用,就会看到appID和API Key,这两个值后面会用到。
第二步:点击下载 [百度官方demo],下载下来后解压,下面的目录就是java语言的语音合成,里面有四个类,分别是
speech-demo-master\speech-demo-master\rest-api-tts\java中的四个类
ConnUtil.java、
DemoException.java
TokenHolder.java
TtsMain.java
我们只需要修改TtsMain中的appKey
和secretKey
的值,填写你创建应用后,显示的值。执行main就可以生成一个文件了。
下面就是我修改后的TtsMain和control类以及请求的jsp,PS:我将四个文件放在一个文件中了
TtsMain.java
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.PrintWriter;
import java.net.HttpURLConnection;
import java.net.URL;
import org.json.JSONException;
public class TtsMain {
// 填写网页上申请的appkey 如 $apiKey="g8eBUMSokVB1BHGmgxxxxxx"
private final static String appKey = "你的";
// 填写网页上申请的APP SECRET 如 $secretKey="94dc99566550d87f8fa8ece112xxxxx"
private final static String secretKey = "你的";
// text 的内容为"欢迎使用百度语音合成"的urlencode,utf-8 编码
// 可以百度搜索"urlencode"
// 发音人选择, 0为普通女声,1为普通男生,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女声
private final static int per = 0;
// 语速,取值0-15,默认为5中语速
private final static int spd = 5;
// 音调,取值0-15,默认为5中语调
private final static int pit = 5;
// 音量,取值0-9,默认为5中音量
private final static int vol = 5;
// 下载的文件格式, 3:mp3(default) 4: pcm-16k 5: pcm-8k 6. wav
private final static int aue = 3;
public final static String url = "http://tsn.baidu.com/text2audio"; // 可以使用https
private static String cuid = "1234567JAVA";
public static void run(String txt,int order) throws IOException, DemoException, JSONException {//order为生成顺序
TokenHolder holder = new TokenHolder(appKey, secretKey, TokenHolder.ASR_SCOPE);
holder.refresh();
String token = holder.getToken();
// 此处2次urlencode, 确保特殊字符被正确编码
String params = "tex=" + ConnUtil.urlEncode(ConnUtil.urlEncode(txt));
params += "&per=" + per;
params += "&spd=" + spd;
params += "&pit=" + pit;
params += "&vol=" + vol;
params += "&cuid=" + cuid;
params += "&tok=" + token;
params += "&aue=" + aue;
params += "&lan=zh&ctp=1";
HttpURLConnection conn = (HttpURLConnection) new URL(url).openConnection();
conn.setDoInput(true);
conn.setDoOutput(true);
conn.setConnectTimeout(5000);
PrintWriter printWriter = new PrintWriter(conn.getOutputStream());
printWriter.write(params);
printWriter.close();
String contentType = conn.getContentType();
if (contentType.contains("audio/")) {
byte[] bytes = ConnUtil.getResponseBytes(conn);
String format = getFormat(aue);
File file = new File(order+"result." + format); // 打开mp3文件即可播放
// System.out.println( file.getAbsolutePath());
FileOutputStream os = new FileOutputStream(file);
os.write(bytes);
os.close();
System.out.println("audio file write to " + file.getAbsolutePath());
} else {
System.err.println("ERROR: content-type= " + contentType);
String res = ConnUtil.getResponseString(conn);
System.err.println(res);
}
}
// 下载的文件格式, 3:mp3(default) 4: pcm-16k 5: pcm-8k 6. wav
private static String getFormat(int aue) {
String[] formats = {"mp3", "pcm", "pcm", "wav"};
return formats[aue - 3];
}
}
control类,getStrList方法为按500长度分割方法。
方法转自:按指定长度分割的博客
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.util.ArrayList;
import java.util.List;
import javax.servlet.http.HttpServletRequest;
import org.json.JSONException;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.ResponseBody;
import com.chinaDaily.ttsdemo.DemoException;
import com.chinaDaily.ttsdemo.TtsMain;
import com.chinaDaily.webapi_tts.WebTTs;
import com.google.gson.Gson;
@Controller
public class get_WebTTs {
@RequestMapping("get_baiduWebTTs.action")
@ResponseBody
public String get_baiduWebTTs(HttpServletRequest request) throws DemoException, JSONException {
String txt = request.getParameter("txt");
try {
txt = new String(txt.getBytes("iso-8859-1"),"utf-8");
txt = java.net.URLDecoder.decode(txt,"UTF-8");
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
List strList = getStrList(txt,500);//按500长度分割
try {
for(int i=0;i getStrList(String inputString, int length) {
int size = inputString.length() / length;
if (inputString.length() % length != 0) {
size += 1;
}
return getStrList(inputString, length, size);
}
public static List getStrList(String inputString, int length,
int size) {
List list = new ArrayList();
for (int index = 0; index < size; index++) {
String childStr = substring(inputString, index * length,
(index + 1) * length);
list.add(childStr);
}
return list;
}
public static String substring(String str, int f, int t) {
if (f > str.length())
return null;
if (t > str.length()) {
return str.substring(f, str.length());
} else {
return str.substring(f, t);
}
}
}
jsp
<%@ page language="java" contentType="text/html; charset=UTF-8"%>
Insert title here
输入内容:
应该复制完,jar包齐全,不报错就可以运行,逻辑就是jsp发出请求,将txt传到后台,然后后台按500长度进行分割,循环请求百度的api,然后生成多个文件,再使用合成工具将多个MP3合成一个MP3。