基于QT C++封装微软开源的edge-TTS

微软Edge TTS是一种先进的语音合成技术,它能够将文本转换为自然流畅的语音。该技术基于深度学习和人工智能技术,能够模拟人类语音的音调、语速、语调和情感,使得合成的语音听起来非常自然。

微软edge-tts项目地址:GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python (without needing Microsoft Edge/Windows or an API key)。(推荐使用python3.10及以上环境)。

可以直接使用pip进行安装:

pip install edge-tts

常用命令:

列出所有支持的语音声音:

edge-tts --list-voices

根据语音生成mp3音频文件:

edge-tts --voice zh-CN-XiaoyiNeural --text "白日依山尽,黄河入海流。欲穷千里目,更上一层楼。春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。秦时明月汉时关,万里长征人未还。但使龙城飞将在,不教胡马渡阴山。" --write-media 123.mp3

由于需要安装python环境,在应用程序里面调用不方便,所以将其改写为QT C++版本。

原理:

下载源代码GitHub - rany2/edge-tts: Use Microsoft Edge's online text-to-speech service from Python (without needing Microsoft Edge/Windows or an API key)。在communica.py中发现edge-tts的本质是使用websocket和微软的服务器进行通信,服务器地址在constans.py中。由此可以使用QT QWebSocket来代替python的aiohttp.ClientSession来和TTS服务器进行通信,实现相同的功能。

项目demo下载地址如下,可以在windows 64位系统运行。

你可能感兴趣的:(音视频,语音识别)