点亮设备,插上usb线,我们即将进入环境配置阶段。
插入设备前,应当保证自己的系统内具备adb环境。在terminal内确认一下
至于如何安装,可参考这位仁兄的博客
神奇传送门
然后我们第一步首先要帮助开发套件连接到我们的wifi中来。
根据《百度大脑-远场语音开发套件-RK3308开发平台使用说明.pdf》中所提到的wifi配置,可以顺利完成入网。这里我做一遍操作
使用数据线连接设备后,我们可以用
adb devices命令查询到开发套件
随后键入 adb shell,使用命令行调试设备
cd /data/cfg 进入到wifi配置文件的目录下
默认情况下家用路由器的话,只需要修改ssid(wifi名称)和psk(password key)即可。
若wifi有特殊情况,自行添加
key_mgmt=WPA-PSK // 加密方式
# key_mgmt=NONE // 不加密
随后输入
wpa_cli reconfigure
wpa_cli reconnect
此时此刻,我们就完成了设备入网了。
语音识别、合成都需要用到网络,所以一定要正确入网喔!
(蓝牙我目前用不到,所以暂时没有继续去配置)
接着我们来尝试启动语音识别的demo程序,来看一看环境是否正常
所有sdk资源及相关文件都在根目录oem文件夹内
根据产品说明书,我们需要先启动 alsa_audio_main_service服务。
启动它之前,我们需要对目录权限进行相关修改赋予权限后进行启动
multi_4_2 指的是使用4阵列板声卡2。&后台启动
启动了alsa服务后,我们就可以去前往中启动demo了
样例程序文件位于/oem/BDSpeechSDK/sample目录中, 运行时依赖lib、resources、extern目录中的库及资源文件。
所以我们需要在启动时共享库
关于共享库可以看这里
神奇传送门
我们运行指令
cd /oem/BDSpeechSDK/sample/wakeup
LD_LIBRARY_PATH=/oem ./e2e_wp_asr_test
试着喊一下"小度小度,今天天气怎么样"试试?
可以发现,这次套件采用了流式识别喔!附带中间结果的!
可能在英语方面还有待加强吧~
(也许是我的英语太散装了)
Can you speak english? Wow, you can.
关于语音合成
示例程序会将文本“456hello你好今天天气不错”传送给服务器,由服务器生成对应的语音,保存为pcm文件,用户可以进行播放体验。
在终端启动语音合成功能,生成文本“456hello你好今天天气不错”对应的语音。
cd /oem/BDSpeechSDK/sample/tts
LD_LIBRARY_PATH=/oem ./online_test
测试程序暂未提供用户传入合成文本生成语音的功能,用户可以参照样例程序自行开发。
运行结束后,会在当前目录下生成一个xxx.pcm,其中xxx是一个测试时的时间戳.在终端执行如下命令体验语音合成效果
aplay -t raw -c 1 -f S16_LE -r 16000 xxx.pcm