sox和ffmpeg 处理语音工具

1.截取长语音中的片段
sox input.wav output.wav trim start-time(s) duration(s)
例:将a.wav 截取0.1s至1.3s语音片段保存下来
sox a.wav b.wav trim 0.1 1.2

2.将多个短语音拼接成长语音
sox a.wav b.wav c.wav … -t wav -e signed-integer -b 16 -r 16000 - |
例:将a.wav与b.wav拼接成长语音c.wav
sox a.wav b.wav -t wav -e -signed-integer -b 16 -r 16000 c.wav

3.将pcm转wav
sox -t raw -c 1 -e signed-integer -b 16 -r 16000 input.pcm output.wav

4.查看wav的信息 sox 和soxi的区别
sox a.wav -n stat 输出的信息属于标准错误输出(stderr)类型打印在屏幕上
soxi a.wav 输出的信息属于标准输出(stdout)类型打印在屏幕上

5.sox将16k降采样到8k
sox -r 16000 input.wav -t 8000 output.wav

6.sox做增益 -v
sox -v 0.5 input.wav output.wav
将input.wav音量放大0.5倍后写入到output.wav

7.sox合并两条单通道数据为一条双通道数据 -M
sox a.wav b.wav -M stereo.wav

8.生成一条固定长度的空音频(silence)
ffmpeg -f lavfi -t 3 -i anullsrc=r=16000:cl=mono a.wav

ffmpeg -f lavfi -t 时长(s) -i anullsrc file.wav

默认的是44k双通道,需要指定采样率和通道数增加anullsrc=r=16000:cl=mono

你可能感兴趣的:(sox和ffmpeg 处理语音工具)