System Generator是Xilinx公司进行数字信号处理开发的一种设计工具,它通过将Xilinx开发的一些模块嵌入到Simulink的库中,可以在Simulink中进行定点仿真,可以设置定点信号的类型,这样就可以比较定点仿真与浮点仿真的区别。并且可以生成HDL文件,或者网表,可以在ISE中进行调用。或者直接生成比特流下载文件。能够加快DSP系统的开发进度。
音频格式即音乐格式。音频格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程。音频格式最大带宽是20KHZ,速率介于40~50KHZ之间,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。
主要包括WAVE、AIFF、MPEG、MP3、MPEG-4、MIDI、WMA、RealAudio、VQF、OggVorbis等格式。音频信号属于一维信号,下面介绍一些基本概念如下:
关于声道,这里简单说下单声道、双声道和立体声之间的区别:
单声道只能播放一个声道的歌(一般为左声道),而立体声是双声道的,能听到左右声道合成的声音,人的耳朵会分辨不出从哪个方向传来的,所以叫立体声 我们听声音时,可以分辨出声音是由哪个方向传来的,从而大致确定声源的位置。我们所以能分辨声音的方向,是由于我们有两只耳朵的缘故。例如,在我们的右前方有一个声源,那么,由于右耳离声源较近,声音就首先传到右耳,然后才传到左耳,并且右耳听到的声音比左耳听到的声音稍强些。如果声源发出的声音频率很高,传向左耳的声音有一部分会被人头反射回去,因而左耳就不容易听到这个声音。两只耳朵对声音的感觉的这种微小差别,传到大脑神经中,就使我们能够判断声音是来自右前方。这就是通常所说的“双耳效应”。
一般的录音是单声道的。例如一个音乐会的录音,从舞台各方面同时传来的不同乐器声音,被一个传声器接收(或被几个传声器接收然后混合在一起),综合成一种音频电流而记录下来。放音时也是由一个扬声器发出声音。我们只能听到各个方向不同乐器的综合声,而不能分辨哪个乐器声音是从哪个方向来的,感觉不到像在音乐厅里面听音乐时的那种立体感(空间感)。
如果录音时能够把不同声源的空间位置反映出来,使人们在听录音时,就好像身临其境直接听到各方面的声源发音一样。这种放声系统重放的具有立体感的声音,叫做立体声。
Xilinx block
System Generator
Gateway In
Gateway Out
Delay
其它block
mux(Simulink->mux):将多路数据组合为一路
From Multimedia File(Simulink->From Multimedia File):读取音频文件
To Multimedia File(Simulink->To Multimedia File):用于将信号以指定音频格式写入文件
文件
单声道音频文件(网上下载的多为双声道和立体声,所以需要利用格式工厂转化为单声道音频)
搭建如下模型:
Simulink的Audio System Toolbox中包含了与音频相关的block。上图中的From Multimedia File的作用是读取音频文件,音频文件的相关信息会显示在图标上(mono即表示单声道):
File name中选择音频文件路径;
Number of times to play file设置从文件中读取的音频信号时间
Samples per audio channel设置每个通道读取出的采样点数
音频信号需要通过Gateway In输入到FPGA,但Gateway In不能接收向量型数据,因此这个值通常设置为1更方便。
To Multimedia File用于将信号以指定音频格式写入文件:
File name设置输出音频文件的路径
File type设置输出音频文件格式
Audio compressor选择采用的音频压缩算法
Audio data type设置输出音频的数据格式,这里设置为与输入相同
此外,Audio System Toolbox中还有Audio Device Reader可以读取麦克风的音频数据;Audio Device Writer可以直接用扬声器播放声音而不用保存文件。但模型中使用这两个block时,仿真用时会比采用文件格式的输入输出长很多,因此在后面的设计中都采用文件格式做音频采集与输出。
现在单声道的音频文件很难找,因此使用“格式工厂”将立体声音频文件转换为单声道音频文件,用于设计仿真。System Generator和Gateway In的采样频率设置为48000Hz,仿真时长设置为15s,即只采集和输出15s的音频信号。
本设计采集到音频信号后不做任何处理直接输出,播放输出的音频文件。仿真过程中的几个注意项给出:
Xilinx block
System Generator
Gateway In
Gateway Out
Delay
其它block
mux(Simulink->mux):将多路数据组合为一路
From Multimedia File(Simulink->From Multimedia File):读取音频文件
To Multimedia File(Simulink->To Multimedia File):用于将信号以指定音频格式写入文件
文件
单声道音频文件(网上下载的多为双声道和立体声,所以需要利用格式工厂转化为单声道音频)
搭建如下模型:
To Multimedia File这个block支持向量形式输入,会导出立体声音频文件。使用Simulink中mux可以将多路数据组合为一路。
采集的单声道音频分为两路,为了区别左右声道一路经过一定单位的延时,再由Mux组合成向量形式输出为立体声音频文件。延时的方法只是粗略的实现了效果,实际中会采用一些专门的DSP算法达到更好的音效。
Xilinx block
System Generator
Gateway In
Gateway Out
其它block
demux(Simulink->demux):将一路分为多路数据组合
mux(Simulink->mux):将多路数据组合为一路
From Multimedia File(Simulink->From Multimedia File):读取音频文件
To Multimedia File(Simulink->To Multimedia File):用于将信号以指定音频格式写入文件
文件
立体声音频文件
如果From Multimedia File读取的是立体声音频文件,会以向量的形式输出数据。如果把立体声音频信号直接接到Gateway In会提示如下错误:
System Generator block只支持标量数据类型。Gateway In的图标中输入数据也变成了“?”。需要采集立体声音频时,必须用demux这个block将各声道的音频分开,分别进行信号处理。模型如下图:
搭建如下模型:
本文介绍了单声道和立体声音频信号在System Generator系统中的采集和输出方法,可以在此设计的基础上,在中间加入DSP算法做语音信号处理。
采集的单声道音频分为两路,为了区别左右声道一路经过一定单位的延时,再由Mux组合成向量形式输出为立体声音频文件。延时的方法只是粗略的实现了效果,实际中会采用一些专门的DSP算法达到更好的音效。
以前面文章讲述过的FIR数字滤波为例,做一个简单的DSP处理。语音信号的频率范围为300~3400Hz,老式电话通常选用8000Hz作为采样频率。设计一个FIR滤波器,将声音信号转换为“电话音”,按下图连接model:
Digital FIR Filter的滤波系数配置如下:
对输入的信号用8000Hz重新采样,通带范围为300~3400Hz。Convert截取滤波输出信号的位宽。运行仿真,播放输出音频,会发现其声音如同电话中的声音一样。