快速傅氏变换之旅(五) 嵌入式中的FFT(最好选择DSP或FPGA)

欢迎大家提意见讨论。

转载请标明是引用于 http://blog.csdn.net/chenyujing1234

 例子代码:(编译工具:VS2005)

 

 

==================理论==================================================================================

傅立叶变换的重要性不用我说,想必大家也很清楚,有了傅立叶变换,我们就可以从信号的频域特征去分析信号。尤其在无线通信系统中,傅里叶变换的重要性就更加明显了,无论是设计者还是测试工程师,在工作中都会和傅立叶变换打交道。在以下的文章中,我给出一种傅里叶变换的C语言实现方法(参考了C常用算法集),可以用于在嵌入式系统中实现傅立叶变换。

 

常规的傅立叶变换算法并不适用于嵌入式控制系统,原因是运算量太大(涉及到复数运算),比如离散的傅立叶变换等同于用序列Y(n×1列矢量)乘以n×n 矩阵Fn,需要n×n次乘法。若n=1024,则是104,8576次乘法运算。哇,这么多呀!什么概念呢?如果你选用的CPU单周期指令为25ns, 单周期也可以完成一次乘法运算,那么要计算1024点的傅立叶变换则需要26.2144ms,这还不包括加法或其它运算,对于大多数实时系统,这个处理时间实在太长。于是寻找一个快速的傅立叶变换算法是人们所期望的。

 

本来我想把FFT的整个数学推导过程列完出来,但当自己硬着头皮看完后,发现对我没有任何用处,我又不是专门研究数学算法的,哪有那么多时间跟着书本的公式去慢慢推导。我想,这些推导问题还是让数学家想去吧。我需要的不过是理解它,然后学会应用它就行。有兴趣的读者可以参考相关的资料,这方面的资料实在太多了。

虽然FFT大幅度地降低了常规傅立叶变换的运算量,但对于一般的单片机或嵌入式设备(如ARM MIPS Linux)而言,处理FFT运算还是力不从心。主要原因是FFT计算过程中的蝶形运算是复数运算,要分开实部和虚部分别计算,想想这是多么繁琐的事情。可能会有些初学者认为,有这么复杂吗?我在PC上使用C++一样可以对复数直接进行加、减、乘、除运算。你说得不错,可以这么做,但那是C++封装了对复数处理的类,直接调用就行。在PC上运算这种类型的算法一般不考虑时间和空间,多一两秒的运行时间不会有什么灾难性的结果。

所以我们要衡量一个处理器有没有足够的能力来运行FFT算法,根据以上的简单介绍可以得出以下两点:

  1. 处理器要在一个指令周期能完成乘和累加的工作,因为复数运算要多次查表相乘才能实现。
  2. 间接寻址,可以实现增/减1个变址量,方便各种查表方法。FFT要对原始序列进行反序排列,处理器要有反序间接寻址的能力。

所以,在数字信号的分析处理应用中,DSP比其它的处理器有绝对的优势,因为DSP完全具备以上条件。这就是单片机(51系列,AVR,PIC等等)或ARM处理器很少用来进行数字信号分析的原因。

 

 

==================实践==================================================================================

在实践的偿试中比如从AD得到的数字信号的采样率为30K,

这么多的数据在800M的机器里做FFT得用700ms.而AD又一直产生,对于实时要求如此之高的应用这显示是不满足要求的.

当然不同的FFT算法可能得到的结果不一样

(算法可以参照我的两篇文章http://blog.csdn.net/chenyujing1234/article/details/7419863 http://blog.csdn.net/chenyujing1234/article/details/7416775)

 

如果在类似于示波器的模拟信号实时采测系统中,用到的FFT处理速度相当关键,系统所耗的时间为两部分:前端数据采集

(请参考http://blog.csdn.net/chenyujing1234/article/details/7545658),另一部分为FFT运算。

两者加起来时间如果过来就会造成前端采集数据丢失,有些网友讲把数据先存在RAM时,这必给RAM带来压力。

当然在非DSP上做FFT有一个好处就是能进行画像显示。但一屏数据在OnPaint时做一次也要4ms。(第一次初始化时是500ms).

这只能开发时用到。

综上所述,做FFT运算最好的平台为DSP或FPGA

 

 

你可能感兴趣的:(winCE,BSP/wince驱动,算法/面试题)