《快速傅里叶变换的相关定义、原理及其递归算法》描述了FFT的最基本原理,按2来分解原DFT运算。实际上有效率更高的分解办法(视卷积双方的长度而定),当然效率虽更高却更难以理解。即使按2来分解,也有基于时域的和基于频域的区别,上文描述的是基于时域的,个人觉得这是最容易理解的一种FFT原理。本文描述此原理下的FFT的迭代实现。
仍然以8点DFT为例,考察其依次2分的过程,可以得到这样一个图:
要对序列{0~7}做一个DFT,根据FFT原理,只需对{0,2,4,6}以及{1,3,5,7}做DFT;继续划分,则需对{0,4}{2,6}{1,5}{3,7}做DFT;最后是对0,4,2,6,1,5,3,7分别作单点DFT。反过来,从下到上考察迭代操作,可以发现有很明显的规律。只需找出其一般规律,以及确定迭代变量即可。考虑中间一层计算的一般情况:
假设总长度N=2^L,当前要计算的节点所代表的序列长度为m,则这m个数都需要计算出来。根据FFT原理,这m个数中,前m/2个数的序列是其两个子节点带复根因子之和,而后m/2个数序列是带因子之差。这个操作称为蝴蝶操作。当然了,数学上可以这样描述序列是如何得到的,程序上这个序列中的每一个数仍然要一个一个算出来。所以这个蝴蝶操作需要m/2的循环。很明显,这一层一共有N/m个节点,每个节点当然都要计算一遍,所以需要N/m次循环。最后,这棵树一共有L层,需要逐层计算,所以一共有L次循环。所以,FFT的迭代实现有3层循环。
最后重新考虑一下2分过程的图,这个图的最底层其实是告诉我们计算顺序与源序列的顺序是不同的,计算顺序应该是源序列的0,4,2,6,1,5,3,7。所以我们形成一个新的计算序列,按照计算顺序保存源序列。再次画出迭代图:
注意到蝴蝶操作是2个输入2个输出,在本图中,假设输入是上一层的数,而输出则是这一层的数。这个图很清楚的说明:上一层0、2蝴蝶操作的结果在这一层仍然保存在0、2位置上,1、3蝴蝶操作的结果仍然保存在1、3位置上;上一层0、4蝴蝶操作的结果仍然保存在这一层的0、4位置,……。也就是 说我们只需使用一个数组,初始保存计算序列;迭代过程中则保存中间结果;迭代结束即为最终结果。
至于源序列的计算顺序很容易得到,04261537的二进制数分别是000, 100, 010, 110, 001, 101, 011, 111,每个数倒置一下得到000, 001, 010, 011, 100, 101, 110, 111,正好就是01234567。对于其他2的幂也是成立的。
所以FFT的迭代算法可以如下实现: