多项式有两种表示方法
系数表示法
就是最普通的表示方法,如
f ( x ) = a 0 x 0 + a 1 x 1 + a 2 x 2 + . . . . . . + a n − 1 x n − 1 f(x) = a_0x^0 + a_1x^1 + a_2x^2 + ...... + a_{n-1}x^{n-1} f(x)=a0x0+a1x1+a2x2+......+an−1xn−1则表示为 f ( x ) = { a 0 , a 1 , a 2 , . . . . . . , a n − 1 } f(x) = \{a_0, a_1, a_2, ......, a_{n-1}\} f(x)={a0,a1,a2,......,an−1}
点值表示法
用平面坐标系上的点来描述多项式的一种表示方法
对于一个多项式来说有 n 项,则可以通过 n 对 { x , y } \{x, y\} {x,y} 点对来进行系数求解,即对于上述式子来说还有
f ( x ) = { ( x 0 , f ( x 0 ) ) , ( x 1 , f ( x 1 ) ) , ( x 2 , f ( x 2 ) ) , . . . . . . , ( x n − 1 , f ( x n − 1 ) ) } f(x) = \{(x_0, f(x_0)), (x_1, f(x_1)), (x_2, f(x_2)), ......, (x_{n-1}, f(x_{n-1}))\} f(x)={(x0,f(x0)),(x1,f(x1)),(x2,f(x2)),......,(xn−1,f(xn−1))}这种表达方式
卷积
就是多项式相乘,对于2种不同的多项式表示法来说,做卷积的时间复杂度会不同
但是将系数表示法转换成点值表示法,如果用朴素的转换方法,也需要 O(n2) 的时间复杂度,所以采取DFT通过分治法来做
傅里叶变换中所有的 n 都为 2 的整数次幂
我们的目标是将系数表示法转换成点值表示法,如果随机选取 n n n 个点,再计算出它对应的 f ( x ) f(x) f(x),时间复杂度为 O(n2),因为对每个点都需要求 n n n 个 x i , i ∈ [ 0 , n − 1 ] x^i, i∈[0, n - 1] xi,i∈[0,n−1]
傅里叶选取了一些点,这些点满足它们的若干次方 = 1,这样可以使得带入之后不需要做这么多运算(但是时间复杂度仍是O(n2))
这些点都在复数平面直角坐标系里
圆上所有的点都满足傅里叶的要求
我们假设将其 n = 8 n = 8 n=8 等分,则会得到:
从 ( 1 , 0 ) (1, 0) (1,0) 按照逆时针进行编号,对于编号为 k 的点,记为 w n k w_n^k wnk,称为 n n n 次单位根,且
w n k = cos k n 2 π + i sin k n 2 π w_n^k = \cos{\frac{k}{n}2\pi} + i\sin{\frac{k}{n}2\pi} wnk=cosnk2π+isinnk2π
单位根的性质
简介
虽然通过DFT选出了便于计算的点,但是时间复杂度仍为 O(n2),但是通过分析多项式可以得到用分治法处理这些点的方式。
假设有
A ( x ) = Σ j = 0 n − 1 a i x i = a 0 + a 1 x 1 + a 2 x 2 + . . . . . . + a n − 1 x n − 1 A(x) = \Sigma_{j=0}^{n-1}a_ix^i = a_0 + a_1x^1 + a_2x^2 + ...... + a_{n-1}x^{n-1} A(x)=Σj=0n−1aixi=a0+a1x1+a2x2+......+an−1xn−1现在将 A ( x ) A(x) A(x) 中 x x x 的下标奇偶性将 A ( x ) A(x) A(x) 分成两部分
A ( x ) = ( a 0 + a 2 x 2 + a 4 x 4 + . . . . . . + a n − 2 x n − 2 ) + x ( a 1 + a 3 x 2 + . . . . . . + a n − 1 x n − 2 ) A(x) = (a_0 + a_2x^2 + a_4x^4 + ...... + a_{n-2}x^{n-2}) + x(a_1 + a_3x^2 + ...... + a_{n-1}x^{n-2}) A(x)=(a0+a2x2+a4x4+......+an−2xn−2)+x(a1+a3x2+......+an−1xn−2)所以有
A ( x ) = A 1 ( x 2 ) + x A 2 ( x 2 ) A(x) = A_1(x^2) + xA_2(x^2) A(x)=A1(x2)+xA2(x2)
当 k < n 2 k < \frac{n}{2} k<2n 的时候,将 w n k w_n^k wnk 作为 x x x 带入 A ( x ) A(x) A(x)
A ( w n k ) = A 1 ( ( w n k ) 2 ) + x A 2 ( ( w n k ) 2 ) = A 1 ( w n 2 k ) + x A 2 ( w n 2 k ) = A 1 ( w n 2 k ) + w n k A 2 ( w n 2 k ) \begin {aligned} A(w_n^k) &= A_1((w_n^k)^2) + xA_2((w_n^k)^2) \\ &= A_1(w_n^{2k}) + xA_2(w_n^{2k}) \\ &=A_1(w_{\frac{n}{2}}^k) + w_n^kA_2(w_{\frac{n}{2}}^k) \end {aligned} A(wnk)=A1((wnk)2)+xA2((wnk)2)=A1(wn2k)+xA2(wn2k)=A1(w2nk)+wnkA2(w2nk)
所以当取后半部分的时候,有 x = w n k + n 2 x = w_n^{k+\frac{n}{2}} x=wnk+2n
A ( w n k + n 2 ) = A 1 ( ( w n k + n 2 ) 2 ) + x A 2 ( ( w n k + n 2 ) 2 ) = A 1 ( w n 2 k w n n ) + w n k + n 2 A 2 ( w n 2 k w n n ) = A 1 ( w n 2 k ) − w n k A 2 ( w n 2 k ) = A 1 ( w n 2 k ) − w n k A 2 ( w n 2 k ) \begin {aligned} A(w_n^{k+\frac{n}{2}}) &= A_1((w_n^{k+\frac{n}{2}})^2) + xA_2((w_n^{k+\frac{n}{2}})^2) \\ &= A_1(w_n^{2k}w_n^n) + w_n^{k+\frac{n}{2}}A_2(w_n^{2k}w_n^n) \\ &= A_1(w_n^{2k}) - w_n^kA_2(w_n^{2k}) \\ &=A_1(w_{\frac{n}{2}}^k) - w_n^kA_2(w_{\frac{n}{2}}^k) \end {aligned} A(wnk+2n)=A1((wnk+2n)2)+xA2((wnk+2n)2)=A1(wn2kwnn)+wnk+2nA2(wn2kwnn)=A1(wn2k)−wnkA2(wn2k)=A1(w2nk)−wnkA2(w2nk)
可以看到对于 k = n 2 k = \frac{n}{2} k=2n 的中介线来说, A ( w n k ) A(w_n^k) A(wnk) 和 A ( w n k + n 2 ) A(w_n^{k+\frac{n}{2}}) A(wnk+2n) 都可以通过 w n 2 k w_{\frac{n}{2}}^k w2nk 进行计算
这样时间复杂度就降为了 O ( n l o g 2 n ) O(nlog_2n) O(nlog2n)
蝴蝶变换 Cooley-Turkey
刚提到对于当前层确定的位置 i i i,可以通过下一层的两个值对当前值进行更新
开始肯定想着用递归的方式进行操作,但是有更为便捷的二进制反转方法
k k k | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|---|
二进制 | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
一次变换之后,将偶数下标放在一起、奇数下标放在一起,重新变化成以下数列(前4个为一组,后4个为一组)
k k k | 0 | 2 | 4 | 6 | 1 | 3 | 5 | 7 |
---|
二次变换之后,将两组的奇次项、偶次项再分开,变成以下数列(2、2、2、2分组)
k k k | 0 | 4 | 2 | 6 | 1 | 5 | 3 | 7 |
---|
三次变换之后,已经变成单独的一个一个的了,再观察他们的二进制,和原始序列k作比较
原始 k k k | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|---|
二进制 | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
k k k | 0 | 4 | 2 | 6 | 1 | 5 | 3 | 7 |
二进制 | 000 | 100 | 010 | 110 | 001 | 101 | 011 | 111 |
这样的对比可以很容易看出,对于原始序列和变换之后的序列来说,他们就是对二进制做了一个反转操作,即 1 (001) 变成了 4 (100)
那如果我们在最开始的时候,就将序列做了二进制反转操作,就可以从前往后依次顺序运算,而不需要使用递归的方式
以刚刚的序列为例子
反转后的 k k k | 0 | 4 | 2 | 6 | 1 | 5 | 3 | 7 |
---|---|---|---|---|---|---|---|---|
计算内容 | A ( w 1 0 ) = a 0 w 1 0 A(w_1^0) = a_0w_1^0 A(w10)=a0w10 | A ( w 1 4 ) A(w_1^4) A(w14) | A ( w 1 2 ) A(w_1^2) A(w12) | A ( w 1 6 ) A(w_1^6) A(w16) | A ( w 1 1 ) A(w_1^1) A(w11) | A ( w 1 5 ) A(w_1^5) A(w15) | A ( w 1 3 ) A(w_1^3) A(w13) | A ( w 1 7 ) = a 7 w 1 7 A(w_1^7) = a_7w_1^7 A(w17)=a7w17 |
第一次合并
k k k | 0 | 4 | 2 | 6 | 1 | 5 | 3 | 7 |
---|---|---|---|---|---|---|---|---|
计算内容 | A ( w 2 0 ) = A 1 ( w 1 0 ) + w 2 0 A 2 ( w 1 4 ) A(w_2^0) = A_1(w_1^0) + w_2^0A_2(w_1^4) A(w20)=A1(w10)+w20A2(w14) | A ( w 2 4 ) = A 1 ( w 1 0 ) − w 2 0 A 2 ( w 1 4 ) A(w_2^4) = A_1(w_1^0) - w_2^0A_2(w_1^4) A(w24)=A1(w10)−w20A2(w14) | A ( w 2 2 ) A(w_2^2) A(w22) | A ( w 2 6 ) A(w_2^6) A(w26) | A ( w 2 1 ) A(w_2^1) A(w21) | A ( w 2 5 ) A(w_2^5) A(w25) | A ( w 2 3 ) A(w_2^3) A(w23) | A ( w 2 7 ) A(w_2^7) A(w27) |
这里的 A 1 ( w 1 0 ) A_1(w_1^0) A1(w10) 就对应了第一个表中的 A ( w 1 0 ) A(w_1^0) A(w10)
且 k = 4 k = 4 k=4 的时候取值为 w 2 0 w_2^0 w20 是因为在 k > n 2 k > \frac{n}{2} k>2n 的时候, x x x 取的是 w n k + n 2 w_n^{k + \frac{n}{2}} wnk+2n,所以 k k k 也要相应的减去 n 2 \frac{n}{2} 2n
第二次合并
k k k | 0 | 2 | 4 | 6 | 1 | 3 | 5 | 7 |
---|---|---|---|---|---|---|---|---|
计算内容 | A ( w 4 0 ) = A 1 ( w 2 0 ) + w 4 0 A 2 ( w 2 4 ) A(w_4^0) = A_1(w_2^0) + w_4^0A_2(w_2^4) A(w40)=A1(w20)+w40A2(w24) | A ( w 4 2 ) = A 1 ( w 2 0 ) − w 4 0 A 2 ( w 2 4 ) A(w_4^2) = A_1(w_2^0) - w_4^0A_2(w_2^4) A(w42)=A1(w20)−w40A2(w24) | A ( w 4 4 ) A(w_4^4) A(w44) | A ( w 4 6 ) A(w_4^6) A(w46) | A ( w 4 1 ) A(w_4^1) A(w41) | A ( w 4 3 ) A(w_4^3) A(w43) | A ( w 4 5 ) A(w_4^5) A(w45) | A ( w 4 7 ) A(w_4^7) A(w47) |
这里的 A 1 ( w 2 0 ) A_1(w_2^0) A1(w20) 就对应了第二个表中的 A ( w 2 0 ) A(w_2^0) A(w20)
第三次合并
k k k | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|---|
计算内容 | A ( w 8 0 ) = A 1 ( w 4 0 ) + w 8 0 A 2 ( w 4 2 ) A(w_8^0) = A_1(w_4^0) + w_8^0A_2(w_4^2) A(w80)=A1(w40)+w80A2(w42) | A ( w 8 1 ) = A 1 ( w 4 0 ) − w 8 0 A 2 ( w 4 2 ) A(w_8^1) = A_1(w_4^0) - w_8^0A_2(w_4^2) A(w81)=A1(w40)−w80A2(w42) | A ( w 8 2 ) A(w_8^2) A(w82) | A ( w 8 3 ) A(w_8^3) A(w83) | A ( w 8 4 ) A(w_8^4) A(w84) | A ( w 8 5 ) A(w_8^5) A(w85) | A ( w 8 6 ) A(w_8^6) A(w86) | A ( w 8 7 ) A(w_8^7) A(w87) |
所以在最后一次合并之后就得到了所有的 A ( x ) A(x) A(x)
成功的从系数表示法转换成点值表示法!
当然我们从系数表示法转换成点值表示法只是为了计算卷积的时候减小时间复杂度,但最后对我们有帮助、便于分析的仍然是系数表示法
所以在对点值表示法的多项式进行卷积之后,仍需要将其再次转换回系数表示法
这种转换方式称为逆快速傅里叶变换
那等于说我们给出了 n n n 个线性方程组,然后需要对其进行求解
a 0 ( w n 0 ) 0 + a 1 ( w n 0 ) 1 + . . . . . . + a n − 1 ( w n 0 ) n − 1 = A ( w n 0 ) a 0 ( w n 1 ) 0 + a 1 ( w n 1 ) 1 + . . . . . . + a n − 1 ( w n 1 ) n − 1 = A ( w n 1 ) . . . . . . a 0 ( w n n − 1 ) 0 + a 1 ( w n n − 1 ) 1 + . . . . . . + a n − 1 ( w n n − 1 ) n − 1 = A ( w n n − 1 ) \begin{aligned} a_0(w_n^0)^0 + a_1(w_n^0)^1 + ...... + a_{n-1}(w_n^0)^{n-1} &= A(w_n^0) \\ a_0(w_n^1)^0 + a_1(w_n^1)^1 + ...... + a_{n-1}(w_n^1)^{n-1} &= A(w_n^1) \\ ......\\ a_0(w_n^{n-1})^0 + a_1(w_n^{n-1})^1 + ...... + a_{n-1}(w_n^{n-1})^{n-1} &= A(w_n^{n-1}) \\ \end{aligned} a0(wn0)0+a1(wn0)1+......+an−1(wn0)n−1a0(wn1)0+a1(wn1)1+......+an−1(wn1)n−1......a0(wnn−1)0+a1(wnn−1)1+......+an−1(wnn−1)n−1=A(wn0)=A(wn1)=A(wnn−1)
将其写成矩阵的形式有
[ ( w n 0 ) 0 ( w n 0 ) 1 . . . ( w n 0 ) n − 1 ( w n 1 ) 0 ( w n 1 ) 1 . . . ( w n 0 ) n − 1 . . . . . . ( w n n − 1 ) 0 ( w n n − 1 ) 1 . . . ( w n n − 1 ) n − 1 ] [ a 0 a 1 . . . a n − 1 ] = [ A ( w n 0 ) A ( w n 1 ) . . . A ( w n n − 1 ) ] \left[ \begin{matrix} (w_n^0)^0 & (w_n^0)^1 & ... & (w_n^0)^{n-1} \\ (w_n^1)^0 & (w_n^1)^1 & ... & (w_n^0)^{n-1} \\ ...... \\ (w_n^{n-1})^0 & (w_n^{n-1})^1 & ... & (w_n^{n-1})^{n-1} \end{matrix} \right] \left[ \begin{matrix} a_0 & \\ a_1 & \\ ...\\ a_{n-1} & \end{matrix} \right] = \left[ \begin{matrix} A(w_n^0) \\ A(w_n^1) \\ ...\\ A(w_n^{n-1}) \end{matrix} \right] ⎣⎢⎢⎡(wn0)0(wn1)0......(wnn−1)0(wn0)1(wn1)1(wnn−1)1.........(wn0)n−1(wn0)n−1(wnn−1)n−1⎦⎥⎥⎤⎣⎢⎢⎡a0a1...an−1⎦⎥⎥⎤=⎣⎢⎢⎡A(wn0)A(wn1)...A(wnn−1)⎦⎥⎥⎤
定义第一个矩阵为D、第二个矩阵为V、第三个矩阵为E
按照矩阵乘法,有
e i j = Σ k = 0 n − 1 d i k v k j = Σ k = 0 n − 1 w n − i k w n k j = Σ k = 0 n − 1 w n k ( j − i ) \begin{aligned} e_{ij} & = \Sigma_{k=0}^{n-1}d_{ik}v_{kj} \\ &= \Sigma_{k=0}^{n-1}w_n^{-ik}w_n^{kj} \\ &=\Sigma_{k=0}^{n-1}w_n^{k(j-i)} \end{aligned} eij=Σk=0n−1dikvkj=Σk=0n−1wn−ikwnkj=Σk=0n−1wnk(j−i)
所以有
e i j = { n i = j 0 i ≠ j e_{ij} = \begin{cases} & n & & i = j \\ & 0 & & i ≠ j \\ \end{cases} eij={n0i=ji̸=j
i ≠ j i≠j i̸=j 的时候可以根据等比序列求和公式得到和为0
由此可知, I n = 1 n E I_n = \frac{1}{n}E In=n1E, I n I_n In是一个 n×n 的单位矩阵
所以有 1 n D = V − 1 \frac{1}{n}D = V^{-1} n1D=V−1,∵ E E E 和单位矩阵扯上联系了嘛
那么其实IFFT就是一个变换了一点点的FFT
如果说FFT用公式来表示是
X ( k ) = Σ n = 0 N − 1 x ( n ) w N k n X(k) = \Sigma_{n=0}^{N-1}x(n)w_N^{kn} X(k)=Σn=0N−1x(n)wNkn则IFFT用公式来表示就是
x ( n ) = 1 N Σ n = 0 N − 1 X ( k ) w n − k n x(n) = \frac{1}{N}\Sigma_{n=0}^{N-1}X(k)w_n^{-kn} x(n)=N1Σn=0N−1X(k)wn−kn
单位根取个负然后乘个 1 N \frac{1}{N} N1
那总结一下FFT和IFFT的作用就是减少卷积运算的时间复杂度www