BZOJ 3992 SDOI2015 序列统计

此文章写给没有学过FFT, FNT的小伙伴看 , 神犇绕行QAQ

博主在没有善良学长的情况下 , 花了一天学习了快速傅立叶变换(FFT)和快速数论变换(FNT)(其实差不多啦…… )分享一下学习过程 , 如果哪位小伙伴也没有学长帮助 , 可以借鉴啦……

你需要把我的文字部分简略看一遍 , 再来看各个博客 , 这样会更有方向性。
分享一个博客Miskcoo’s这个小伙伴的前提知识写的很清楚 , 当你读到IDFT的时候可能有疑惑 , 此时你只需要暂时记住(等会来填坑) , IDFT和DFT的过程是相似的其它先不管 , 然后继续看迭代版本的DFT过程。 此时 , 你可以对着Rujia的代码看看 , 如下:

// Cooley-Tukey的FFT算法,迭代实现。inverse = false时计算逆FFT
inline void FFT(vector &a, bool inverse) {
  int n = a.size();
  // 原地快速bit reversal
  for(int i = 0, j = 0; i < n; i++) {
    if(j > i) swap(a[i], a[j]);
    int k = n;
    while(j & (k >>= 1)) j &= ~k;
    j |= k;
  }

  double pi = inverse ? -PI : PI;
  for(int step = 1; step < n; step <<= 1) {
    // 把每相邻两个“step点DFT”通过一系列蝴蝶操作合并为一个“2*step点DFT”
    double alpha = pi / step;
    // 为求高效,我们并不是依次执行各个完整的DFT合并,而是枚举下标k
    // 对于一个下标k,执行所有DFT合并中该下标对应的蝴蝶操作,即通过E[k]和O[k]计算X[k]
    // 蝴蝶操作参考:http://en.wikipedia.org/wiki/Butterfly_diagram
    for(int k = 0; k < step; k++) {
      // 计算omega^k. 这个方法效率低,但如果用每次乘omega的方法递推会有精度问题。
      // 有更快更精确的递推方法,为了清晰起见这里略去
      CD omegak = exp(CD(0, alpha*k)); 
      for(int Ek = k; Ek < n; Ek += step << 1) { // Ek是某次DFT合并中E[k]在原始序列中的下标
        int Ok = Ek + step; // Ok是该DFT合并中O[k]在原始序列中的下标
        CD t = omegak * a[Ok]; // 蝴蝶操作:x1 * omega^k
        a[Ok] = a[Ek] - t;  // 蝴蝶操作:y1 = x0 - t
        a[Ek] += t;         // 蝴蝶操作:y0 = x0 + t
      }
    }
  }

  if(inverse)
    for(int i = 0; i < n; i++) a[i] /= n;
}

// 用FFT实现的快速多项式乘法
inline vector<double> operator * (const vector<double>& v1, const vector<double>& v2) {
  int s1 = v1.size(), s2 = v2.size(), S = 2;
  while(S < s1 + s2) S <<= 1;
  vector a(S,0), b(S,0); // 把FFT的输入长度补成2的幂,不小于v1和v2的长度之和
  for(int i = 0; i < s1; i++) a[i] = v1[i];
  FFT(a, false);
  for(int i = 0; i < s2; i++) b[i] = v2[i];
  FFT(b, false);
  for(int i = 0; i < S; i++) a[i] *= b[i];
  FFT(a, true);
  vector<double> res(s1 + s2 - 1);
  for(int i = 0; i < s1 + s2 - 1; i++) res[i] = a[i].real(); // 虚部均为0
  return res;
}

你可能觉得分治有点不好理解 , 其实分治的对象就是 ωkn 的函数值 ,k[0,n) , 总体来说就是我们一步步把这玩意二分成若干小块 , 每一块相同位置的 ω 的下标在那一层分治中都是相同的(但是此时系数并不相同) , 分治后的每一次更新就是把相邻两块同一位置的 k n2+k 拿出来 , 交替更新(就是蝴蝶神马的)。

分治的前提是每次分裂后的那些奇偶系数都在一块 , 所以我们需要对这个序列进行重排(就是把二进制位倒过来 , 10110 变成 01101 )至于每个数怎么算它倒过来在哪里 , 这个问题Rujia代码是比较优秀的 , 其实就是记录上一个数倒过来的数是神马 , 然后在首位加一个 1 然后类似于进位一样的推到后面来。 诶 , 你可能觉得这玩意怎么分治到最后没有边界啊 , 其实边界就是数组本身 , 因为 ω01==1 , 所以 ω01×a[i]==a[i]

好 , 再来填坑 , 看刚刚那个博客 , 你会发现从矩阵的角度上来看 , IDFT和DFT长得差不多 , 其实就是把所有的正负号取反就可以得到一个这玩意的逆矩阵的 n 倍(千万不要以为是把矩阵元素值取反 , 实际上这个过程更像是除法)。 然而IDFT其实只用在FFT函数中上加一个标记就行啦。

再来两篇博客 , 这里面有模版题 , ACdreamer’s1 , ACdreamer’s2

最后想说FFT的想法真的很奇妙 , 虽然本人并没有实质上的优化算法 , 但这个想法打开了一扇门:-)

再说说本题:
首先 , 此题是一个DP题 , Vincent’s里说的很详细。不得不说这个小伙伴的代码常数巨大……

补充几点:
如果你只想拿60个点 , 那么你不需要学FNT , 直接把 n 快速幂算就可以啦。 FNT其实就是加速 m2 这个过程 , 为了能够FNT , 我们需要求此 m 的原根 , 注意区分两个原根。 这样整个表达式长的就像卷积形式啦……然后就可以AC了

#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 

using namespace std;
typedef long long ll;
typedef vector vl;
const int maxm = 8100;
const int modu = 1004535809;

int n , m , x , s;
int a[maxm] , b[maxm];

ll powerMod(ll a , ll n , ll p)
{
    if(!n) return 1;
    ll res = powerMod(a, n/2, p);
    res = (res * res)%p;
    if(n&1) res = (res * a)%p;
    return (res+p)%p;
}

bool judge(int p , int a)
{
    int pp = p;
    for(int i=2;i*i<=p;i++) if(pp%i==0)
    {
        if(powerMod(a, p/i, p+1)==1) return false;
        while(pp%i==0) pp/=i; 
    }
    if(pp!=1 && powerMod(a, p/pp, p+1)==1) return false;
    return true;
}

int findRoot(int p)
{
    for(int i=2;;i++) if(judge(p-1, i)) return i;
}

void exGcd(ll a , ll b , ll& d , ll& x , ll& y)
{
    if(!b) x = 1 , y = 0 , d = a;
    else 
    {
        exGcd(b, a%b, d, y, x);
        y -= a/b*x;
    }
}

ll rev(ll a , ll p)
{
    ll x , y , d;
    exGcd(a, p, d, x, y);
    return x;
}

namespace FNT
{
    void FNTprocess(vl& a , bool rever = false)
    {
        int n = a.size();
        for(int i=0,j=0;iif(j > i) swap(a[i], a[j]);
            int k = n;
            while(j & (k >>= 1)) j &= ~k;
            j |= k;
        }

        for(int step=1;step1)
        {
            ll wn = powerMod(3, (modu-1)/step/2, modu) , w = 1;
            if(rever) wn = rev(wn, modu);
            for(int k=0;kfor(int i=k,j;i1)
                {
                    j = i+step;
                    ll now = (w*a[j])%modu;
                    a[j] = (a[i] - now)%modu;
                    a[i] = (a[i] + now)%modu;
                }
                w = (w*wn)%modu;
            }
        }
        int r = rev(n, modu);
        if(rever) for(int i=0;ioperator *(vl x , vl y)
    {
        int s1 = x.size() , s2 = y.size() , s = 2;
        while(s < s1 + s2) s <<= 1;

        vl a(s) , b(s);
        for(int i=0;ifor(int i=0;ifor(int i=0;itrue);

        vl c(s1 , 0);
        for(int i=0;ireturn c;
    }
}

using namespace FNT;

vl powerV(vl a , int n)
{
    if(n==1) return a;
    vl res = powerV(a, n/2);
    res = res*res;
    if(n&1) res = (res * a);
    return res;
}


int main(int argc, char *argv[]) {

    cin>>n>>m>>x>>s;

    int r = findRoot(m) , now = 1;

    for(int i=0;i1;i++)
    {
        b[now] = i;
        now = (now * r)%m;
    }

    for(int i=0;iint v;
        scanf("%d" , &v);
        if(!v) continue;
        a[b[v%m]]++;
    }

    vl res , hi;
    for(int i=0;i1;i++) res.push_back(a[i]);
    res = powerV(res, n);

    printf("%lld\n" , (res[b[x]]+modu)%modu);

    return 0;
}

最后附上TestData7:

Inputs:

152638504 5981 5475 3035


Outputs:

808995810

你可能感兴趣的:(dp,FFT)