参考:FWT快速沃尔什变换学习笔记(证明等都非常详细,虽然我没看证明 )
FFT 、NTT:计算多项式卷积
C k = ∑ i + j = k A i ∗ B j C_k=\sum_{i+j=k}A_i*B_j Ck=i+j=k∑Ai∗Bj
FWT :计算多项式的位运算卷积
int x = a[i + j], y = a[i + j + d];
FWT
//xor:a[i+j]=x+y,a[i+j+d]=(x-y+mod)%mod;
//and:a[i+j]=x+y;
//or: a[i+j+d]=x+y;
IFWT
//inv2表示2在模mod下的逆元,如果带模,则除以2变成乘以inv2
//xor:a[i+j]=(x+y)/2,a[i+j+d]=(x-y)/2;
//and:a[i+j]=x-y;
//or:a[i+j+d]=y-x;
//分治等思路几乎与FFT一致,只是迭代的公式不一样
void FWT_or(int *a, int opt)
{
for(int i = 1; i < N; i <<= 1)//i准备合并序列的长度的二分之一
for(int j = 0, p = i << 1; j < N; j += p)////p=i*2是准备合并序列的长度,j是合并到了哪一位(第某段的开头的坐标)
for(int k = 0; k < i; ++k)//k是第某段内的第某位(只扫描前一半,后面一半可以同时求)
{
int x = a[j + k], y = a[i + j + k];
if(opt == 0)
a[i + j + k] = (x + y) % MOD;
else
a[i + j + k] = (y - x + MOD) % MOD;
}
}
void FWT_and(int *a, int opt)
{
for(int i = 1; i < N; i <<= 1)
for(int p = i << 1, j = 0; j < N; j += p)
for(int k = 0; k < i; ++k)
{
int x = a[j + k], y = a[i + j + k];
if(opt == 0)
a[i + j + k] = (x + y) % MOD;
else
a[i + j + k] = (x - y + MOD) % MOD;
}
}
void FWT_xor(int *a, int opt)
{
for(int i = 1; i < N; i <<= 1)
for(int p = i << 1, j = 0; j < N; j += p)
for(int k = 0; k < i; ++k)
{
int x = a[j + k], y = a[i + j + k];
a[j + k] = (x + y) % MOD;
a[i + j + k] = (x - y + MOD) % MOD;
if(opt)//inv2表示2在模mod下的逆元,如果不是在模意义下的话,开一个long long,然后把乘逆元变成直接除二即可。
a[j + k] = 1LL * a[j + k] * inv2 % MOD, a[i + j + k] = 1LL * a[i + j + k] * inv2 % MOD;
}
}
Description
Claris和NanoApe在玩石子游戏,他们有n堆石子,规则如下:
不同的初始局面,决定了最终的获胜者,有些局面下先拿的Claris会赢,其余的局面Claris会负。
Claris很好奇,如果这n堆石子满足每堆石子的初始数量是不超过m的质数,而且他们都会按照最优策略玩游戏,那么NanoApe能获胜的局面有多少种。
由于答案可能很大,你只需要给出答案对10^9+7取模的值。
Input
输入文件包含多组数据,以EOF为结尾。
对于每组数据:
共一行两个正整数n和m。
每组数据有1<=n<=10^9, 2<=m<=50000。
不超过80组数据。
Sample Input
3 7
4 13
Sample Output
6
120
思路:
AC代码
#include
#include
#include
#include
#include
#include
#include
#define mod 1000000007
using namespace std;
typedef long long LL;
const int maxn = 50005;
const int sz = 17;
int a[1 << sz], b[1 << sz], nop[maxn];
int N, inv2;
LL inv(LL i)//求逆元
{
if(i == 1)
return 1;
return (mod - mod / i) * inv(mod % i) % mod;
}
void is_p()
{
nop[1] = 1;//nop=1表示不是质数
for(int i = 2; i < maxn; i++)
{
if(!nop[i])
{
for(int j = 2 * i; j < maxn; j += i)
nop[j] = 1;
}
}
inv2 = inv(2);
}
void FWT(int * a, int opt)
{
for(int i = 1; i < N; i <<= 1)
for(int j = 0, p = i << 1; j < N; j += p)
for(int k = 0; k < i; k++)
{
int x = a[j + k], y = a[i + j + k];
a[j + k] = (x + y) % mod;
a[i + j + k] = (x - y + mod) % mod;
if(opt)
a[j + k] = 1LL * a[j + k] * inv2 % mod, a[i + j + k] = 1LL * a[i + j + k] * inv2 % mod;
}
}
void qpow(int * ans, int * a, int p)//快速幂
{
FWT(ans, 0), FWT(a, 0);
while(p)
{
if(p & 1)
{
for(int i = 0; i < N; i++)
ans[i] = 1LL * ans[i] * a[i] % mod;
}
for(int i = 0; i < N; i++)
a[i] = 1LL * a[i] * a[i] % mod;
p >>= 1;
}
FWT(ans, 1);
}
int main()
{
is_p();
int n, m;
while(~scanf("%d%d", &n, &m))
{
for(N = 1; N < m; N <<= 1);
N <<= 1;
memset(a, 0, sizeof(a));
memset(b, 0, sizeof(b));
for(int i = 1; i <= m; i++)
if(!nop[i])
a[i] = b[i] = 1;
qpow(a, b, n - 1);
printf("%d\n", a[0]);
}
return 0;
}