[BJ United Round #3] 押韵
先%%%%%%%%%%%%%%%%% EI
下文默认模数为(P)
简要题意:求:用(k)种元素,每种元素使用(d)的倍数次,排成一个长度为(nd)的序列 的方案数
这个题目的设定就让人想到两个离不开的元素 : (模数暗示了?)
指数型生成函数 + 单位根反演
显然可以得到每一种元素的指数型生成函数为
(egin{aligned} ext{EGF(Element)}=F(x)=sum_{d|i} frac{x^i}{i!}end{aligned})
带入单位根反演(egin{aligned} [d|n]=frac{sum_0^{d-1} omega_d^{in}}{d}end{aligned})
即(F(x)=egin{aligned}frac{1}{d}cdot sum_{i=0}^{d-1}e^{omega_d^ix}end{aligned})
而总的生成函数就是 (G(x)=F^k(x))
即(egin{aligned} G(x)=frac{1}{d^k}cdot (sum_{i=0}^{d-1}e^{omega_d^ix})^kend{aligned})
其中的和式幂次展开会得到一个(k^d)项的多项式,我们要求([x^n]G(x)),就需要展开得到每一项的幂系数
所以显然我们需要先合并同类项一下。。。
而幂系数是一个单位根之和的形式,这就需要我们寻找单位根之间的关系
这里得到一个思路:用(d)次单位根中的(varphi(d))个作为基底,以简单的 有理数/整系数 表示出所有的(omega_d^i)
对于(d=4)的情况比较简单,(varphi(d)=2),可以得到四个单位根分别为(1,omega,-1,-omega)
可以枚举得到的和为(x+yomega),然后求系数
优先考虑组合意义,可以发现就是在平面上每次可以走四个方向,(k)步之后最终到达((x,y))的方案数
两个维度分立的情况,还需要枚举每个维度走了几步,所以用一种巧妙的转化两个维度联系在一起
将平面旋转(frac{pi}{8}),并且扩大(sqrt 2)倍,得到新的坐标为((x-y,x+y)),新的行走方向是((+1,+1),(-1,-1),(-1,+1),(+1,-1))
这样以来,每次每个维度都有行走,可以确定每个维度(+1)和(-1)的次数,直接组合数排列即可得到答案
对于(d=6),甚至是更一般的情况的情况
只在代数层面来看单位根似乎十分抽象,不如从复平面单位根上找一找灵感
下面是(d=6)的情形
(varphi(6)=2),假设以(overrightarrow{OA},overrightarrow{OB})作为基底,可以直观地得到基底表达
(overrightarrow{OA}=1) | (overrightarrow{OB}=omega) | |
---|---|---|
(overrightarrow{OA}=omega_6^0) | 1 | 0 |
(overrightarrow{OB}=omega_6^1) | 0 | 1 |
(overrightarrow{OC}=omega_6^2) | -1 | 1 |
(overrightarrow{OD}=omega_6^3) | -1 | 0 |
(overrightarrow{OE}=omega_6^4) | 0 | -1 |
(overrightarrow{OF}=omega_6^5) | 1 | -1 |
由此我们得到了一个(varphi(d))维数的表达方法
把每一维看做不同元,也就是说,得到了一个(varphi(d))维,(O(1))次的多项式,需要我们求高维多项式幂次
令(N=k^{varphi(d)})
直接压位暴力多项式复杂度为(O(Nlog N-Nlog^2N)),而且面临着模数难以处理,常数大的问题
所以( ext{EI})又用出了一个巧妙的暴力方法解决这个问题,以(d=6)为例,先做一下处理,得到要求的多项式
似乎每次(k)次幂总是求导+递推?
(f(x,y)=x^2y+xy^2+y^2+y+x+x^2,g(x,y)=f^k(x,y))
(g(x,y))对于(x)求偏导,得到(g'(x,y)=kf^{k-1}(x,y)f'(x,y))
即(g'(x,y)f(x,y)=kg(x,y)f'(x,y))
(f'(x,y)=2xy+2x+y^2+1)
然后我们要解这个方程,考虑乘积为([x^ny^m])一项两边的系数
左边(=[x^{n-2}y^{m-1}]+[x^{n-1}y^{m-2}]+[x^{n}y^{m-2}]+[x^{n}y^{m-1}]+[x^{n-1}y^{m}]+[x^{n-2}y^{m}])
换成(g(x,y))的系数应该是
左边(=(n-1)[x^{n-1}y^{m-1}]+n[x^{n}y^{m-2}]+(n+1)[x^{n+1}y^{m-2}]+(n+1)[x^{n+1}y^{m-1}]+n[x^{n}y^{m}]+(n-1)[x^{n-1}y^{m}])
右边(=2k[x^{n-1}y^{m-1}]+2k[x^{n-1}y^m]+k[x^ny^{m-2}]+k[x^ny^m])
其中([x^{n+1}y^{m-1}])只出现了一次,按照先(n)递增再(m)递增的顺序进行递推,即
(egin{aligned} [x^ny^m]=frac{2k[x^{n-2}y^{m}]+2k[x^{n-2}y^{m+1}]+k[x^{n-1}y^{m-1}]+k[x^{n-1}y^{m+1}]}{n}end{aligned})
(egin{aligned}-frac{(n-2)[x^{n-2}y^{m}]+(n-1)[x^{n-1}y^{m-1}]+n[x^{n}y^{m-1}]+(n-1)[x^{n-1}y^{m+1}]+(n-2)[x^{n-2}y^{m+1}]}{n}end{aligned})
边界条件是 (egin{aligned} [x^i]=[y^i](ige k)=inom{k}{i-k}end{aligned}) (由系数(x,x^2)或(y,y^2)得到)
由此带入递推即可
综上,得到的每项的系数的复杂度为(O(dcdot k^{varphi(d)})) ,其中(d)为递推每项需要的时间
由系数得到答案仍然需要一次快速幂,因此依然带一个(log P)
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
typedef double db;
typedef pair <int,int> Pii;
#define reg register
#define pb push_back
#define mp make_pair
#define Mod1(x) ((x>=P)&&(x-=P))
#define Mod2(x) ((x<0)&&(x+=P))
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)
template <class T> inline void cmin(T &a,T b){ a=min(a,b); }
template <class T> inline void cmax(T &a,T b){ a=max(a,b); }
char IO;
int rd(){
int s=0,f=0;
while(!isdigit(IO=getchar())) if(IO=='-') f=1;
do s=(s<<1)+(s<<3)+(IO^'0');
while(isdigit(IO=getchar()));
return f?-s:s;
}
const int N=2e3+10,P=1049874433,G=7;
int n,k,d;
ll qpow(ll x,ll k=P-2) {
k%=P-1;
ll res=1;
for(;k;k>>=1,x=x*x%P) if(k&1) res=res*x%P;
return res;
}
int w[100],C[N][N],I[N*2];
int main() {
n=rd(),k=rd(),d=rd();
w[0]=1,w[1]=qpow(G,(P-1)/d);
rep(i,2,90) w[i]=1ll*w[i-1]*w[1]%P;
rep(i,0,k) rep(j,C[i][0]=1,i) C[i][j]=C[i-1][j]+C[i-1][j-1],Mod1(C[i][j]);
I[0]=I[1]=1;
rep(i,2,k*2) I[i]=1ll*(P-P/i)*I[P%i]%P;
if(d==1){
int ans=qpow(k,1ll*d*n);
printf("%d
",ans);
} else if(d==2) {
int ans=0;
rep(i,0,k) ans=(ans+qpow((1ll*w[0]*i+1ll*w[1]*(k-i))%P,1ll*d*n)*C[k][i])%P;
ans=ans*qpow(qpow(d,k))%P;
printf("%d
",ans);
} else if(d==3) {
int ans=0;
rep(i,0,k) rep(j,0,k-i)
ans=(ans+qpow((1ll*w[0]*i+1ll*w[1]*j+1ll*w[2]*(k-i-j))%P,1ll*d*n)*C[i+j][i]%P*C[k][i+j])%P;
ans=ans*qpow(qpow(d,k))%P;
printf("%d
",ans);
} else if(d==4) {
int ans=0;
rep(i,-k,k) rep(j,-k,k) if(abs(i)+abs(j)<=k && (k-i-j)%2==0) {
ll x=qpow((1ll*w[0]*i+1ll*w[1]*j)%P,1ll*d*n);
ll y=1ll*C[k][(abs(i-j)+k)/2]*C[k][(k+abs(i+j))/2]%P;
ans=(ans+x*y)%P;
}
ans=(ans+P)*qpow(qpow(d,k))%P;
printf("%d
",ans);
} else {
static int F[N*2][N*2];
int ans=0;
rep(i,0,k*2) rep(j,max(k-i,0),min(2*k,3*k-i)) {
if(i==0) F[i][j]=C[k][j-k];
else if(j==0) F[i][j]=C[k][i-k];
else {
int s=(2ll*k*(i>1?F[i-2][j]+F[i-2][j+1]:0)+1ll*k*(F[i-1][j-1]+F[i-1][j+1]))%P;
int t=((i>1?1ll*(i-2)*(F[i-2][j]+F[i-2][j+1]):0)+
1ll*(i-1)*F[i-1][j-1]+1ll*i*F[i][j-1]+1ll*(i-1)*F[i-1][j+1])%P;
F[i][j]=1ll*(s-t+P)*I[i]%P;
}
ans=(ans+qpow((1ll*w[0]*(i-k)+1ll*w[1]*(j-k))%P,1ll*d*n)*F[i][j])%P;
}
ans=(ans+P)*qpow(qpow(d,k))%P;
printf("%d
",ans);
}
}