神仙题。
首先考虑一个点的深度是什么,注意到对于笛卡尔树而言直接从序列的角度计算一个点的深度是不容易的,因为这样会牵扯到序列中多个元素,需要 fixed 的东西太多,计算起来太复杂了。因此考虑从树本身的角度计算一个点的深度。注意到对于一棵树上所有点 (u) 而言都有 (dep_u=sumlimits_{v}[ ext{LCA}(u,v)=v]),因此我们求解一个点 (x) 的答案时,可以枚举所有 (u,v) 并计算 (v) 对 (u) 的贡献,即,有多少个排列满足逆序对个数为 (k),且笛卡尔树上 (v) 为 (u) 的祖先。并且我们还可以注意到,对于一个序列而言,其笛卡尔树上某两点存在祖先关系是存在充要条件转化的,具体来说,( ext{LCA}(u,v)=v) 当且仅当 (a_v) 为 (a[min(u,v)…max(u,v)]) 的最小值,因此我们只需求解以下问题:
有多少个排列 (p),满足其逆序对个数为 (k),且 (a_v=minlimits_{i=min(u,v)}^{max(u,v)}a_i)
这个问题看似难以下手,因为外面就已经枚举了两维 (u,v) 了,里面这东西也无法直接组合数求解,需要用 DP 之类的东西,一弄最低就是 (n^3),直接爆炸,不过细想其实不用复杂度那么高。我们首先考虑如果没有第二个条件怎么求,我们设 (dp_{i,j}) 表示有多少个长度为 (i) 的排列有 (j) 个逆序对,考虑怎么转移,不难发现,对于长度为 (i+1) 的排列,我们总能找到唯一的 (a_{i+1}),满足 (a_{i+1}) 与前面 (i) 个数产生的逆序对数为 (x(xin[0,i])),也就是说 (dp_{i+1,j}=sumlimits_{x=0}^idp_{i,j-x}),前缀和优化一下即可,这个在 CF1542E2 Abnormal Permutation Pairs (hard version) 中就已经见过了。对于此题亦是如此,与经典问题不同的一点是,直接按照 (1,2,3,cdots,n) 的位置填数会爆炸,因此考虑换个顺序,如果 (u<v) 那么我们就按照 (u,u+1,u+2,cdots,v,u-1,u-2,cdots,1,v+1,v+2,cdots,n) 的顺序填数,否则我们按照 (u,u-1,u-2,cdots,v,u+1,u+2,cdots,n,v-1,v-2,cdots,1) 的顺序填。不难发现按照这样的顺序填数之后,其他位置上的填法都和前面一样,即第 (i) 个填的数可以为排列逆序对数产生 ([0,i-1]) 中任意一个数的贡献,唯独 (v) 只有一种填法。而两种情况的差别的,前一种情况 (v) 会对排列逆序对数产生 (|u-v|) 的贡献,而后一种不会,因此如果写成生成函数的形式,就是前一种情况的方案数为 ([x^k]·x^{|u-v|}prodlimits_{i=0}^{|u-v|-1}(sumlimits_{j=0}^ix^j)·prodlimits_{i=|u-v|+1}^{n-1}(sumlimits_{j=0}^ix^j)),后一种情况的方案数为 (x^{|u-v|}prodlimits_{i=0}^{|u-v|-1}(sumlimits_{j=0}^ix^j)·prodlimits_{i=|u-v|+1}^{n-1}(sumlimits_{j=0}^ix^j)),注意到对于一对 (u,v) 而言,上面两个式子的值只与 (|u-v|) 有关,因此可以对所有 (|u-v|) 预处理一波答案,复杂度 (mathcal O(n^4))。如果你观察能力再强一些,你还能发现这式子可以写成背包的形式,你对前后缀各做一遍背包就可以 (n^3) 求解了。
const int MAXN=300;
const int MAXK=44850;
int n,k,mod;
int pre[MAXN+5][MAXK+5],suf[MAXN+5][MAXK+5];
int sum[MAXK+5],c1[MAXN+5],c2[MAXN+5];
int getsum(int l,int r){return (sum[r]-((!l)?0:sum[l-1])+mod)%mod;}
int main(){
scanf("%d%d%d",&n,&k,&mod);pre[0][0]=1;
for(int i=0;i<=k;i++) sum[i]=1;
for(int i=1;i<n;i++){
for(int j=0;j<=k;j++) pre[i][j]=getsum(j-i,j);
memset(sum,0,sizeof(sum));sum[0]=pre[i][0];
for(int j=1;j<=k;j++) sum[j]=(sum[j-1]+pre[i][j])%mod;
} suf[n][0]=1;
for(int i=0;i<=k;i++) sum[i]=1;
for(int i=n-1;~i;i--){
for(int j=0;j<=k;j++) suf[i][j]=getsum(j-i,j);
memset(sum,0,sizeof(sum));sum[0]=suf[i][0];
for(int j=1;j<=k;j++) sum[j]=(sum[j-1]+suf[i][j])%mod;
} c1[0]=c2[0]=pre[n-1][k];
for(int i=1;i<n;i++){
for(int j=0;j<=k;j++) c1[i]=(c1[i]+1ll*pre[i-1][j]*suf[i+1][k-j])%mod;
for(int j=0;j<=k-i;j++) c2[i]=(c2[i]+1ll*pre[i-1][j]*suf[i+1][k-i-j])%mod;
} for(int i=1;i<=n;i++){
int res=0;
for(int j=1;j<=n;j++){
if(j<=i) res=(res+c1[i-j])%mod;
else res=(res+c2[j-i])%mod;
} printf("%d%c",res,"
"[i==n]);
}
return 0;
}