• 【BZOJ3992】序列统计(SDOI2015)-NTT+循环卷积+快速幂


    测试地址:序列统计
    做法:本题需要用到NTT+循环卷积+快速幂。
    这个题我们很快就想出状态转移:令f(i,j)为前i个数的乘积模m的结果为j的数列方案数,那么有:
    f(i,j)=0k<mlS[(k×l)%m=j]f(i1,k)
    其中[U]表示表达式U成立时值为1,否则值为0
    但是这个式子是O(nm2)的,无法承受。
    由于运算是乘法,所以没办法使用NTT求卷积,那有没有什么办法把乘法变成加法呢?
    我们在高中学过对数,对数满足loga(xy)=logax+logay,这就把乘法变成了加法,但是这是在实数域中,在模意义域中有没有类似的东西呢?
    因为m是质数,所以一定存在一个原根g,根据原根的性质,g0,g1,...,gm2在模m意义下各不相同,因此我们类似的定义离散对数I(y)为使得gx%m=yx,于是我们有:
    i=1nxig[i=1nI(xi)]%(m1)(modm)
    于是我们用I(j)替代f(i,j)中的第二维下标j,并用I(l)替换l成为S中的元素,称为S0,于是式子变为:
    f(i,j)=0k<m1lS0[(k+l)%(m1)=j]f(i1,k)
    这样就把原来转移时候的模意义下的乘法变成了模意义下的加法。接下来我们定义向量F(i)f(i,0),...,f(i,m2)这一些数,我们发现F(i)就是F(i1)和另一个向量A的一个循环卷积,其中Ai=[iS0],只用将卷积后下标i大于m2的值都累加在下标为i%(m2)的位置上即可。用NTT优化求循环卷积的过程,时间复杂度降为O(nmlogm)
    然而还是不够,n达到了109,意识到循环卷积运算满足交换律和结合律,用快速幂即可加速到O(mlognlogm),至于原根可以直接O(m2)暴力求(实际上常数小的多),这样就解决了这道题。
    有的同学可能注意到,上述方法不能处理x=0的情况,BZOJ上的题面说是有x=0,但洛谷上没有x=0,并且这份代码在两边都过了,所以推断数据应该不存在这种情况,所以无需特判。
    以下是本人代码:

    #include <bits/stdc++.h>
    #define ll long long
    #define mod 1004535809
    #define g 3
    using namespace std;
    int n,m,x,s,p[8010],save,r[30010];
    ll M[30010]={0},S[30010]={0};
    bool vis[8010];
    
    ll power(ll a,ll b)
    {
        ll s=1,ss=a;
        while(b)
        {
            if (b&1) s=(s*ss)%mod;
            ss=(ss*ss)%mod,b>>=1;
        }
        return s;
    }
    
    void NTT(ll *a,int n,int type)
    {
        for(int i=0;i<n;i++)
            if (i<r[i]) swap(a[i],a[r[i]]);
        for(int mid=1;mid<n;mid<<=1)
        {
            ll W=power(g,(mod-1)/(mid<<1));
            if (type==-1) W=power(W,mod-2);
            for(int l=0,r=mid<<1;l<n;l+=r)
            {
                ll w=1;
                for(int k=0;k<mid;k++,w=(w*W)%mod)
                {
                    ll x=a[l+k],y=(w*a[l+mid+k])%mod;
                    a[l+k]=(x+y)%mod;
                    a[l+mid+k]=((x-y)%mod+mod)%mod;
                }
            }
        }
        if (type==-1)
        {
            int inv=power(n,mod-2);
            for(int i=0;i<n;i++)
                a[i]=(a[i]*inv)%mod;
        }
    }
    
    void power_conv(ll *a,int b,int n,ll *ans)
    {
        while(b)
        {
            NTT(a,n,1);
            if (b&1)
            {
                NTT(ans,n,1);
                for(int i=0;i<n;i++)
                    ans[i]=(ans[i]*a[i])%mod;
                NTT(ans,n,-1);
                for(int i=0;i<n;i++)
                    if (i>=save) ans[i%save]=(ans[i%save]+ans[i])%mod,ans[i]=0;
            }
            for(int i=0;i<n;i++)
                a[i]=(a[i]*a[i])%mod;
            NTT(a,n,-1);
            for(int i=0;i<n;i++)
                if (i>=save) a[i%save]=(a[i%save]+a[i])%mod,a[i]=0;
            b>>=1;
        }
    }
    
    int main()
    {
        scanf("%d%d%d%d",&n,&m,&x,&s);
    
        for(int i=2;i<=m;i++)
        {
            memset(vis,0,sizeof(vis));
            bool flag=1;
            for(int j=0,w=1;j<m-1;j++,w=(w*i)%m)
            {
                if (vis[w]) {flag=0;break;}
                else p[w]=j,vis[w]=1;
            }
            if (flag) break;
        }
    
        for(int i=1;i<=s;i++)
        {
            int v;
            scanf("%d",&v);
            v%=m;
            if (v) M[p[v]]++;
        }
    
        int bit=0,t=1;
        while(t<(m<<1)) bit++,t<<=1;
        r[0]=0;
        for(int i=1;i<t;i++)
            r[i]=(r[i>>1]>>1)|((i&1)<<(bit-1));
        save=m-1,m=t;
    
        S[0]=1;
        power_conv(M,n,m,S);
    
        printf("%lld",S[p[x]]);
    
        return 0;
    }
  • 相关阅读:
    pycharm快捷键
    Docker
    Go语言与Elasticsearch
    Celery与APScheduler
    爬虫入门到入狱
    数据分析
    后台管理
    Linux基础与自动化运维
    微信小程序
    Git
  • 原文地址:https://www.cnblogs.com/Maxwei-wzj/p/9793535.html
Copyright © 2020-2023  润新知