• BZOJ3473: 字符串


    3473: 字符串

    Time Limit: 20 Sec  Memory Limit: 256 MB
    Submit: 109  Solved: 47
    [Submit][Status]

    Description

    给定n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串?

    Input

    第一行两个整数nk
    接下来n行每行一个字符串。

    Output

    一行n个整数,第i个整数表示第i个字符串的答案。

    Sample Input

    3 1
    abc
    a
    ab

    Sample Output

    6 1 3

    HINT



    对于 100% 的数据,1<=n,k<=10^5,所有字符串总长不超过10^5,字符串只包含小写字母。

    Source

    Adera 1 杯冬令营模拟赛

    题解:

    神题一道。。。

    继续搬运题解:by云神

    首先将所有字符串串在一次做SA,然后我们对于sa上,枚举每个串的每个后缀,求出有几个该后缀的前缀符合条件,那么就要判定区间里面有多少个不同的数,所幸的是这里只需要求是否该数目>=k,所以对于每个位置记录个L(x),表示[L(x),x]中刚好有k个不同的数,且L(x)最大(参考了CF官方题解),然后CF上的题解是对于每个后缀二分出长度,然后是O(n log^2 n的算法),但是O(n log^2 n)在本题仍然会TLE,那么我们发现枚举后缀的时候,如果后缀c+S有n个前缀合法(c表示一个字符,s表示一个串),那么对于后缀S,至少有n-1个前缀合法(如果c+S有n个前缀出现不小于k次,那么其子串也是),那么我们就用类似求SA里的height一样的方法,记录一下前面的后缀的合法前缀数,然后这样的总复杂度就成了均摊O(n log n),可以AC。

    一些注释写在代码里

    代码:

      1 #include<cstdio>
      2 #include<cstdlib>
      3 #include<cmath>
      4 #include<cstring>
      5 #include<algorithm>
      6 #include<iostream>
      7 #include<vector>
      8 #include<map>
      9 #include<set>
     10 #include<queue>
     11 #include<string>
     12 #define inf 1000000000
     13 #define maxn 250000+5
     14 #define maxm 500+100
     15 #define eps 1e-10
     16 #define pa pair<int,int>
     17 #define for0(i,n) for(int i=0;i<=(n);i++)
     18 #define for1(i,n) for(int i=1;i<=(n);i++)
     19 #define for2(i,x,y) for(int i=(x);i<=(y);i++)
     20 #define for3(i,x,y) for(int i=(x);i>=(y);i--)
     21 #define mod 1000000007
     22 using namespace std;
     23 inline int read()
     24 {
     25     int x=0,f=1;char ch=getchar();
     26     while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
     27     while(ch>='0'&&ch<='9'){x=10*x+ch-'0';ch=getchar();}
     28     return x*f;
     29 }
     30 int n,m,q,c[maxn],t1[maxn],t2[maxn],sa[maxn],rk[maxn],h[maxn];
     31 int st[maxn][20],rec[maxn],cnt[maxn],num[maxn],beg[maxn],end[maxn];
     32 char s[maxn];
     33 void getsa(int m)
     34 {
     35     int *x=t1,*y=t2;
     36     for0(i,m)c[i]=0;
     37     for0(i,n)c[x[i]=s[i]]++;
     38     for1(i,m)c[i]+=c[i-1];
     39     for3(i,n,0)sa[--c[x[i]]]=i;
     40     for(int k=1;k<=n+1;k<<=1)
     41     {
     42         int p=0;
     43         for2(i,n-k+1,n)y[p++]=i;
     44         for0(i,n)if(sa[i]>=k)y[p++]=sa[i]-k;
     45         for0(i,m)c[i]=0;
     46         for0(i,n)c[x[y[i]]]++;
     47         for1(i,m)c[i]+=c[i-1];
     48         for3(i,n,0)sa[--c[x[y[i]]]]=y[i];
     49         swap(x,y);p=0;x[sa[0]]=0;
     50         for1(i,n)x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p:++p;
     51         if(p>=n)break;
     52         m=p;
     53     }
     54     for1(i,n)rk[sa[i]]=i;
     55     for(int i=0,k=0,j;i<n;h[rk[i++]]=k)
     56      for(k?k--:0,j=sa[rk[i]-1];s[i+k]==s[j+k];k++);
     57 }
     58 void getst()
     59 {
     60     for1(i,n)st[i][0]=h[i];
     61     int k=log2(n);
     62     for1(i,k)for1(j,n-(1<<i)+1)st[j][i]=min(st[j][i-1],st[j+(1<<(i-1))][i-1]);
     63 }
     64 inline int rmq(int x,int y)//求rmq 
     65 {
     66     int k=log2(y-x+1);
     67     return min(st[x][k],st[y-(1<<k)+1][k]);
     68 }
     69 inline bool check(int x,int y)//二分出S[x...x+y-1]在整个串中的左右端点 
     70 {
     71     int l,r,mid,ll,rr;
     72     if(h[x+1]<y)rr=x;
     73     else
     74     {
     75         l=x+1;r=n;
     76         while(l<=r)
     77         {
     78             mid=(l+r)>>1;
     79             if(rmq(x+1,mid)>=y)l=mid+1;else r=mid-1;
     80         }
     81         rr=r;
     82     }
     83     if(h[x]<y)ll=x;
     84     else
     85     {
     86         l=1;r=x-1;
     87         while(l<=r)
     88         {
     89             mid=(l+r)>>1;
     90             //if(x==37)cout<<l<<' '<<mid<<' '<<r<<' '<<rmq(mid+1,x)<<endl;
     91             if(rmq(mid+1,x)>=y)r=mid-1;else l=mid+1;
     92         }
     93         ll=l;
     94     }
     95     //if(x==37)cout<<y<<' '<<ll<<' '<<rr<<' '<<rec[rr]<<' '<<ll<<endl;
     96     return rec[rr]>=ll;//判断这个范围内是否有k个不同的num值,即出现在不同的k个串中 
     97 }
     98 int main()
     99 {
    100     freopen("input.txt","r",stdin);
    101     freopen("output.txt","w",stdout);
    102     m=read();q=read();n=-1;
    103     for1(i,m)
    104     {
    105         n++;beg[i]=n;
    106         scanf("%s",s+n);
    107         n=strlen(s);s[n]=' ';end[i]=n-1;
    108     }
    109     //printf("%s
    ",s);
    110     getsa(128);
    111     getst();
    112     for1(i,m)for2(j,beg[i],end[i])num[j]=i;//标记所属 
    113     int t=1,k=0;
    114     for1(i,n)if(num[sa[i]])//不能是空字符 
    115     {
    116         if(!cnt[num[sa[i]]])k++;
    117         cnt[num[sa[i]]]++;
    118         if(k>=q)
    119         {
    120             for(;k-(cnt[num[sa[t]]]==1)>=q;k-=(cnt[num[sa[t]]]==1),--cnt[num[sa[t++]]]);
    121             rec[i]=t;
    122         }
    123     }
    124     /*for1(i,n)
    125     {
    126      cout<<i<<' '<<h[i]<<' ';
    127      for2(j,sa[i],n)cout<<s[j];
    128      cout<<endl;
    129     }*/
    130     for1(i,m)
    131     {
    132         long long ans=0;int k=0;
    133         for2(j,beg[i],end[i])
    134         {
    135             for(k?k--:0;k+1<=end[i]-j+1&&check(rk[j],k+1);k++);//类似于height数组的求法 
    136             //if(i==1&&s[j]=='b')cout<<"AAAAAAA"<<' '<<k<<' '<<rk[j]<<endl;
    137             ans+=(long long)k;
    138         }
    139         printf("%lld",ans);
    140         if(i!=m)printf(" ");
    141     }
    142     return 0;
    143 }
    View Code
  • 相关阅读:
    Dictionary-Guided Editing Networks for Paraphrase Generation解读
    CGMH:Constrained Sentence Generation by Metropolis-Hastings Sampling解读
    Text Infilling解读
    K-MEANS算法
    SVM-支持向量机算法
    003-文本分析
    002-贝叶斯拼写纠正实例
    001-贝叶斯算法简介
    【矩阵的乘积/复合变换】- 图解线性代数 05
    【行列式】- 图解线性代数 04
  • 原文地址:https://www.cnblogs.com/zyfzyf/p/4149536.html
Copyright © 2020-2023  润新知