• SPOJ 220 Relevant Phrases of Annihilation(后缀数组+二分答案)


    【题目链接】 http://www.spoj.pl/problems/PHRASES/ 

    【题目大意】

      求在每个字符串中出现至少两次的最长的子串

    【题解】

      注意到这么几个关键点:最长,至少两次,每个字符串。
      首先对于最长这个条件,我们可以想到二分答案,
      然后利用后缀数组所求得的三个数组判断是否满足条件。
      其次是出现两次,每次出现这个条件的时候,
      我们就应该要想到这是最大值最小值可以处理的,
      将出现在同一个字符串中的每个相同字符串的起始位置保存下来,
      如果最小值和最大值的差距超过二分长度L,则表明在这个字符串中这个条件是可行的。
      将所有的字符串通过拼接符连接在一起,做一遍后缀数组,
      现在我们根据h数组将大于二分长度的前后后缀分为一组,
      每当存在分组中的后缀数量大于2*n,
      就说明这个字符串有可能是我们需要的答案,那么对它进行检验,
      检验所有可能合法的字符串就可以完成对一个长度的判断了。

    【代码】

    #include <cstdio>
    #include <cstring>
    #include <vector>
    #include <algorithm>
    using namespace std;
    const int N=1000010;
    int n,m,rank[N],sa[N],h[N],tmp[N],cnt[N],ans,a[N],s[N]; char str[N];
    void suffixarray(int n,int m){
        int i,j,k;n++;
        for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
        for(i=0;i<m;i++)cnt[i]=0;
        for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
        for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
        for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
        for(k=1;k<=n;k<<=1){
            for(i=0;i<n;i++){
                j=sa[i]-k;
                if(j<0)j+=n;
                tmp[cnt[rank[j]]++]=j;
            }sa[tmp[cnt[0]=0]]=j=0;
            for(i=1;i<n;i++){
                if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
                sa[tmp[i]]=j;
            }memcpy(rank,sa,n*sizeof(int));
            memcpy(sa,tmp,n*sizeof(int));
            if(j>=n-1)break;
        }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
        while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
    }int first=0,len[N],u,K;
    vector<int> S[N];
    int Min[15],Max[15];
    bool check(int L){
        int cur=-1;
        for(int i=1;i<=u;i++){
            if(h[i]<L)S[++cur].clear();
            S[cur].push_back(i);
        }
        for(int i=0;i<=cur;i++){
            if(S[i].size()>=2*n){
                memset(Min,-1,sizeof(Min));
                memset(Max,-1,sizeof(Max));
                for(int j=0;j<S[i].size();j++){
                    int k=S[i][j];
                    int x=upper_bound(a,a+n+1,sa[k])-a-1;
                    Min[x]=Min[x]==-1?sa[k]:min(Min[x],sa[k]);
                    Max[x]=Max[x]==-1?sa[k]:max(Max[x],sa[k]);
                }bool flag=1;
                for(int i=0;i<n;i++){
                    if(Min[i]==-1||Max[i]-Min[i]<L){flag=0;break;}
                }if(flag)return 1;
            }
        }return 0;
    }int T;
    int main(){
        scanf("%d",&T);
        while(T--){
            scanf("%d",&n);
            int tmp=200; u=0;
            for(int i=0;i<n;i++){
    			scanf("%s",str);
    			len[i]=strlen(str);
            	for(int j=0;j<len[i];j++)s[u++]=(int)str[j];
            	s[u++]=tmp++;
            }tmp=0; s[u]=0; //注意处理完的字符串最后封零
            for(int i=0;i<=n;i++){
                a[i]=tmp;
                if(i<n)tmp=tmp+(i==0?len[i]:len[i]+1);
            }suffixarray(u,310);
            int l=1,r=10000,ans=0;
            while(l<=r){
                int mid=(l+r)>>1;
                if(check(mid))ans=mid,l=mid+1;
                else r=mid-1;
            }printf("%d
    ",ans);
        }return 0;
    }
    

      

  • 相关阅读:
    2013.11.19上班 任务:写文档
    js 时间比较和货币格式显示
    SQL优化
    多线程消费队列中的接口数据,接口数据来源是kafka
    List<Map<String, Object>> 中根据某一个属性进行排序
    ES查询操作
    Valid Sudoku
    Decode Ways
    Jump Game
    Best Time to Buy and Sell Stock II
  • 原文地址:https://www.cnblogs.com/forever97/p/PHRASES.html
Copyright © 2020-2023  润新知