• Spoj-DISUBSTR


    Spoj-DISUBSTR - Distinct Substrings

    New Distinct Substrings SPOJ - SUBST1

    我是根据kuangbin的后缀数组专题来的

    这两题题意一样求解字符串中不同字串的个数:

    这个属于后缀数组最基本的应用

    给定一个字符串,求不相同的子串的个数。

    算法分析: 每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。

    如果所有的后缀按照 suffix(sa[1]), suffix(sa[2]), suffix(sa[3]), …… ,suffix(sa[n])的顺序计算,不难发现,

    对于每一次新加 进来的后缀 suffix(sa[k]),它将产生 n-sa[k]+1 个新的前缀。

    但是其中有 height[k]个是和前面的字符串的前缀是相同的。

    所以 suffix(sa[k])将“贡献” 出 n-sa[k]+1- height[k]个不同的子串。(这个也就等价于len*(len+1)/2-相同字串个数)

    累加后便是原问题的答案。这个做法 的时间复杂度为 O(n)。

      1 #include <cstdio>
      2 #include <cstring>
      3 #include <queue>
      4 #include <cmath>
      5 #include <algorithm>
      6 #include <set>
      7 #include <iostream>
      8 #include <map>
      9 #include <stack>
     10 #include <string>
     11 #include <time.h>
     12 #include <vector>
     13 #define  pi acos(-1.0)
     14 #define  eps 1e-9
     15 #define  fi first
     16 #define  se second
     17 #define  rtl   rt<<1
     18 #define  rtr   rt<<1|1
     19 #define  bug         printf("******
    ")
     20 #define  mem(a,b)    memset(a,b,sizeof(a))
     21 #define  name2str(x) #x
     22 #define  fuck(x)     cout<<#x" = "<<x<<endl
     23 #define  f(a)        a*a
     24 #define  sf(n)       scanf("%d", &n)
     25 #define  sff(a,b)    scanf("%d %d", &a, &b)
     26 #define  sfff(a,b,c) scanf("%d %d %d", &a, &b, &c)
     27 #define  sffff(a,b,c,d) scanf("%d %d %d %d", &a, &b, &c, &d)
     28 #define  pf          printf
     29 #define  FRE(i,a,b)  for(i = a; i <= b; i++)
     30 #define  FREE(i,a,b) for(i = a; i >= b; i--)
     31 #define  FRL(i,a,b)  for(i = a; i < b; i++)+
     32 #define  FRLL(i,a,b) for(i = a; i > b; i--)
     33 #define  FIN         freopen("data.txt","r",stdin)
     34 #define  gcd(a,b)    __gcd(a,b)
     35 #define  lowbit(x)   x&-x
     36 #define rep(i,a,b) for(int i=a;i<b;++i)
     37 #define per(i,a,b) for(int i=a-1;i>=b;--i)
     38 
     39 using namespace std;
     40 typedef long long  LL;
     41 typedef unsigned long long ULL;
     42 const int maxn = 1e5 + 7;
     43 const int maxm = 8e6 + 10;
     44 const int INF = 0x3f3f3f3f;
     45 const int mod = 10007;
     46 
     47 //rnk从0开始
     48 //sa从1开始,因为最后一个字符(最小的)排在第0位
     49 //height从1开始,因为表示的是sa[i - 1]和sa[i]
     50 //倍增算法 O(nlogn)
     51 int wa[maxn], wb[maxn], wv[maxn], ws_[maxn];
     52 int Rank[maxn], height[maxn], sa[maxn], r[maxn];
     53 int n, maxx;
     54 char s[maxn];
     55 //Suffix函数的参数m代表字符串中字符的取值范围,是基数排序的一个参数,如果原序列都是字母可以直接取128,如果原序列本身都是整数的话,则m可以取比最大的整数大1的值
     56 //待排序的字符串放在r数组中,从r[0]到r[n-1],长度为n
     57 //为了方便比较大小,可以在字符串后面添加一个字符,这个字符没有在前面的字符中出现过,而且比前面的字符都要小
     58 //同上,为了函数操作的方便,约定除r[n-1]外所有的r[i]都大于0,r[n-1]=0
     59 //函数结束后,结果放在sa数组中,从sa[0]到sa[n-1]
     60 void Suffix ( int *r, int *sa, int n, int m ) {
     61     int i, j, k, *x = wa, *y = wb, *t;
     62     //对长度为1的字符串排序
     63     //一般来说,在字符串的题目中,r的最大值不会很大,所以这里使用了基数排序
     64     //如果r的最大值很大,那么把这段代码改成快速排序
     65     for ( i = 0; i < m; ++i ) ws_[i] = 0;
     66     for ( i = 0; i < n; ++i ) ws_[x[i] = r[i]]++; //统计字符的个数
     67     for ( i = 1; i < m; ++i ) ws_[i] += ws_[i - 1]; //统计不大于字符i的字符个数
     68     for ( i = n - 1; i >= 0; --i ) sa[--ws_[x[i]]] = i; //计算字符排名
     69     //基数排序
     70     //x数组保存的值相当于是rank值
     71     for ( j = 1, k = 1; k < n; j *= 2, m = k ) {
     72         //j是当前字符串的长度,数组y保存的是对第二关键字排序的结果
     73         //第二关键字排序
     74         for ( k = 0, i = n - j; i < n; ++i ) y[k++] = i; //第二关键字为0的排在前面
     75         for ( i = 0; i < n; ++i ) if ( sa[i] >= j ) y[k++] = sa[i] - j; //长度为j的子串sa[i]应该是长度为2 * j的子串sa[i] - j的后缀(第二关键字),对所有的长度为2 * j的子串根据第二关键字来排序
     76         for ( i = 0; i < n; ++i ) wv[i] = x[y[i]]; //提取第一关键字
     77         //按第一关键字排序 (原理同对长度为1的字符串排序)
     78         for ( i = 0; i < m; ++i ) ws_[i] = 0;
     79         for ( i = 0; i < n; ++i ) ws_[wv[i]]++;
     80         for ( i = 1; i < m; ++i ) ws_[i] += ws_[i - 1];
     81         for ( i = n - 1; i >= 0; --i ) sa[--ws_[wv[i]]] = y[i]; //按第一关键字,计算出了长度为2 * j的子串排名情况
     82         //此时数组x是长度为j的子串的排名情况,数组y仍是根据第二关键字排序后的结果
     83         //计算长度为2 * j的子串的排名情况,保存到数组x
     84         t = x;
     85         x = y;
     86         y = t;
     87         for ( x[sa[0]] = 0, i = k = 1; i < n; ++i )
     88             x[sa[i]] = ( y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + j] == y[sa[i] + j] ) ? k - 1 : k++;
     89         //若长度为2 * j的子串sa[i]与sa[i - 1]完全相同,则他们有相同的排名
     90     }
     91 }
     92 void calheight ( int *r, int *sa, int n ) {
     93     int i, j, k = 0;
     94     for ( i = 1; i <= n; i++ ) Rank[sa[i]] = i;
     95     for ( i = 0; i < n; height[Rank[i++]] = k )
     96         for ( k ? k-- : 0, j = sa[Rank[i] - 1]; r[i + k] == r[j + k]; k++ );
     97 }
     98 
     99 int main() {
    100     int T;
    101     sf ( T );
    102     while ( T-- )  {
    103         scanf ( "%s", s );
    104         maxx = 0, n = strlen ( s );
    105         for ( int i = 0; i < n ; i++ ) r[i] = ( int ) s[i], maxx = max ( maxx, r[i] );
    106         r[n] = 0;
    107 //        for ( int i = 0 ; i < n ; i++ ) printf ( "%d%c", r[i], ( i == n - 1 ? '
    ' : ' ' ) );
    108         Suffix ( r, sa, n + 1, maxx + 1 );
    109         calheight ( r, sa, n );
    110         LL ans = 0;
    111         for ( int i = 1 ; i <= n ; i++ ) ans += 1LL * ( n - sa[i] - height[i] );
    112         printf ( "%lld
    ", ans );
    113     }
    114     return 0;
    115 }
    View Code
  • 相关阅读:
    动态规划最大利润的问题
    【转】mysql基础汇总
    mac使用frida
    Mac 下python3 [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed 解决方法
    mac使用jadx逆向app
    python桶排序代码
    requests_html使用asyncio
    async for的使用
    [转载]微信企业号:企业客户的移动应用入口
    微信服务号、订阅号、企业号差别
  • 原文地址:https://www.cnblogs.com/qldabiaoge/p/11329914.html
Copyright © 2020-2023  润新知