• UVA11019 Matrix Matcher(AC自动机)


    题意:给出一个n*m的字符矩阵T,你的任务是找出给定的x*y的字符矩阵P在T中出现了多少次.

    分析:要想整个矩阵匹配,至少各行都得匹配。所以先把P的每行看做一个模式串构造出AC自动机,然后在T中的各行逐一匹配,找到P中每一行的所有匹配点。

    只要在匹配时做一些附加操作,就可以把匹配出来的单一的行拼成矩形。用一个d[r][c]表示T中一(r,c)为右上角,与P等大的矩形中有多少个完整的行和P对应位置的行完全相同.当P的第i行出现在T的第r行,起始列编号为c时,意味着d[r-i][c]应当加1.所有匹配结束后,d[r][c]=X的那些就是一个二维匹配点.

    注意:模式串有可能相同,因此需要一个链表来相同的模式串.

    在insert里,若有相同的模式串,则用next数组构成链表  
    if(val[u]) { next[v]=val[u]; }
    // File Name: 11019.cpp
    // Author: zlbing
    // Created Time: 2013/3/23 14:37:07
    
    #include<iostream>
    #include<string>
    #include<algorithm>
    #include<cstdlib>
    #include<cstdio>
    #include<set>
    #include<map>
    #include<vector>
    #include<cstring>
    #include<stack>
    #include<cmath>
    #include<queue>
    using namespace std;
    #define CL(x,v); memset(x,v,sizeof(x));
    #define INF 0x3f3f3f3f
    #define LL long long
    #define REP(i,r,n) for(int i=r;i<=n;i++)
    #define RREP(i,n,r) for(int i=n;i>=r;i--)
    const int SIGMA_SIZE = 26;
    const int MAXNODE = 111000;
    const int MAXS = 150 + 10;
    
    map<string,int> ms;
    //ms是为了满足特殊要求,比如模板串相同时
    struct ACautomata {
      int ch[MAXNODE][SIGMA_SIZE];
      int f[MAXNODE];    // fail函数
      int val[MAXNODE];  // 每个字符串的结尾结点都有一个非0的val
      int last[MAXNODE]; // 输出链表的下一个结点
      int next[MAXS];
      int sz;
      int d[1005][1005];
      void init() {
        sz = 1;
        memset(ch[0], 0, sizeof(ch[0]));
        ms.clear();
        memset(d,0,sizeof(d));
        memset(next,0,sizeof(next));
      }
    
      // 字符c的编号
      int idx(char c) {
        return c-'a';
      }
    
      // 插入字符串。v必须非0
      void insert(char *s, int v) {
        int u = 0, n = strlen(s);
        for(int i = 0; i < n; i++) {
          int c = idx(s[i]);
          if(!ch[u][c]) {
            memset(ch[sz], 0, sizeof(ch[sz]));
            val[sz] = 0;
            ch[u][c] = sz++;
          }
          u = ch[u][c];
        }
        if(val[u])
        {
            next[v]=val[u];
        }
        val[u] = v;
        ms[string(s)] = v;
      }
    
      // 递归打印匹配文本串str[i]结尾的后缀,以结点j结尾的所有字符串
      void print(int i,int j,int x) {
        if(j) {
            if(x-val[j]+1>0)
            d[x-val[j]+1][i]++;
            int t=val[j];
            while(next[t])
            {
                t=next[t];
                if(x-t+1>0)
                    d[x-t+1][i]++;
            }
          print(i,last[j],x);
        }
      }
    
      // 在T中找模板
      int find(char* T,int x) {
        int n = strlen(T);
        int j = 0; // 当前结点编号,初始为根结点
        for(int i = 0; i < n; i++) { // 文本串当前指针
          int c = idx(T[i]);
          j = ch[j][c];
          if(val[j]) print(i,j,x);
          else if(last[j]) print(i,last[j],x); // 找到了!
        }
      }
    
      // 计算fail函数
      void getFail() {
        queue<int> q;
        f[0] = 0;
        // 初始化队列
        for(int c = 0; c < SIGMA_SIZE; c++) {
          int u = ch[0][c];
          if(u) { f[u] = 0; q.push(u); last[u] = 0; }
        }
        // 按BFS顺序计算fail
        while(!q.empty()) {
          int r = q.front(); q.pop();
          for(int c = 0; c < SIGMA_SIZE; c++) {
            int u = ch[r][c];
            if(!u) {
                ch[r][c]=ch[f[r]][c];
                continue;
            }
            q.push(u);
            int v = f[r];
            while(v && !ch[v][c]) v = f[v];
            f[u] = ch[v][c];
            last[u] = val[f[u]] ? f[u] : last[f[u]];
          }
        }
      }
    
    };
    ACautomata solver;
    char str[1005][1005];
    char str1[105][105];
    int main(){
        int T;
        scanf("%d",&T);
        while(T--)
        {
            int N,M,X,Y;
            scanf("%d%d",&N,&M);
            REP(i,1,N)
                scanf("%s",str[i]);
            scanf("%d%d",&X,&Y);
            REP(i,1,X)
                scanf("%s",str1[i]);
            solver.init();
            REP(i,1,X){
                solver.insert(str1[i],i);
            }
            solver.getFail();
            REP(i,1,N)
            {
                solver.find(str[i],i);
            }
            int ans=0;
            REP(i,1,N)
                REP(j,1,M)
                if(solver.d[i][j]==X)
                    ans++;
            printf("%d\n",ans);
        }
        return 0;
    }
  • 相关阅读:
    eclipse生成jar包 注意事项!
    java结合testng,利用XML做数据源的数据驱动示例
    2018 计蒜之道 初赛 第二场
    2018 计蒜之道 初赛 第一场
    Tarjan&&缩点简析
    POJ1159
    POJ1080
    POJ1260
    POJ2533&&1836&&3176
    Luogu P1484 种树
  • 原文地址:https://www.cnblogs.com/arbitrary/p/2977617.html
Copyright © 2020-2023  润新知