• BZOJ4327: JSOI2012 玄武密码


    Description

    在美丽的玄武湖畔,鸡鸣寺边,鸡笼山前,有一块富饶而秀美的土地,人们唤作进香河。相传一日,一缕紫气从天而至,只一瞬间便消失在了进香河中。老人们说,这是玄武神灵将天书藏匿在此。

    很多年后,人们终于在进香河地区发现了带有玄武密码的文字。更加神奇的是,这份带有玄武密码的文字,与玄武湖南岸台城的结构有微妙的关联。于是,漫长的破译工作开始了。

    经过分析,我们可以用东南西北四个方向来描述台城城砖的摆放,不妨用一个长度为N的序列来描述,序列中的元素分别是‘E’,‘S’,‘W’,‘N’,代表了东南西北四向,我们称之为母串。而神秘的玄武密码是由四象的图案描述而成的M段文字。这里的四象,分别是东之青龙,西之白虎,南之朱雀,北之玄武,对东南西北四向相对应。

    现在,考古工作者遇到了一个难题。对于每一段文字,其前缀在母串上的最大匹配长度是多少呢?

    Input

    第一行有两个整数,N和M,分别表示母串的长度和文字段的个数。

    第二行是一个长度为N的字符串,所有字符都满足是E,S,W和N中的一个。

    之后M行,每行有一个字符串,描述了一段带有玄武密码的文字。依然满足,所有字符都满足是E,S,W和N中的一个。

    Output

    输出有M行,对应M段文字。

    每一行输出一个数,表示这一段文字的前缀与母串的最大匹配串长度。

    Sample Input

    7 3
    SNNSSNS
    NNSS
    NNN
    WSEE

    Sample Output

    4
    2
    0

    HINT

    对于100%的数据,N<=10^7,M<=10^5,每一段文字的长度<=100。

    应上传者要求,此题不公开,如有异议,请提出.

    Solution

    自己想了一个做法,然后过是过了,就是跑的很慢,在BZOJ里面排到最后一页...

    上网找了一下没人写的和我一样。

    大概思路就是

    把模式串全部插进去后AC自动机后,对每个节点都开个vector存有多少个模式串经过这里以及分别为多长的前缀,匹配的时候每次匹配完一个节点就直接把那个vector清空了就好,那这样每个节点就只会访问一次了,但是就是有点慢...

    /**************************************************************
        Problem: 4327
        User: henryy
        Language: C++
        Result: Accepted
        Time:7596 ms
        Memory:175108 kb
    ****************************************************************/
     
    #include <bits/stdc++.h>
    using namespace std;
     
    #define ll long long
    #define inf 0x3f3f3f3f
    #define N 100010
     
    int fail[N*5], ch[N*5][5], last[N*5], tot;
    int n, m;
    char s1[(int)(1e7)+1];
    vector<int>val[N*5][2];
     
    int idx(char c) {
        if(c == 'E') return 0;
        if(c == 'S') return 1;
        if(c == 'W') return 2;
        if(c == 'N') return 3;
    }
     
    void insert(char *s, int id) {
        int u = 0;
        for(int i = 1; s[i]; ++i) {
            int c = idx(s[i]);
            if(!ch[u][c]) ch[u][c] = ++tot;
            u = ch[u][c];
            val[u][0].push_back(id); 
            val[u][1].push_back(i);
        }
    }
     
    int q[N];
     
    void get_fail() {
        int l = 1, r = 1;
        for(int i = 0; i < 4; ++i) 
            if(ch[0][i]) q[r++] = ch[0][i];
        while(l != r) {
            int u = q[l++];
            if(l == 100000) l = 1;
            for(int i = 0; i < 4; ++i) {
                if(ch[u][i]) {
                    fail[ch[u][i]] = ch[fail[u]][i];
                    q[r++] = ch[u][i];
                    if(r == 100000) r = 1;
                } else ch[u][i] = ch[fail[u]][i];
            }
        }
    }
     
    int ans[N];
     
    void query(char *s) {
        int u = 0;
        for(int i = 1; s[i]; ++i) {
            u = ch[u][idx(s[i])];
            for(int j = u; j && val[j][0].size(); j = fail[j]) {
                if(val[j][0].size()) {
                    for(int k = 0, len = val[j][0].size(); k < len; ++k) {
                        ans[val[j][0][k]] = max(ans[val[j][0][k]], val[j][1][k]);
                    }
                    val[j][0].clear();
                    val[j][1].clear();
                }
            }
        }
    }
     
    char s[N];
     
    int main() {
        scanf("%d%d", &n, &m);
        scanf("%s", s1 + 1);
        for(int i = 1; i <= m; ++i) {
            scanf("%s", s + 1);
            insert(s, i);
        }
        get_fail();
        query(s1);
        for(int i = 1; i <= m; ++i) {
            printf("%d
    ", ans[i]);
        }
        return 0;
    }
    

    并去学习了一下网上的做法:其实只要在AC自动机上面打标记就好了,然后最后遍历所有串去找最大的标记处(因为每次跑失配指针其实都是因为前缀能够匹配的上)

    #include <bits/stdc++.h>
    using namespace std;
    
    #define ll long long
    #define inf 0x3f3f3f3f
    #define N 300010
    
    int fail[N*5], ch[N*5][5], val[N*5], tot;
    int n, m, v[N*5];
    char s1[(int)(1e7)+1];
    
    int idx(char c) {
    	if(c == 'E') return 0;
    	if(c == 'S') return 1;
    	if(c == 'W') return 2;
    	return 3;
    }
    
    void insert(char *s, int id) {
    	int u = 0;
    	for(int i = 1; s[i]; ++i) {
    		int c = idx(s[i]);
    		if(!ch[u][c]) ch[u][c] = ++tot;
    		u = ch[u][c];
    	}
    	val[id] = u;
    }
    
    int q[N];
    
    void get_fail() {
    	int l = 1, r = 1;
    	for(int i = 0; i < 4; ++i) 
    		if(ch[0][i]) q[r++] = ch[0][i];
    	while(l != r) {
    		int u = q[l++];
    		if(l == 100000) l = 1;
    		for(int i = 0; i < 4; ++i) {
    			if(ch[u][i]) {
    				fail[ch[u][i]] = ch[fail[u]][i];
    				q[r++] = ch[u][i];
    				if(r == 100000) r = 1;
    			} else ch[u][i] = ch[fail[u]][i];
    		}
    	}
    }
    
    void query(char *s) {
    	int u = 0;
    	for(int i = 1; s[i]; ++i) {
    		u = ch[u][idx(s[i])];
    		for(int j = u; j &&  !v[j]; j = fail[j]) {
    			v[j] = 1;
    		}
    	}
    }
    
    int ask(char *s) {
    	int ans = 0;
    	for(int u = 0, i = 1; s[i]; i++) {
    		u = ch[u][idx(s[i])];
    		if(v[u]) ans = max(ans, i);
    	}
    	return ans;
    }
    
    char s[N][120];
    
    int main() {
    	scanf("%d%d", &n, &m);
    	scanf("%s", s1 + 1);
    	for(int i = 1; i <= m; ++i) {
    		scanf("%s", s[i] + 1);
    		insert(s[i], i);
    	}
    	get_fail();
    	query(s1);
    	for(int i = 1; i <= m; ++i) {
    		printf("%d
    ", ask(s[i]));
    	}
    	return 0;
    }
    
  • 相关阅读:
    高精度计算
    c++ sort
    算法分类小结
    二叉树层序遍历
    clion windows c++环境配置 mingw
    kafka,filebeat 配置
    centos7 源码安装mysql5.7
    如何优雅的生成及遍历python嵌套字典
    Java Swing 绝对布局管理方法,null布局【图】
    python3.4+pymssql 中文乱码问题解决
  • 原文地址:https://www.cnblogs.com/henry-1202/p/10297982.html
Copyright © 2020-2023  润新知