Problem Description
当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
Input
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
Output
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
Sample Input
3
aaa
bbb
ccc
2
aaabbbccc
bbaacc
Sample Output
web 1: 1 2 3
total: 1
Source
Recommend
ac自动机,可见字符除掉空格就是33-126一共94个,所以Next的大小确定了,交g++总是空间超限,交c++就过了。最后还有一个回车。
代码:
#include <iostream> #include <cstdio> #include <cstring> #include <algorithm> #include <queue> #define MAX 10000 using namespace std; struct Trie { Trie *Next[94],*Fail; int no; Trie() { for(int i = 0;i < 94;i ++) { Next[i] = NULL; } Fail = NULL; no = 0; } }*root; int ans[3],c,num,vis[501]; void Insert_Str(char *s,int no) {///字符串插入到字典树中 Trie *r = root; int i = -1; while(s[++ i]) { int d = s[i] - 33; if(r -> Next[d] == NULL) { r -> Next[d] = new Trie(); } r = r -> Next[d]; } r -> no = no;///编号 } void Build_Fail() {///通过父结点的Fail更新子结点的Fail Trie *node,*temp; queue<Trie *> q; q.push(root); while(!q.empty()) { node = q.front(); q.pop(); for(int i = 0;i < 94;i ++) { if(node -> Next[i]) {///第i个儿子存在 temp = node -> Fail;///temp赋值当前节点的Fail while(temp) { if(temp -> Next[i]) { node -> Next[i] -> Fail = temp -> Next[i]; break; } temp = temp -> Fail; } if(temp == NULL) {///没找到或者本来就是根节点 node -> Next[i] -> Fail = root; } q.push(node -> Next[i]); } } } } void Ac_automation(char *s) { int i = -1; Trie *node = root,*temp; while(s[++ i]) { int d = s[i] - 33; while(node != root && node -> Next[d] == NULL) node = node -> Fail;///如果没有匹配的子结点 就找它的Fail看看有没有匹配的子结点 if(node -> Next[d]) node = node -> Next[d]; temp = node; while(temp -> no && !vis[temp -> no]) { ans[c ++] = temp -> no; vis[temp -> no] = 1; temp = temp -> Fail;///找最长后缀 } } } int main() { char s[MAX + 10]; int n,m; root = new Trie(); scanf("%d",&n); for(int i = 1;i <= n;i ++) { scanf("%s",s); Insert_Str(s,i); } Build_Fail(); scanf("%d",&m); for(int i = 1;i <= m;i ++) { scanf("%s",s); memset(vis,0,sizeof(vis)); c = 0; Ac_automation(s); if(c) { num ++; printf("web %d:",i); sort(ans,ans + c); for(int j = 0;j < c;j ++) { printf(" %d",ans[j]); } putchar(' '); } } printf("total: %d ",num); }
但这是基于链表的,比较耗费空间和时间,时间倒不怎么明显的,基于数组的提交g++是可以过的。
代码:
#include <iostream> #include <cstdio> #include <cstring> #include <algorithm> #include <queue> #define MAX 10000 using namespace std; int ans[10],c,num,vis[501],pos; int trie[1000010][94],fail[1000010] = {-1},no[1000010]; void Insert_Str(char *s,int k) {///字符串插入到字典树中 int i = -1,r = 0; while(s[++ i]) { int d = s[i] - 33; if(!trie[r][d]) { trie[r][d] = ++ pos; } r = trie[r][d]; } no[r] = k;///编号 } void Build_Fail() {///通过父结点的Fail更新子结点的Fail queue<int> q; q.push(0); while(!q.empty()) { int id = q.front(); q.pop(); for(int i = 0;i < 94;i ++) { if(trie[id][i]) {///第i个儿子存在 int temp = fail[id];///temp赋值当前节点的Fail while(temp != -1) { if(trie[temp][i]) { fail[trie[id][i]] = trie[temp][i]; break; } temp = fail[temp]; } q.push(trie[id][i]); } } } } void Ac_automation(char *s) { int i = -1,r = 0; while(s[++ i]) { int d = s[i] - 33; while(r && !trie[r][d]) r = fail[r];///如果没有匹配的子结点 就找它的Fail看看有没有匹配的子结点 if(trie[r][d]) r = trie[r][d]; int temp = r; while(no[temp] && !vis[no[temp]]) { ans[c ++] = no[temp]; vis[no[temp]] = 1; temp = fail[temp];///找最长后缀 } } } int main() { char s[10005]; int n,m; scanf("%d",&n); for(int i = 1;i <= n;i ++) { scanf("%s",s); Insert_Str(s,i); } Build_Fail(); scanf("%d",&m); for(int i = 1;i <= m;i ++) { scanf("%s",s); memset(vis,0,sizeof(vis)); c = 0; Ac_automation(s); if(c) { num ++; printf("web %d:",i); sort(ans,ans + c); for(int j = 0;j < c;j ++) { printf(" %d",ans[j]); } putchar(' '); } } printf("total: %d ",num); }
基于字典图,路径压缩的
代码:
#include <iostream> #include <cstdio> #include <cstring> #include <algorithm> #include <queue> #define MAX 10000 using namespace std; int ans[10],c,num,vis[501],pos; int trie[1000010][94],fail[1000010],no[1000010]; void Insert_Str(char *s,int k) {///字符串插入到字典树中 int i = -1,r = 0; while(s[++ i]) { int d = s[i] - 33; if(!trie[r][d]) { trie[r][d] = ++ pos; } r = trie[r][d]; } no[r] = k;///编号 } void Build_Fail() {///通过父结点的Fail更新子结点的Fail queue<int> q; q.push(0); while(!q.empty()) { int id = q.front(); q.pop(); for(int i = 0;i < 94;i ++) { if(trie[id][i]) {///第i个儿子存在 if(id) fail[trie[id][i]] = trie[fail[id]][i]; q.push(trie[id][i]); } else trie[id][i] = trie[fail[id]][i]; } } } void Ac_automation(char *s) { int i = -1,r = 0; while(s[++ i]) { int d = s[i] - 33; r = trie[r][d]; for(int j = r;j && no[j] && !vis[no[j]];j = fail[j]) { ans[c ++] = no[j]; vis[no[j]] = 1; } } } int main() { char s[10005]; int n,m; scanf("%d",&n); for(int i = 1;i <= n;i ++) { scanf("%s",s); Insert_Str(s,i); } Build_Fail(); scanf("%d",&m); for(int i = 1;i <= m;i ++) { scanf("%s",s); memset(vis,0,sizeof(vis)); c = 0; Ac_automation(s); if(c) { num ++; printf("web %d:",i); sort(ans,ans + c); for(int j = 0;j < c;j ++) { printf(" %d",ans[j]); } putchar(' '); } } printf("total: %d ",num); }