题目描述
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。
一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。
例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。
给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。
输入输出格式
输入格式:
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。
其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
输出格式:
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
输入输出样例
输出样例#1:
14 (整段文章’whatisyourname’都能被理解) 6 (前缀’whatis’能够被理解) 0 (没有任何前缀能够被理解)
。
。
。
。
好,现在题目看完了,我们来瞎搞一波思路
暴力分是纯模拟,把每一个单词与当前文章比较,一个搜索打下去,如果每匹配到一个单词,ans就改变为当前长度。
正解:字典树+DP
为什么要构建一个字典树呢?
我们可以这样想,如果让每一个单词去匹配当次的文章,是不是要匹配n次,那么我们是不是可以考虑把文章放到单词里比较?那就构建一个字典树吧。
比如有:what,whati,wha,whatis,这样的话每一个单词去与文本串比较还不如文本串直接放到字典树里去比较对吧。那样一次就能确认是否存在。
为什么要用DP?
按题意看来,单独删去字符串来看,就是下放区间然后求从第一个单位开始的最长被覆盖区间,
那么如果按贪心来看:whati,what,is去匹配whatis的话,贪心肯定是优先匹配最长的,但是what和is要比whati长。
所以可以确定是一个简单的dp:拿文本串去字典树里匹配,每匹配到一个单词就在文章匹配的末尾打一个标记好了,有标记就说明这个单词后的下一个字母可以继续匹配,否则就不能。
好,放本蒟蒻丑陋的代码了
#include<cstdio> #include<cstring> #include<cmath> #include<algorithm> #include<iostream> using namespace std; int dp[1000001],n,m,tot=1; char ss[1000001]; struct node{ int a[27]; bool kuan; }e[1000001]; inline void build() { int len=strlen(ss+1),t=1; for(int i=1;i<=len;i++) { if(!e[t].a[ss[i]-'a']) { e[t].a[ss[i]-'a']=++tot; } t=e[t].a[ss[i]-'a']; } e[t].kuan=true; } void dpp() { int ans=0,len=strlen(ss+1); dp[0]=1; for(int i=0;i<=len;i++) { if(dp[i]!=1)continue; else ans=i; int t=1; for(int j=i+1;j<=len;j++) { t=e[t].a[ss[j]-'a']; if(t==0)break; if(e[t].kuan) dp[j]=1; } } printf("%d ",ans); } int main() { scanf("%d%d",&n,&m); for(int i=1;i<=n;i++) { scanf("%s",ss+1); build(); } for(int i=1;i<=m;i++) { memset(dp,0,sizeof(dp)); scanf("%s",ss+1); dpp(); } return 0; }