• CF1203D2 Remove the Substring (hard version) 题解


    这题初赛让我白给了6分,于是我决定回来解决一下它。

    说实话,看原题题面和看CCF代码真是两种完全不同的感受……

    ------------
    思路分析:

    把$s$串删去一部分之后,会把$s$串分成两部分,当然其中一部分有可能为空。$t$串作为$s$串的字串,在删去一部分之后也会被分为两部分。因此我们可以枚举$t$串被分开的位置,然后进行计算。

    设$t$串在$t[p]$和$t[p+1]$之间被分开,$s$串在$s[i]$和$s[i+1]$之间被分开。因为要使答案最大,因此我们要让$s$串的左半部分包含且仅包含一个$t$串的左半部分,右半部分也是一样。

    因此,按照CCF的讲法,设$s$串和$t$串的长度分别为$slen$和$tlen$,我们可以设$head[i]=p$表示$s[0...i]$包含且仅包含一个子串为$t[0...p]$,设$back[i]=p$表示$s[i...slen-1]$包含且仅包含一个字串为$t[p...tlen-1]$。

    如何递推$head$和$back$数组?很显然了,用两个指针分别指向$s$串和$t$串,表示当前位置,相同即匹配成功。

    因为指针初值需要设置为0,因此以下代码将$s$串和$t$串都整体后移了一位。

    p=1;
    for(int i=1;i<s.size();i++)
    {
        head[i]=head[i-1];
        if(s[i]==t[p])
            head[i]=p++;
    }
    p=t.size()-1;back[s.size()]=t.size();
    for(int i=s.size()-1;i;i--)
    {
        back[i]=back[i+1];
        if(s[i]==t[p])
            back[i]=p--;
    }

    递推出$head$和$back$数组后,枚举断点计算答案就行了。用两个指针$i,j$分别指向删除的部分两端。为了让答案最大,应该找到满足$head[i]=p$的最小的$i$,以及满足$back[j]=p+1$的最大的$j$,这两个步骤用两个while循环就可以轻松搞定了。有一个需要注意的点,当被分开的两部分其中一部分包含整个$t$串时,另一部分取空串是最优的,这个需要特判一下。答案即为$j-i-1$。计算答案时也要特判不合法的情况。各个指针的初值也需要注意。

    #include<iostream>
    #include<cstdio>
    #include<string>
    using namespace std;
    const int N=1e6;
    int p=1,ans;
    int head[N],back[N];
    string s,t;
    int main()
    {
        cin>>s>>t;s='.'+s,t='.'+t;//后移一位
        for(int i=1;i<s.size();i++)
        {
            head[i]=head[i-1];
            if(s[i]==t[p])
                head[i]=p++;
        }
        p=t.size()-1;back[s.size()]=t.size();
        for(int i=s.size()-1;i;i--)
        {
            back[i]=back[i+1];
            if(s[i]==t[p])
                back[i]=p--;
        }
        p=0;
        for(int i=0,j=1;i<s.size(),j<s.size(),p<t.size();p++)
        {
            while(head[i]<p && i<s.size())
                i++;
            while(back[j+1]<=p+1 && j<s.size())
                j++;//找到最优的i和j
            if(p==t.size()-1)
                j=s.size();//贪心地让另一部分为空串
            if(i<s.size() && j<=s.size())//合法才更新答案
                ans=max(ans,j-i-1);
        }
        printf("%d",ans);
        return 0;
    }

    因为指针$i,j$一定是递增的,因此时间复杂度$O(n)$。

    ------------
    既然是初赛原题,那么再来看看CCF的代码:(实测比我的代码快15ms...不过我的代码有的地方常数的确比较大)

    #include<iostream>
    #include<string>
    using namespace std;
    const int maxl=1e6;//改了一下数组大小,可以过困难版
    string s,t;
    int pre[maxl],suf[maxl];//分别相当于head和back数组
    
    int main(){
        cin>>s>>t;
        int slen=s.length(),tlen=t.length();
        for(int i=0,j=0;i<slen;++i){
            if(j<tlen && s[i]==t[j]) ++j;
            pre[i]=j;
        }
        for(int i=slen-1,j=tlen-1;i>=0;--i){
            if(j>=0 && s[i]==t[j]) --j;
            suf[i]=j;
        }
        suf[slen]=tlen-1;//递推基本相同,表示略有区别
        int ans=0;
        for(int i=0,j=0,tmp=0;i<=slen;++i){
            while(j<=slen && tmp>=suf[j]+1) ++j;
            ans=max(ans,j-i-1);
            tmp=pre[i];
        }
        cout<<ans<<endl;
        return 0;
    }

    可以发现思路实际上大体相同,但是计算答案时略有差别。

    分析一下这个计算答案的过程,枚举$s$的断点。可以发现,对于当前的循环,$tmp=pre[i-1]$,即$t[0...tmp-1]$是$s[0...i-1]$的字串,那么接下来为了使答案最大,应该找到满足$t[tmp...tlen-1]$是$s[j...slen-1]$的$j$。而这份代码中的while循环找到的$j$应该会比我们要找的$j$大1,因此要删除的部分就是$s[i...j-2]$,长度$j-i-1$。

    然后分析一下题目:(理解了题意之后感觉想错都难qwq)

    1.

    Q:程序输出时,suf数组满足:对于任意$0leq ileq slen$,$suf[i]leq suf[i+1]$。

    A:T,显然$suf$数组是递增的。

    2.

    Q:当$t$是$s$的子序列时,输出一定不为0。

    A:F,反例样例3。

    3.

    Q:程序运行到第23行时,“j-i-1”一定不小于0。

    A:F,在本题中的确不会出现这种情况,但初赛题目中可没保证$t$是$s$的子串,$t$不是$s$的字串时就会出现这种情况。

    4.

    Q:当$t$是$s$的子序列时,$pre$数组和$suf$数组满足:对于任意$0leq i<slen$,$pre[i]>suf[i+1]+1$。

    A:F,反例样例1。

    5.

    Q:若$tlen=10$,输出为0,则$slen$最小为( )。

    A:输出为0说明$t$不是$s$的子序列或者$s=t$,显然前者可以使答案更小,即$t$越短越好。由于cin不能输入空串,因此最短只能是1。

    6.

    Q:若$tlen=10$,输出为2,则$slen$最小为( )。

    A:$s$最多删去两个字符使$t$仍是$s$的字串,显然$t$串最短长度为12。

    最后祝大家CSP-J/S 2019rp++。

  • 相关阅读:
    webpack打包时候去掉console.log配置
    nodejs 同时create多条数据到接口中
    element ui 对话框eldialog关闭事件
    elementui 禁用radio
    git 更改远程地址
    js 快速排序
    vue $set $nextTick()
    js includes()
    人工智能导论 第四章答案 (部分)
    大促来临,你的数据库系统准备好了吗?
  • 原文地址:https://www.cnblogs.com/TEoS/p/11773920.html
Copyright © 2020-2023  润新知