• Manacher(马拉车)————O(n)回文子串


    Manacher

    一、背景

    1975年,Manacher发明了Manacher算法(中文名:马拉车算法),是一个可以在O(n)的复杂度中返回字符串s中最长回文子串长度的算法,十分巧妙。

    让我们举个栗子,栗子:

    1.字符串:abbababa        最长回文子串:5(abbababa

    2.字符串:abcbbabbc      最长回文子串:7(abcbbabbc

    3.字符串:abccbaba        最长回文子串:6(abccbaba)

    传统方法是,遍历每个字符,以该字符为中心向两边查找。时间复杂度为O(n^2),效率很差;

    而这个神奇的Manacher算法将复杂度提升到了O(n)。

    来一起瞅一瞅它是如何工作的吧。

    二、算法过程分析

    回文分为奇回文(ababa)和偶回文(abba),这里比较难以处理,我们使用一个(sao)(cao)(zuo)很重要)。我们将字符串首尾和每个字符间插入一个字符(注意:这个自符在串中并未出现)例如:'#'.

    栗子!栗子!s='abbadcacda'先转化成s_new='$#a#b#b#a#d#c#a#c#d#a#'('$'与'',是边界,下面的代码中可以看到)

    这样原串中的偶回文(abba)与奇回文(adcacda),变成了(#a#d#d#a#)与(#a#d#c#a#c#d#a#)两个奇回文

    定义数组p[],用p[i]表示以i为中心的最长回文半径。栗子在这里:

     

    那,p[i]该如何求呢?很显然,p[i]-1正好就是原字符中的最长回文串长度了。

    让我们一起找到正解。

    请看下图:

    定义两个变量mx和id。mx就是以id为中心的最长回文右边界,也就是mx=id+p[id],随后我们需要mx做出它的最大贡献。

    假设我们在求p[i](以i为中心的最长回文半径),如果i<mx(如上图),那么我们就用mx和j来更新到我们已知的可以更新的最大长度,代码如下:

    if(i<mx)  
        p[i]=min(p[2*id-i],mx-i);

    2*id-i是i关于id的对称点(上图j)(证明:i-id=id-j),而p[j]表示以j为中心的最长回文半径,这样我们就可以利用p[j]和mx加快速度了。

    为什么要用p[j]和mx-i取min来更新,什么鬼?

    淡定,淡定。我们想一下,p[j](以j为中心的最长回文半径)是已经知道了(因为是从前面扫过来的),若是p[j]>mx-i,我们是可以知道以j为中心,以mx的对称点到j的距离为半径形成的回文字符串是肯定存在的,并且id的左边直到mx的对称点与id的右边 直到mx是一一对应的,不难理解mx是i目前可以更新到的最大回文半径;若p[j]<mx-i,证明j的回文半径不到mx的对称点到j的距离,再次通过(id的左边直到mx的对称点与id的右边 直到mx是一一对应的),不难想到p[i]=p[j]。

     取完min就是最大的回文半径吗?

    显然不是,接下来的暴力往后扫就好了(学oi的都有暴力倾向)。

    三、代码

    #include<iostream>
    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    
    using namespace std;
    
    char s[11000002];
    char s_new[21000002];//存添加字符后的字符串 
    int p[21000002];
    
    int Init() {//形成新的字符串 
        int len=strlen(s);//len是输入字符串的长度
        s_new[0]='$';//处理边界,防止越界 
        s_new[1]='#';
        int j=2; 
        for(int i=0;i<len;i++) {
            s_new[j++]=s[i];
            s_new[j++]='#';
        } 
        s_new[j]='';//处理边界,防止越界(容易忘记) 
        return j;// 返回s_new的长度 
    }
    
    int Manacher() {//返回最长回文串 
        int len=Init();//取得新字符串的长度, 完成向s_new的转换
        int max_len=-1;//最长回文长度
        int id;
        int mx=0;
        for(int i=1;i<=len;i++) {
            if(i<mx)
                p[i]=min(p[2*id-i],mx-i);//上面图片就是这里的讲解 
            else p[i]=1;
            while(s_new[i-p[i]]==s_new[i+p[i]])//不需边界判断,因为左有'$',右有''标记;
                p[i]++;//mx对此回文中点的贡献已经结束,现在是正常寻找扩大半径
            if(mx<i+p[i]) {//每走移动一个回文中点,都要和mx比较,使mx是最大,提高p[i]=min(p[2*id-i],mx-i)效率 
                id=i;//更新id 
                mx=i+p[i];//更新mx 
            }
            max_len=max(max_len,p[i]-1); 
        } 
        return max_len; 
    }
     
    int main()
    {
        scanf("%s",&s);
        printf("%d",Manacher());
        return 0;
    }

     四、复杂度

    完结撒花(复杂度不会证明呀,因为我是蒟蒻)

  • 相关阅读:
    讲一下创业公司的技术架构演进
    Nginx二级域名配置
    Java分页下载
    Solr6+IKAnalyzer分词环境搭建
    消息发送平台简单架构设计
    优先级线程池实现
    Spring缓存框架原理浅谈
    Archaius 原理
    SpringCloud+Consul 服务注册与服务发现
    EndPoint详解
  • 原文地址:https://www.cnblogs.com/fan1-happy/p/11166182.html
Copyright © 2020-2023  润新知