Manacher
一、背景
1975年,Manacher发明了Manacher算法(中文名:马拉车算法),是一个可以在O(n)的复杂度中返回字符串s中最长回文子串长度的算法,十分巧妙。
让我们举个栗子,栗子:
1.字符串:abbababa 最长回文子串:5(abbababa)
2.字符串:abcbbabbc 最长回文子串:7(abcbbabbc)
3.字符串:abccbaba 最长回文子串:6(abccbaba)
传统方法是,遍历每个字符,以该字符为中心向两边查找。时间复杂度为O(n^2),效率很差;
而这个神奇的Manacher算法将复杂度提升到了O(n)。
来一起瞅一瞅它是如何工作的吧。
二、算法过程分析
回文分为奇回文(ababa)和偶回文(abba),这里比较难以处理,我们使用一个小(sao)技(cao)巧(zuo)(很重要)。我们将字符串首尾和每个字符间插入一个字符(注意:这个自符在串中并未出现)例如:'#'.
栗子!栗子!s='abbadcacda'先转化成s_new='$#a#b#b#a#d#c#a#c#d#a# '('$'与' ',是边界,下面的代码中可以看到)
这样原串中的偶回文(abba)与奇回文(adcacda),变成了(#a#d#d#a#)与(#a#d#c#a#c#d#a#)两个奇回文。
定义数组p[],用p[i]表示以i为中心的最长回文半径。栗子在这里:
那,p[i]该如何求呢?很显然,p[i]-1正好就是原字符中的最长回文串长度了。
让我们一起找到正解。
请看下图:
定义两个变量mx和id。mx就是以id为中心的最长回文右边界,也就是mx=id+p[id],随后我们需要mx做出它的最大贡献。
假设我们在求p[i](以i为中心的最长回文半径),如果i<mx(如上图),那么我们就用mx和j来更新到我们已知的可以更新的最大长度,代码如下:
if(i<mx) p[i]=min(p[2*id-i],mx-i);
2*id-i是i关于id的对称点(上图j)(证明:i-id=id-j),而p[j]表示以j为中心的最长回文半径,这样我们就可以利用p[j]和mx加快速度了。
为什么要用p[j]和mx-i取min来更新,什么鬼?
淡定,淡定。我们想一下,p[j](以j为中心的最长回文半径)是已经知道了(因为是从前面扫过来的),若是p[j]>mx-i,我们是可以知道以j为中心,以mx的对称点到j的距离为半径形成的回文字符串是肯定存在的,并且id的左边直到mx的对称点与id的右边 直到mx是一一对应的,不难理解mx是i目前可以更新到的最大回文半径;若p[j]<mx-i,证明j的回文半径不到mx的对称点到j的距离,再次通过(id的左边直到mx的对称点与id的右边 直到mx是一一对应的),不难想到p[i]=p[j]。
取完min就是最大的回文半径吗?
显然不是,接下来的暴力往后扫就好了(学oi的都有暴力倾向)。
三、代码
#include<iostream> #include<cstdio> #include<cstring> #include<algorithm> using namespace std; char s[11000002]; char s_new[21000002];//存添加字符后的字符串 int p[21000002]; int Init() {//形成新的字符串 int len=strlen(s);//len是输入字符串的长度 s_new[0]='$';//处理边界,防止越界 s_new[1]='#'; int j=2; for(int i=0;i<len;i++) { s_new[j++]=s[i]; s_new[j++]='#'; } s_new[j]='