• Manacher(马拉车)算法(jekyll迁移)


    layout: post
    title: Manacher(马拉车)算法
    date: 2019-09-07
    author: xiepl1997
    cover: 'assets/img/manacher.png'
    tags: 敲敲敲

    Manacher’s Alogrithm,中文名叫马拉车算法,是一位叫Manacher的人在1975年提出的一种算法,解决的问题是求最长回文子串,算法的神奇之处就在于将时间复杂度精进到了O(N)。还记得在两年前的四省赛中,有一道关于回文的题,题解就是用马拉车算法做解的,然而我们没有做出来。

    01 由来

    在求解最长回文子串时,一般的思路是以当前字符为中心向两边扩展寻找回文,但复杂度是O(N^2),那能不能将复杂度降低到线性?马拉车算法就是为此诞生的。

    02 预处理

    为了在处理字符串的时候不需要为字符串长度是奇数还是偶数而分别考虑,将对原始字符串进行处理,在每一个字符的左右两边都加上特殊字符(肯定不存在原始字符串中的字符),让字符串变成一个长度为奇数的字符串。如: abba --> #a#b#b#a#

    03 计算最长回文子串长度

    以字符串"arddrb"为例,将预处理后的新字符串"#a#r#d#d#r#b#",作为一个新的字符串arr,定义一个辅助数组Len,Len的长度与arr等长,用Len[i]来表示以arr[i]字符为中心的最长回文半径。
    在等待Len数组计算出来之后,取Len数组中值最大的数所对应的下标,就是arr字符串中的所对应的字符为中心的回文串的半径,Len数组有一个特点:Len[i]-1的值,就是原字符串中该以该字符为中心的回文串的长度。以下为i、arr、Len对应的值

    i     0 1 2 3 4 5 6 7 8 9 10 11 12
    arr   # a # r # d # d # r #  b  #
    Len   1 2 1 2 1 2 5 2 1 2 1  2  1
    

    04 计算回文子串起始索引

    取出Len数组中最大的值的索引i后,应该如何由得到原字符串该字符的索引呢?继续以str="arddrb"为例,有arr="#a#r#d#d#r#b#",Len[6]=5,发现6-Len(6)=1,即i-Len[i]就是arr[i]字符在原始字符串中的下标。但以str="aba"为例,arr="#a#b#a#",Len[3]=4,3-Len[3]=-1,所以str[-1]将会溢出。为了避免奇回文溢出,所以在arr的首尾再分别添加一个特殊字符,如下

    i     0 1 2 3 4 5 6 7 8 9 10
    arr   @ # c # a # b # a # $
    Len   1 1 2 1 2 1 4 1 2 1 1
    

    可以看出,对于b字符来说,6-Len(6)=2,可以得到最长回文子串的起始索引为(i-Len(i))/2。

    05 计算Len数组

    第三步和第四部都是以Len数组计算完成为前提来进行的,计算Len数组就是马拉车算法的主要工作了,还是以"arddrb"为例,

    i     0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
    arr   @ # a # r # d # d # r  #  b  #  $
    Len   1 1 2 1 2 1 2 5 2 1 2  1  2  1  1
    

    定义两个变量Mi和R,Mi是所有回文子串中,能延伸到最右端位置的那个回文子串的中心点位置,R是该回文串能延伸到最右端的位置。

    当i=7时,Len[i]=5,在以位置7位中心点的回文子串中,该回文串的右边界是位置12。

    当i=12时,Len[i]=2,在以位置12位中心点的回文子串中,该回文串的右边界是位置14。

    所以可以得到,R=Len[i]+i

    具体编程时,从左往右计算数组Len,需要分以下情况

    1) 当i <= R时,首先毫无疑问Len数组中i点之前的对应的值已经求出来了,利用回文的特点,只要找到i关于Mi点对称的点j,j=Mi* 2-i,i、j在以Mi为中心的回文串的范围内[L, R]:

    • 如果Len[j] < R-i(同样是L到j的距离),说明以j为中心的回文串没有超出范围[L, R],所以,Len[i] = Len(j),如下图
      image
    • 如果Len[j] >= R-i,即j为中心的回文串的最左端超过L,如下图所示,所以Len[i] = Len[j]是不成立的,有回文串的特性可知,Len[i] 至少等于R-i,至于是否大于R-i,那还得需要从R+1开始一一匹配,直到失配为止,从而更新R和对应的中心点Mi以及Len[i]。
      image

    2) 当i > R时,如下图,这种情况没法用到回文串的特性,只能老实地去一一匹配。
    image

    代码如下(以leetcode第5题为例)

    public String longestPalindrome(String s) {
    	int mi = 0;
    	int right = 0;
    	int maxlength = 0;
    	int maxpoint = 0;
    	String temp = "@#";
    	for(int i = 0; i < s.length(); i++){
    		temp += s.charAt(i);
    		temp += "#";
    	}
    	temp += "*";
    	int[] p = new int[temp.length()];
    	for(int i = 0; i < temp.length(); i++){
    		p[i] = 0;
    	}
    	for(int i = 1; i < temp.length()-1; i++){
    		p[i] = right > i? Math.min(p[2*mi-i], right - i) : 1;
    		while(temp.charAt(i+p[i]) == temp.charAt(i-p[i])){
    			p[i]++;
    		}
    		if(i + p[i] > right){
    			right = i + p[i];
    			mi = i;
    		}
    		if(maxlength < p[i]){
    			maxlength = p[i];
    			maxpoint = i;
    		}
    	}
    	//(maxpoint - maxlength)/2为最长回文数的起始点,maxlength为最长回文数的长度
    	return s.substring((maxpoint - maxlength)/2, (maxpoint - maxlength)/2 + maxlength - 1);
    }
    

    理解p[i] = right > i? Math.min(p[2* mi-i], right - i) : 1;就将manacher理解的差不多了。

  • 相关阅读:
    我的第一个Python爬虫——谈心得
    python写第一个网页
    科学计算和可视化
    类和正则表达(自动更正,和代数运算)
    图片处理
    jieba
    汉诺塔问题
    Python核心编程(第二版)第十章习题答案
    python官方文档之open()函数的翻译
    python打开文件时提示“File was loaded in the wrong encoding:’UTF-8”根因调查
  • 原文地址:https://www.cnblogs.com/xiepl1997/p/13479740.html
Copyright © 2020-2023  润新知