KMP算法

KMP算法(Knuth-Morris-Pratt Algorithm)是一种非常高效的字符串匹配算法，是由Knuth,Morris和Pratt三位与1977年发布的算法。最坏复杂度为O(n+m)

首先我们用一个例子来演示这个算法：

原串为babababcbababababb

模式串为bababb

模式串的失配数组为0,1,1,2,3,4

当i = 6, j = 6时，出现了第一次不匹配，于是获取到失配指针fail[j],使j = fail[j]继续进行比较，即此时的i = 6, j = fail[j] = 4。如下图所示：

结果发现在i = 8, j = 6的时候，再次失配，于是j再次赋值为失配指针数值。依次匹配，发现最后当i = 8，j = 1的时候仍然无法匹配，则j = 0，如下图：

循环往复，直到得到最后的结果：

可以直观的发现，其实KMP算法的精髓就在于失配指针上面。

那么什么是失配指针呢？如何获得失配指针的值呢？

首先，失配指针就是当匹配失败时，所能跳转到的最近的位置。换种说法，失配指针的值就是模式串的[1..j]子串的前缀与后缀的最大匹配值+1。

所以获取这个的值就可以这么写：

fail[j] = max{k | pattern.substring(1...k - 1) == pattern.substring(j - k + 1, j)};

根据这个公式，于是我们可以获得示例中的模式串的失配数组的取值。

在匹配的过程中，就按照示例中的匹配方式一样，如果匹配相同的就继续向下匹配，如果匹配到失败，就使得j = fail[j]继续匹配。然后就可以得到匹配的结果了。

KMP算法Java代码如下：

public static void getNext( String pattern ) {
	fail = new int[ pattern.length() ];
	fail[0] = -1;
	for( int i = 0, j = -1, len = pattern.length(); i < len - 1; ++i, ++j ) {
		while( j != -1 && pattern.charAt(i) != pattern.charAt(j) ) j = fail[j];
		fail[i + 1] = j + 1;
	}
}
public static int kmp( String pattern, String origin ) {
	getNext( pattern );
	int ans = 0;
	for( int i = 0, j = 0, len = origin.length(), lenP = pattern.length(); i < len; ++i, ++j ) {
		while( j != -1 && pattern.charAt(j) != origin.charAt(i) ) j = fail[j];
		if( j == lenP - 1 ) {
			++ans;
			j = fail[j];
			while( j != -1 && pattern.charAt(j) != origin.charAt(i) ) j = fail[j];
		}
	}
	return ans;
}

附上hihocoder-1015-kmp算法ac代码：

import java.io.BufferedInputStream;
import java.io.IOException;
import java.util.Scanner;

public class Main {
	/**
	 * @param args
	 * @author wiklvrain
	 */
	
	static int[] fail;
	
	public static void getNext( String pattern ) {
		fail = new int[ pattern.length() ];
		fail[0] = -1;
		for( int i = 0, j = -1, len = pattern.length(); i < len - 1; ++i, ++j ) {
			while( j != -1 && pattern.charAt(i) != pattern.charAt(j) ) j = fail[j];
			fail[i + 1] = j + 1;
		}
	}
	public static int kmp( String pattern, String origin ) {
		getNext( pattern );
		int ans = 0;
		for( int i = 0, j = 0, len = origin.length(), lenP = pattern.length(); i < len; ++i, ++j ) {
			while( j != -1 && pattern.charAt(j) != origin.charAt(i) ) j = fail[j];
			if( j == lenP - 1 ) {
				++ans;
				j = fail[j];
				while( j != -1 && pattern.charAt(j) != origin.charAt(i) ) j = fail[j];
			}
		}
		return ans;
	}
	public static void main(String[] args) throws IOException {
		// TODO Auto-generated method stub
		Scanner in = new Scanner( new BufferedInputStream(System.in) );
		
		int n = Integer.parseInt( in.nextLine() );
		while( n-- > 0 ) {
			String pattern = in.nextLine();
			String origin = in.nextLine();
			System.out.println( kmp( pattern, origin ) );
		}
	}
}

相关阅读:
pytorch实现yolov3(1) yolov3基本原理
 python随机选取目录下的若干个文件
 转 Yolov3转化Caffe框架详解
 特征金字塔网络Feature Pyramid Networks
基于区域的目标检测
 聚类kmeans算法在yolov3中的应用
 车位iou计算
 git常用命令
 opencv 图像旋转
 简单的选项卡制作
原文地址：https://www.cnblogs.com/wiklvrain/p/8179337.html