本文分析KMP算法中的理解难点,包括前缀函数的含义以及伪码的含义,请参阅《算法导论》32.4节阅读本文
前缀函数(π[q]=k)的含义:
①P[q]是某一时刻模式串与待匹配串已匹配的部分;
②P[k]是P的真前缀;
③P[k]是P的后缀;
④P[k]是满足①②的最长的子串;
P的真前缀即长度小于P本身的前缀。上面的②和③也可等价表示为“P[k]是P的真后缀,同时P[k]是P的前缀”。
前缀函数计算:(以P="abaaba"为例,P为模式串,π为前缀函数)
KMP匹配:(T为待匹配串)
关于算法的细致分析,有一篇很好地文章:阮一峰,
http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html