描述:
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
- '.' 匹配任意单个字符
- '*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
示例 1:
输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例3:
输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
提示:
- 1 <= s.length <= 20
- 1 <= p.length <= 30
- s 只包含从 a-z 的小写字母。
- p 只包含从 a-z 的小写字母,以及字符 . 和 *。
- 保证每次出现字符 * 时,前面都匹配到有效的字符
Soulution:
public class L10IsMatch {
public static void main(String[] args) {
// false
System.out.println(isMatch("aa","a"));
// true
System.out.println(isMatch("aa", "a*"));
// true
System.out.println(isMatch("aa",".*"));
// true
System.out.println(isMatch("aab","c*a*b"));
// false
System.out.println(isMatch("mississippi","mis*is*p*."));
// true
System.out.println(isMatch("aaa", "a*a"));
// true
System.out.println(isMatch("aaa", "ab*a*c*a"));
// false
System.out.println(isMatch("bbab", "b*a*"));
}
/**
* 匹配
*/
private static boolean matched = false;
/**
* 正则表达式
*/
private static char[] pattern;
/**
* 正则表达式长度
*/
private static int plen;
/**
* 正则表达式(回溯思想)
*
* @param s 待匹配字符串
* @param p 正则表达式串
* @return boolean
*/
public static boolean isMatch(String s, String p) {
matched = false;
pattern = p.toCharArray();
plen = p.length();
rmatch(0, 0, s.toCharArray(), s.length());
return matched;
}
private static void rmatch(int ti, int pj, char[] text, int tlen) {
if (matched) {
return;
}
// 正则表达式到尾了
if (pj == plen) {
// 文本串也到尾部了
if (ti == tlen) {
matched = true;
}
return;
}
if (pj + 1 < plen && pattern[pj + 1] == '*') {
// 匹配任意多个字符pre
char pre = pattern[pj];
// 匹配零个,无需关注字符pre到底是什么,pj+2,是因为*与其前一个字符构成特殊通配符,需一起跳过
rmatch(ti, pj + 2, text, tlen);
// 匹配多个,继续匹配前,需对比pre与当前元素是否相同
for (int k = 1; k <= tlen - ti; ++k) {
// ti是我们当前要对比的元素,假设从ti开始有2个字符与pre相同,text[ti],text[ti+1]
// 所以在循环中,我们要对比的就是这两个元素,又因为k从1开始,所以需要减1
if (pre == text[ti + k -1] || pre == '.') {
rmatch(ti + k, pj + 2, text, tlen);
} else {
break;
}
}
} else if (pattern[pj] == '.') {
// 匹配任意一个字符
rmatch(ti + 1, pj + 1, text, tlen);
} else if (ti < tlen && pattern[pj] == text[ti]) {
// 纯字符匹配
rmatch(ti + 1, pj + 1, text, tlen);
}
}
}
Idea:
首先,读题"保证每次出现字符时,前面都匹配到有效的字符",这就意味着,字符和前一个字符构成一个特殊通配符。
所以,一共有三种字符,普通字符,单个字符通配符,特殊通配符。我们一次考察正则表达式中的每个字符,当是非通配符时,我们就直接跟文本的字符进行匹配。
如果相同,则继续往下处理;如果不同,则回溯。
如果遇到特殊字符的时候,我们就有多种处理方式了,也就是所谓的岔路口,
比如"x*"有多种匹配方案,可以匹配任意多个字符x,我们就先随意的选择一种匹配方案
然后继续考察剩下的字符,如果中途发现无法继续匹配下去,我们就回到这个岔路口,
重新选择一种匹配方案,然后再继续匹配下去。
Reslut:
Impore:
可以使用动态规划进行优化!待补充!