10 正则表达式匹配(LeetCode HOT 100)

描述：
给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素

所谓匹配，是要涵盖整个字符串 s的，而不是部分字符串。

示例 1：

输入：s = "aa", p = "a"
输出：false
解释："a" 无法匹配 "aa" 整个字符串。

示例 2：

输入：s = "aa", p = "a*"
输出：true
解释：因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此，字符串 "aa" 可被视为 'a' 重复了一次。

示例3：

输入：s = "ab", p = ".*"
输出：true
解释：".*" 表示可匹配零个或多个（'*'）任意字符（'.'）。

提示：

1 <= s.length <= 20
1 <= p.length <= 30
s 只包含从 a-z 的小写字母。
p 只包含从 a-z 的小写字母，以及字符 . 和 *。
保证每次出现字符 * 时，前面都匹配到有效的字符

Soulution：

public class L10IsMatch {
    public static void main(String[] args) {
        // false
        System.out.println(isMatch("aa","a"));
        // true
        System.out.println(isMatch("aa", "a*"));
        // true
        System.out.println(isMatch("aa",".*"));
        // true
        System.out.println(isMatch("aab","c*a*b"));
        // false
        System.out.println(isMatch("mississippi","mis*is*p*."));
        // true
        System.out.println(isMatch("aaa", "a*a"));
        // true
        System.out.println(isMatch("aaa", "ab*a*c*a"));
        // false
        System.out.println(isMatch("bbab", "b*a*"));
    }

    /**
     * 匹配
     */
    private static boolean matched = false;
    /**
     * 正则表达式
     */
    private static char[] pattern;
    /**
     * 正则表达式长度
     */
    private static int plen;

    /**
     * 正则表达式（回溯思想）
     *
     * @param s 待匹配字符串
     * @param p 正则表达式串
     * @return boolean
     */
    public static boolean isMatch(String s, String p) {
        matched = false;
        pattern = p.toCharArray();
        plen = p.length();
        rmatch(0, 0, s.toCharArray(), s.length());
        return matched;
    }

    private static void rmatch(int ti, int pj, char[] text, int tlen) {
        if (matched) {
            return;
        }
        // 正则表达式到尾了
        if (pj == plen) {
            // 文本串也到尾部了
            if (ti == tlen) {
                matched = true;
            }
            return;
        }
        if (pj + 1 < plen && pattern[pj + 1] == '*') {
            // 匹配任意多个字符pre
            char pre = pattern[pj];
            // 匹配零个，无需关注字符pre到底是什么，pj+2，是因为*与其前一个字符构成特殊通配符，需一起跳过
            rmatch(ti, pj + 2, text, tlen);
            // 匹配多个，继续匹配前，需对比pre与当前元素是否相同
            for (int k = 1; k <= tlen - ti; ++k) {
                // ti是我们当前要对比的元素，假设从ti开始有2个字符与pre相同，text[ti],text[ti+1]
                // 所以在循环中，我们要对比的就是这两个元素，又因为k从1开始，所以需要减1
                if (pre == text[ti + k -1] || pre == '.') {
                    rmatch(ti + k, pj + 2, text, tlen);
                } else {
                    break;
                }
            }
        } else if (pattern[pj] == '.') {
            // 匹配任意一个字符
            rmatch(ti + 1, pj + 1, text, tlen);
        } else if (ti < tlen && pattern[pj] == text[ti]) {
            // 纯字符匹配
            rmatch(ti + 1, pj + 1, text, tlen);
        }
    }
}

Idea：

首先，读题"保证每次出现字符时，前面都匹配到有效的字符"，这就意味着，字符和前一个字符构成一个特殊通配符。
所以，一共有三种字符，普通字符，单个字符通配符，特殊通配符。

我们一次考察正则表达式中的每个字符，当是非通配符时，我们就直接跟文本的字符进行匹配。
如果相同，则继续往下处理；如果不同，则回溯。
如果遇到特殊字符的时候，我们就有多种处理方式了，也就是所谓的岔路口，
比如"x*"有多种匹配方案，可以匹配任意多个字符x，我们就先随意的选择一种匹配方案
然后继续考察剩下的字符，如果中途发现无法继续匹配下去，我们就回到这个岔路口，
重新选择一种匹配方案，然后再继续匹配下去。

Reslut：

Impore：
可以使用动态规划进行优化！待补充！

相关阅读:
团队冲刺第一天
 第八周进度报告
 团队会议01
《梦断代码》阅读笔记(三)
《梦断代码》阅读笔记(二)
《梦断代码》阅读笔记(一)
SCRUM第六天
 SCRUM第五天
 大白话strom——问题收集（持续更新ing）
maven环境快速搭建（转）
原文地址：https://www.cnblogs.com/supermingjun/p/16084425.html