• 10 正则表达式匹配(LeetCode HOT 100)


    描述:
    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

    • '.' 匹配任意单个字符
    • '*' 匹配零个或多个前面的那一个元素

    所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

    示例 1:

    输入:s = "aa", p = "a"
    输出:false
    解释:"a" 无法匹配 "aa" 整个字符串。
    

    示例 2:

    输入:s = "aa", p = "a*"
    输出:true
    解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
    

    示例3:

    输入:s = "ab", p = ".*"
    输出:true
    解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
    

    提示:

    • 1 <= s.length <= 20
    • 1 <= p.length <= 30
    • s 只包含从 a-z 的小写字母。
    • p 只包含从 a-z 的小写字母,以及字符 . 和 *。
    • 保证每次出现字符 * 时,前面都匹配到有效的字符

    Soulution:

    public class L10IsMatch {
        public static void main(String[] args) {
            // false
            System.out.println(isMatch("aa","a"));
            // true
            System.out.println(isMatch("aa", "a*"));
            // true
            System.out.println(isMatch("aa",".*"));
            // true
            System.out.println(isMatch("aab","c*a*b"));
            // false
            System.out.println(isMatch("mississippi","mis*is*p*."));
            // true
            System.out.println(isMatch("aaa", "a*a"));
            // true
            System.out.println(isMatch("aaa", "ab*a*c*a"));
            // false
            System.out.println(isMatch("bbab", "b*a*"));
        }
    
        /**
         * 匹配
         */
        private static boolean matched = false;
        /**
         * 正则表达式
         */
        private static char[] pattern;
        /**
         * 正则表达式长度
         */
        private static int plen;
    
        /**
         * 正则表达式(回溯思想)
         *
         * @param s 待匹配字符串
         * @param p 正则表达式串
         * @return boolean
         */
        public static boolean isMatch(String s, String p) {
            matched = false;
            pattern = p.toCharArray();
            plen = p.length();
            rmatch(0, 0, s.toCharArray(), s.length());
            return matched;
        }
    
        private static void rmatch(int ti, int pj, char[] text, int tlen) {
            if (matched) {
                return;
            }
            // 正则表达式到尾了
            if (pj == plen) {
                // 文本串也到尾部了
                if (ti == tlen) {
                    matched = true;
                }
                return;
            }
            if (pj + 1 < plen && pattern[pj + 1] == '*') {
                // 匹配任意多个字符pre
                char pre = pattern[pj];
                // 匹配零个,无需关注字符pre到底是什么,pj+2,是因为*与其前一个字符构成特殊通配符,需一起跳过
                rmatch(ti, pj + 2, text, tlen);
                // 匹配多个,继续匹配前,需对比pre与当前元素是否相同
                for (int k = 1; k <= tlen - ti; ++k) {
                    // ti是我们当前要对比的元素,假设从ti开始有2个字符与pre相同,text[ti],text[ti+1]
                    // 所以在循环中,我们要对比的就是这两个元素,又因为k从1开始,所以需要减1
                    if (pre == text[ti + k -1] || pre == '.') {
                        rmatch(ti + k, pj + 2, text, tlen);
                    } else {
                        break;
                    }
                }
            } else if (pattern[pj] == '.') {
                // 匹配任意一个字符
                rmatch(ti + 1, pj + 1, text, tlen);
            } else if (ti < tlen && pattern[pj] == text[ti]) {
                // 纯字符匹配
                rmatch(ti + 1, pj + 1, text, tlen);
            }
        }
    }
    

    Idea:

    首先,读题"保证每次出现字符时,前面都匹配到有效的字符",这就意味着,字符和前一个字符构成一个特殊通配符。
    所以,一共有三种字符,普通字符,单个字符通配符,特殊通配符。

    我们一次考察正则表达式中的每个字符,当是非通配符时,我们就直接跟文本的字符进行匹配。
    如果相同,则继续往下处理;如果不同,则回溯。
    如果遇到特殊字符的时候,我们就有多种处理方式了,也就是所谓的岔路口,
    比如"x*"有多种匹配方案,可以匹配任意多个字符x,我们就先随意的选择一种匹配方案
    然后继续考察剩下的字符,如果中途发现无法继续匹配下去,我们就回到这个岔路口,
    重新选择一种匹配方案,然后再继续匹配下去。

    Reslut:

    Impore:
    可以使用动态规划进行优化!待补充!

  • 相关阅读:
    团队冲刺第一天
    第八周进度报告
    团队会议01
    《梦断代码》阅读笔记(三)
    《梦断代码》阅读笔记(二)
    《梦断代码》阅读笔记(一)
    SCRUM第六天
    SCRUM第五天
    大白话strom——问题收集(持续更新ing)
    maven环境快速搭建(转)
  • 原文地址:https://www.cnblogs.com/supermingjun/p/16084425.html
Copyright © 2020-2023  润新知