• LeetCode——10. Regular Expression Matching


    一.题目链接:https://leetcode.com/problems/regular-expression-matching/

    二.题目大意:

      实现一个正则表达式,该正则表达式只有两种特殊的字符——“.”和“*”,其中.能表示任意字符,即它可以匹配任意的字符;*表示可以重复前面的字符0次或者多次(例如:a*可以表示成“”(空,相当于重复0次)或者表示成“aaa”重复3次)。

    三.题解:

      这道题目比较常用的方法是递归;该题目的难点之处在于遇到*的时候它可能匹配0次,也可能匹配1次或多次;这种特性很显然满足递归的特性。所以要根据字符是否为*来进行分情况讨论,详细如下:

    对于一个模式字符串,从前往后的来分析它:

    1.如果当前字符的下一个字符不是“*”的话(由于第一个字符不可能是* 所以根据下一个字符是否为*来分情况才更加的合理),此时只需要判断需匹配字符串s的当前字符和模式字符串p的当前字符是否相等即可。如果*s == *p或者*p == '.' && *s != ''的话,那么当前字符匹配成功,就可以继续往下匹配了。

    2.如果当前字符的下一个字符是“*”的话,此时就需要匹配当前字符0次、1次或多次了(而此处的重复次数可以用递归法来实现,也可以用迭代法来实现),直到不能匹配更多的字符。

    3.既然是递归,那么一定·要有终止条件的,该问题的终止条件显然是:当p到达终点时(即*p == ''时)如果s也到达终点了,那么返回true;如果s没到达终点,那么返回false。通过这个条件我们也可以看出,字符串p的最终长度一定是与字符串s的长度一样,才能够匹配成功。(这也就是题目时所说的完全匹配,而不是部分匹配。通过这一点,我们可也快速的去除那些不符合匹配的例子,如:ab和.*c,两者显然不匹配;而ab和.* 两者显然匹配)

    具体代码如下:

    方法1(递归+部分迭代):

    class Solution {
    public:
        bool isMatch(string s, string p) {
            return matchCore(s.c_str(),p.c_str());
        }
        bool matchCore(const char *s,const char *p)
        {
            if(*p == '' && *s == '')
                return true;
            if(*p == '' && *s != '')
                return false;
            //如果下一个字符不是*的话
            if(*(p+1) != '*')
            {
                if(*p == *s||(*p == '.' && *s != ''))
                    return matchCore(s + 1,p + 1);
                else//一旦有一个字符不一样,则不匹配
                    return false;
            }
            else//下一个字符是*
            {
                //*重复一次或多次,只有当当前字符匹配成功时,才考虑*重复多少次,否则不用考虑*了,直接跳过
                while(*p == *s ||(*p == '.' && *s != ''))
                {
                    if(matchCore(s,p + 2))
                        return true;
                    s++;
                }
                //*不再重复,即直接跳过*
                return matchCore(s,p + 2);
            }
    
        }
    };
    

    注:

    1.该方法中while循环的部分相当于对*进行匹配1次或多次,而matchCore(s,p+2)相当于忽略* ,即匹配0次。下面来详细阐述一下此处过程:

    (1)首先,先判断p和s的当前字符是否相同,如果不相同的话,* 这个字符就可以忽略了,相当于匹配0次,即执行matchCore(s,p+2);

    (2)如果p和s的当前字符相同的话,此时要考虑对*进行处理了,即匹配0次、1次还是多次?首先先尝试匹配0次,如果匹配0次的话,p和s的剩下部分都相匹配的话,那么直接就可以返回true了,if(machCore(s,p+2) retrun true;这两行代码就是这个意思。如果匹配0次的话不可行怎么办?此时就是s++相当于匹配1次(如果if(matchCore(s,p+2)这个条件成立的话,相当于匹配1次就成功了),匹配一次完之后再进行判断p和s的当前字符是否相同,然后重复之前的过程;这样就完成了匹配0次、1次或多次这整个过程。

    2.一定要注意递归函数的终止条件!!

    3.此处有个c++方法需要注意,即string.c_str()的用法,它的功能是将一个string类型的字符串转换成一char *字符串。

    方法2(全部递归):

    class Solution {
    public:
        bool isMatch(string s, string p) {
            return matchCore(s.c_str(),p.c_str());
        }
        bool matchCore(const char *s,const char *p)
        {
            if(*p == '' && *s == '')
                return true;
            if(*p == '' && *s != '')
                return false;
            //如果下一个字符不是*的话
            if(*(p+1) != '*')
            {
                if(*p == *s||(*p == '.' && *s != ''))
                    return matchCore(s + 1,p + 1);
                else//一旦有一个字符不一样,则不匹配
                    return false;
            }
            else//下一个字符是*
            {
    
                if(*p == *s || (*p == '.' && *s != ''))//只有当当前字符匹配成功时,才考虑*重复多少次,否则不用考虑*了,直接跳过
                    return matchCore(s,p + 2) || matchCore(s + 1,p + 2) || matchCore(s + 1,p); //*重复0次、一次或多次
                else
                    return matchCore(s, p + 2);
            }
    
        }
    };
    

    注:

    全部递归的话,比之前的"递归+迭代"法满了不少,方法1用了23ms,但方法2(本方法)用了731ms。所以能不用递归就不用递归,这句话是很有道理的;但递归法写的代码确实看上去更加容易理解,虽然相比迭代有时会爆栈或超时(超时很有可能是添加了多余的操作,有时这种多余的操作并不那么的明显)

    方法3(全部递归-优化):

    class Solution {
    public:
        bool isMatch(string s, string p) {
            return matchCore(s.c_str(),p.c_str());
        }
        bool matchCore(const char *s,const char *p)
        {
            if(*p == '' && *s == '')
                return true;
            if(*p == '' && *s != '')
                return false;
            //如果下一个字符不是*的话
            if(*(p+1) != '*')
            {
                if(*p == *s||(*p == '.' && *s != ''))
                    return matchCore(s + 1,p + 1);
                else//一旦有一个字符不一样,则不匹配
                    return false;
            }
            else//下一个字符是*
            {
    
                if(*p == *s || (*p == '.' && *s != ''))//只有当当前字符匹配成功时,才考虑*重复多少次,否则不用考虑*了,直接跳过
                    return matchCore(s,p + 2) || matchCore(s + 1,p); //*重复匹配s中字符0次、一次或多次
                else
                    return matchCore(s, p + 2);//如果当前字符不相同的话,把该字符和*一块去掉(相当于重复0次),去匹配pattern+2后的部分
            }
    
        }
    };
    

    方法3相比方法2,主要是优化了一处,即

     return matchCore(s,p + 2) || matchCore(s + 1,p + 2) || matchCore(s + 1,p);
    

    变成了

    return matchCore(s,p + 2) || matchCore(s + 1,p);
    

    因为仔细想想,重复多次是由多个重复1次组成的啊,所以最终不用再强调重复一次了,直接用matchCore(s+1,p)既可以表示重复1次也可以表示成重复多次。

    那么去除这一步后,耗时多少呢?是26ms!!可见递归并不比迭代慢,主要是是否不增加多余的操作。话说,做到这一步心里很是挺爽的~~

    此外,还有需要注意的一点:对于任何字符串处理的题目,首先都需要判断该字符串是否为nullptr(空指针)或者为""的情况,这种特例一定是要考虑的!!(对于char *类型的字符串,这两种情况都需要考虑;对于string类型的字符串,一般只考虑""的情况)

  • 相关阅读:
    学习进度
    毕设进度
    学习进度
    毕设进度
    学习进度
    学习进度
    第一周冲刺评论总结&&针对评论总结的改进
    第一阶段成果展示
    团队冲刺--Seven
    团队冲刺--six
  • 原文地址:https://www.cnblogs.com/wangkundentisy/p/8329966.html
Copyright © 2020-2023  润新知