题目:
请实现一个函数用来匹配包括‘.’和‘*’的正則表達式。
模式中的字符’.’表示随意一个字符,而‘*’表示它前面的字符能够出现随意次(含0次)。
本题中。匹配是指字符串的全部字符匹配整个模式。
比如,字符串“aaa”与模式“a.a”和“ab*ac*a”匹配,但与“aa.a”及“ab*a”均不匹配。
解析:
字符串 str = “aaa”; 模式字符串 pattern = “.b*ac*a”
每次分别在str 和pattern中取一个字符进行匹配,假设匹配,则匹配下一个字符,否则,返回不匹配。
设匹配递归函数 match(str, pattern)。
假设模式匹配字符的下一个字符是‘*’:
- 假设pttern当前字符和str的当前字符匹配,:有下面三种可能情况
- pttern当前字符能匹配 str 中的 0 个字符:match(str, pattern+2)
- pttern当前字符能匹配 str 中的 1 个字符:match(str+1, pattern+2)
- pttern当前字符能匹配 str 中的 多 个字符:match(str+1, pattern)
- 假设pttern当前字符和和str的当前字符不匹配
- pttern当前字符能匹配 str 中的 0 个字符:(str, pattern+2)
假设模式匹配字符的下一个字符不是‘*’,进行逐字符匹配。
对于 ‘.’ 的情况比較简单。’.’ 和一个字符匹配 match(str+1, pattern+1)
另外须要注意的是:空字符串”” 和 “.*” 是匹配的
bool MatchCore(const char* str, const char* pattern) {
if (*str == ' ' && *pattern == ' ')
return true;
// if (*str == ' ' && *pattern != ' ') return false : 不成立,如str = "", pattern=".*"
if (*str != ' ' && *pattern == ' ' )
return false;
if (*(pattern+1) == '*') {
if (*pattern == *str || *pattern == '.' && *str != ' ') {
//三种情况:*之前的字符出现 0 次, 出现一次,出现多次. pattern+2表示跳过当前字符和‘*’
return MatchCore(str, pattern+2) || MatchCore(str+1, pattern+2) || MatchCore(str+1, pattern);
} else {
// 没有匹配,出现 0 次(包括str=“”,pattern=“.*”)
return MatchCore(str, pattern+2);
}
}
if (*str == *pattern || *pattern == '.' && *str != ' ')
return MatchCore(str+1, pattern+1);
return false;
}
bool Match(const char* str, const char* pattern) {
if (pattern == NULL || str == NULL)
return false;
return MatchCore(str, pattern);
}
測试案例:
From:剑指offer源代码 GitHub
// ==================== Test Code ====================
void Test(char* testName, char* string, char* pattern, bool expected)
{
if(testName != NULL)
printf("%s begins: ", testName);
if(Match(string, pattern) == expected)
printf("Passed.
");
else
printf("FAILED.
");
}
int main(int argc, char* argv[])
{
Test("Test01", "", "", true);
Test("Test02", "", ".*", true);
Test("Test03", "", ".", false);
Test("Test04", "", "c*", true);
Test("Test05", "a", ".*", true);
Test("Test06", "a", "a.", false);
Test("Test07", "a", "", false);
Test("Test08", "a", ".", true);
Test("Test09", "a", "ab*", true);
Test("Test10", "a", "ab*a", false);
Test("Test11", "aa", "aa", true);
Test("Test12", "aa", "a*", true);
Test("Test13", "aa", ".*", true);
Test("Test14", "aa", ".", false);
Test("Test15", "ab", ".*", true);
Test("Test16", "ab", ".*", true);
Test("Test17", "aaa", "aa*", true);
Test("Test18", "aaa", "aa.a", false);
Test("Test19", "aaa", "a.a", true);
Test("Test20", "aaa", ".a", false);
Test("Test21", "aaa", "a*a", true);
Test("Test22", "aaa", "ab*a", false);
Test("Test23", "aaa", "ab*ac*a", true);
Test("Test24", "aaa", "ab*a*c*a", true);
Test("Test25", "aaa", ".*", true);
Test("Test26", "aab", "c*a*b", true);
Test("Test27", "aaca", "ab*a*c*a", true);
Test("Test28", "aaba", "ab*a*c*a", false);
Test("Test29", "bbbba", ".*a*a", true);
Test("Test30", "bcbbabab", ".*a*a", false);
return 0;
}