正则表达式(Regular Expression)
是一段字符串,可以表示一段有规律的信息
在程序开发中,要让计算机程序从一大段文本中找到需要的内容,就可以使用正则表达式来实现
使用正则表达式有如下步骤:
(1)寻找规律
(2)使用正则符号表示规律
(3)提取信息
正则表达式的基本符号
1. 点号“ . ”
一个点号可以代替除了换行符以外的任何一个字符
2. 星号“ * ”
一个星号可以表示它前面的一个子表达式(普通字符, 另一个或几个正则表达式符号) 0 到无限次
3. 问号 “ ? ”
问号表示它前面的子表达式0次或者1次
4. 反斜杠 “ ”
反斜杠在正则表达式里面不能单独使用,甚至在整个python里面都不能单独使用。反斜杠需要和其他字符配合使用
来把特殊符号变成普通符号,把普通符号变成特殊符号