(1)为什么正则表达式、目录前面都需要加r?
防止转义。
从网页爬取所有的图片文件正则表达式:
reg = r'src="(.+?.jpg)" width'
reg = r'https://[^s]*?.jpg'
(2)为什么logging日志使用的时候设置了NOTSET,debug和info还是不生效?
第一种情况:控制台只打印了后面三个;
第二种情况:还是只打印了三个;
问题:logging.getLogger('')
(root logger)的默认日志级别是 WARNING
不是 NOSET。
解决方案:将 logging.getLogger('') 的日志级别也改为 NOTSET
具体代码如下:
logger = logging.getLogger('')
logger.setLevel(logging.NOTSET)