Python日志、序列化、正则模块

使用Python内置模块的目的：拿来别人已经写好的模块功能，直接import内置模块使用，简化程序，避免重复造轮子的过程，提示自己的开发效率；

一、 loging日志模块：

1、 loging模块可以记录不同安全级别日志：

debug、info、warning、error、critical（关键的）可以灵活使用；（5中安全级别日志全部记录，或选择其中几种级别记录）

import logging

logging.debug("修复") #5种安全级别 灵活使用
logging.info("提示")
logging.warning("注意")#--------注意---------高于waring（默认等级）此安全级别的日志才会显示到屏幕上
logging.error("错误")
logging.critical("重要")

执行结果
WARNING:root:注意
ERROR:root:错误
CRITICAL:root:重要

2、日志输出流

既然记录了日志就应该显示到屏幕或者保存至文件，这就是日志输出流；

3、日志格式配置

上述日志信息单纯，记录价值不大，我们可以设置它的日志格式。loging模块提供了2种日志配置方式；

（1）basicConfig函数配置方式（一切围绕basicConfig函数里放什么参数展开）

logging.DEBUG     　　           #设置日志安全级别 

format='%(asctime)s'            #asctime：配置当前时间

'---%(message)s'                #message：配置日 义信息
'%(lineno)s',                   #lineno:打印输出日志函数所在的行号
datefmt='%Y-%m-%d %H:%M:%S',    #设置日期格式  datefmt
filename="loger",               #设置"日志输出流的文件'filename
filemode="a")                   #设置以追加方式记录到文件 filemode

logging.basicConfig(level=logging.DEBUG,               #设置日志安全级别 logging.DEBUG
                    format='%(asctime)s'               #asctime：配置当前时间
                        '---%(message)s'               #message：配置日志的自定义信息
                        '%(lineno)s',                  #lineno:打印输出日志函数所在的行号
                    datefmt='%Y-%m-%d %H:%M:%S',       #设置日期格式  datefmt
                    filename="loger",                  #设置"日志输出流的文件'filename
                    filemode="a")                      #设置以追加方式记录到文件 filemode
logging.debug("修复")
logging.info("提示")
logging.warning("注意")
logging.error("错误")
logging.critical("重要")

（2）loger对象配置日志格式

basicConfig只能同时选择一种日志输出流，而loger对象可以把日志信息，同时输出到屏幕和文件里。

loger对象配置日志格式，一切围绕高度定制化、组装原则，1 创建loger 2创建输出对象 3创建输出格式对象，相互组装起来；

loger=logging.getLogger()                   #得到一个原始的loger对象

file_stream=logging.FileHandler("Loger2")  #创建1个文件输出对象
sh=logging.StreamHandler()                 #创建一个屏幕输出对象

Format=logging.Formatter("%(asctime)s-%(levelname)s-%(message)s") #创建一个日志格式对象
#-------------------------------------------------------------------------------------------------------------
#loger配置日志格式方式：就是围绕一切高度定制化的原则展开

#（1）先创建出 loger对象，屏幕输出对象，文件输出对象，日志格式对象
# （2）让 loger对象 吸取 文件、屏幕输出流对象
#（3） 让 文件、屏幕输出流对象吸取日志格式对象功能

file_stream.setFormatter(Format)   #文件输出流吸取 日志格式对象
sh.setFormatter(Format)            #屏幕输出流吸取 日志格式对象

loger.setLevel(logging.DEBUG)      #设置日志等级
loger.addHandler(file_stream)      #原始的loger对象 吸走文件输出对象，就可以把日志信息输出到文件了；
loger.addHandler(sh)               #原始的loger对象，吸走屏幕输出对象，就可以把日志信息输出到屏幕了；
                            #loger对象貌似有了吸星大法，可以通过addHandler（）方法，吸取对象的功能，以为己用；
loger.debug("修复")
loger.info("提示")
loger.warning("注意")      #默认安全级别也是waring，waring以上安全级别的日志才回输出
loger.error("错误")
loger.critical('重要')

二、序列化模块 json、picle

1、 josn就是各种语言之间信息交换的桥梁，一种各语言普遍支持的中间数据类型；

每种编程语言都有自己的数据类型，不同语言之间交换数据就就需要通过序列化来完成；

序列化：把对象（Python的变量、列表、字典...）从内存中变成可以存储或传输的过程就是序列化；

json.dumps()、json.loads()方法：

import json
d={'name':'zhanggen'}
j=json.dumps(d)             # 序列化：json.dumps()把 Python里面的字典类型转出成 json字符串；
                            # 这样就可以把数据写入文本、网络传输了；
with open('b.txt','w') as f:
    f.write(j)
    f.flush()
#----------------------------------------   反序列化：把json字符串 转换成，Python对应的数据类型。
with open('b.txt','r') as f:
    d1=json.loads(f.read())    #

print(d1['name'])

json.dump()、json.load()方法：

with open("new_b.txt",'w') as f:
    json.dump(d,f)                       # json.dump(d,f)方法比较对应写入文件，该方法可以传2个参数 （数据，写入的文件）
                                         #省略了 f.write()这一步了；
                                         #1、把d转换成json字符串，把json字符串直接写入f文件对象

with open("new_b.txt",'r') as f:
   print(json.load(f)['name'])          #load（文件句柄）方法 可以直接把文件句柄传进去，自动转换成Python相应类型

三、正则表达式模块 re

正则表达式用来描述匹配、查找字符的某一种规则；

Python字符串的方法（replace，）只有一些简单的完全匹配模式，查找处理的内容比较单一；（说1找1 说2找2），固有了Python有了 re模块；

re：实现对字符串的模糊匹配（可以写一个正则规则，批量匹配，找出符合某些规则的字符，匹配多个字符）

1、正则表达式由元字符（有特殊功能的字符）+查找对象组成

2、re基本元字符介绍：人类世界里如果想要表达自己的意图，可以使用语言或者文字+你的对象。在正则里想要表达自己的匹配意图使用元字符+匹配对象；

（1）单个字符匹配：

. : 匹配除了换行符之外的，任意1个字符
[] :匹配指定范围内的任意单个字符，如果[ab]里有两个字符，就是a或者b的意思（注意在字符集[]里 *，+，.都是普通字符，不再具有元字符功能， -,^,除外）
[^]:匹配指定范围外的任意单个字符（注意^符号在[]字符集里面表示取反）
|：管道符或的意思和[ab]功能一样
^ab ：以什么开头的字符；（只匹配开始的位置）
ab$ :以什么结尾的字符（只匹配结束位置，$符号要放在要匹配的字符后面）
d:匹配0-9之间的任意1个数字
D：非0-9之间的数字
w匹配任意1个字母和数字（除了特殊符号）
W匹配非字母和数字
s匹配空白字符
S 匹配非空白的字符(只要不是空白都可以匹配 * 、- 、+)

:匹配一个特殊字符（空格、&、#）边界

：转意符，把一部分普通字符（d,w）变成具有特殊意义的元字符，把具有特殊意义的元字符变成普通字符；

(): 分组使用N个匹配规则对1个字符串进行匹配，得到N组匹配结果，（）里的内容优先显示;

str1='03124961103'

pattern1=re.compile(r'(d+)(4961d+)')                         #无名名分组
pattern2=re.compile(r'(?P<bao_ding>d+)(?P<tang_xian>496d+)') #有名分组

match_obj1=re.match(pattern1,str1)
match_obj2=re.match(pattern2,str1)

print(match_obj2.groups())              #查看匹配到的所有分组        ('0312', '4961103')


print(match_obj1.group(1))             #根据索引位置查看
print(match_obj1.group(2))             #根据索引位置查看

print(match_obj2.group('bao_ding'))   #根据组名查看             0312
print(match_obj2.group('tang_xian'))  #根据组名查看            4961103

无名分组|有名分组

(?:) 取消分组的优先级

一定要注意正则表达式里的元字符有两种类型一种是表示单个字符意义的，另一种是表示重复意义的；

（2）重复元字符：（表示从复表达左边的字符多少次）

* ：匹配*左边的字符 0-N次；

+ ：从复+左边的字符 1-无穷次

{1} : 从复指定的次数

{1，6} : 从复1-6次数

？: 从复0次或者1次

常用：(.*?)

3、re模块的方法

re.findall（）：找到所有符合匹配规则的元素，返回一个列表；基本正则表达式元字符：（匹配找到的所有结果）

print(re.findall( '-?d+.?d**-?d+.?d*','2*-6+7*45+1.4*3-8/4')

re.finditer()：匹配结果为一个迭代器

patten=re.compile(r'hello') :编写一个匹配规则

import re

str0='h123elloworld'
pattern0=re.compile(r'^h(.*?)e')      #创建1条匹配规则

match_obj=re.match(pattern0,str0)   #march方法返回1个match对象

# print(match_obj)                    #<_sre.SRE_Match object; span=(0, 5), match='hello'>
print(match_obj.group())            #匹配成功的字符串 hello

# print(match_obj.start())            #开始匹配的index位置 0
# print(match_obj.end())              #结束匹配的index位置 5
#
# print(match_obj.span())             #字符串 索引跨度
# print(match_obj.span(2))

re.match()

re.search()：只匹配找到的第一个结果

re.sub()：替换匹配结果

re.sub([all ],flags=re.S)：替换所有匹配结果，flags=re.S匹配所有换行和空格

desc=mark_safe(re.sub (r'[
]','<br/>',desc1,flags=re.S)) #替换所有换行，在前端显示

re.match()和re.search()的区别？

性能

match()函数只检测RE是不是在string的开始位置匹配

search()会扫描整个string查找匹配,会扫描整个字符串并返回第一个成功的匹配

相关阅读:
MySQL主从复制（异步复制与半同步复制）
http和https到底区别在哪
 Tcp的Flags
机器学习之近邻算法模型(KNN)
机器学习之linear_model (线性回归算法模型)
数据分析之Pandas操作
 数据分析之Numpy的基本操作
 分布式爬虫
 基于CrawlSpider全栈数据爬取
 HDU-4687 Boke and Tsukkomi 带花树,枚举
原文地址：https://www.cnblogs.com/sss4/p/6819489.html