本节大纲
1 模块介绍 2 Time&datetime 3 Random 4 Os 5 Sys 6 Shutil 7 Json & picle 8 Shelve 9 Xml处理 10 Yaml处理 11 Configparser 12 Hashlib 13 Subprocess 14 Logging 15 Re正则表达式
模块介绍:
模块:
用来从逻辑上组织python代码(变量,函数,类,逻辑:实现一个功能),本质就是.py结尾的python文件(文件名:文件名为test.py,模块名:test)
程序包:
用来从逻辑上组织模块,本质是一个目录(必须带有一个__init__.py文件)。
使用方法:
1 Import module_name 2 From module_name import * 3 From module_name import m1,m2,m3 4 From module_name import logger as logger_xxx #如果在改文件下有相同函数,重命名再调用。
Import本质:
1 Import module_name 相当于将module_name中module_name.py所有的代码赋值给module_name调用; 2 From module_name import m1相当于已经定义了某个函数或者变量,直接使用。 3 导入模块的本质就是把python文件解释一遍。 4 导入一个程序包import 文件夹的本质就是执行该包下的__init__.py文件 5 导入不通目录时添加路径: 6 base = os.path.dirname(os.path.abspath(__file__)) 7 sys.path.append(base)
导入优化:
1 每次会去寻找mud.name,怎么优化呢? 2 import mud 3 4 def all(): 5 mud.name() 6 print("这是number") 7 8 def search(): 9 mud.name() 10 print("这是search") 11 12 优化方案: 13 14 from mud import name 15 16 def all1(): 17 name() 18 print("这是number") 19 20 def search2(): 21 name() 22 print("这是search")
Time&datetime
Time:import time
在Python中,通常有这几种方式来表示时间: 1.时间戳 2.格式化的时间字符串 3.元组(struct_time) 共九个元素。由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。 UTC(Coordinated Universal Time,世界协调时)亦即格林威治天问世间,世界标准时间。在 中国为UTC+8。DST(Daylight Saving Time)中国夏令时。 时间戳(timestamp)的方式:通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回float类型。返回时间戳方式的函数主要有time(),clock()等。 元组(struct_time)方式:struct_time元组共有9个元素,返回struct_time的函数主要有gmtime(),localtime(),strptime().下面列出这种方式元组中的几个元素: gmtime: >>> time.gmtime(31536000) time.struct_time(tm_year=1971, tm_mon=1, tm_mday=1, tm_hour=0, tm_min=0, tm_sec= 0, tm_wday=4, tm_yday=1, tm_isdst=0) time.localtime和time.mktime(x)间的转换: >>> time.localtime() time.struct_time(tm_year=2017, tm_mon=10, tm_mday=27, tm_hour=10, tm_min=59, tm_ sec=41, tm_wday=4, tm_yday=300, tm_isdst=0) >>> x = time.localtime() >>> time.mktime(x) 1509073402.0 strftime: >>> x = time.localtime() >>> time.strftime("%Y-%m-%d %H:%M:%S",x) 解释%Y == x.tm_year '2017-10-27 11:03:22' strptime: >>> time.strptime('2017-10-27 11:03:22',"%Y-%m-%d %H:%M:%S") time.struct_time(tm_year=2017, tm_mon=10, tm_mday=27, tm_hour=11, tm_min=3, tm_s ec=22, tm_wday=4, tm_yday=300, tm_isdst=-1) asctime: >>> time.asctime() 'Fri Oct 27 14:52:02 2017' >>> time.asctime((2017,12,10,14,12,10,10,3,10)) 'Thu Dec 10 14:12:10 2017' Ctime: >>> time.ctime() 'Fri Oct 27 14:56:55 2017' >>> time.ctime(100) 'Thu Jan 1 08:01:40 1970'
Datetime:import datetime
>>> datetime.datetime.now() datetime.datetime(2017, 10, 27, 15, 0, 56, 32101) #当前时间 >>> datetime.datetime.now()+datetime.timedelta(3) #修改时间到3天后 datetime.datetime(2017, 10, 30, 15, 1, 55, 331101) >>> datetime.datetime.now()+datetime.timedelta(-3) #修改时间到3天前 datetime.datetime(2017, 10, 24, 15, 2, 20, 788101) >>> datetime.datetime.now()+datetime.timedelta(hours=3) #修改时间到3小时后 datetime.datetime(2017, 10, 27, 18, 2, 55, 763101) >>> datetime.datetime.now()+datetime.timedelta(hours=-3) #修改时间到3小时前 datetime.datetime(2017, 10, 27, 12, 3, 13, 788101)
Random:import random
random.random() #用于生成一个0到1的随机浮点数:0<= N <1.0 random.randint(1,4) #函数原型为random.randint(a,b),用于生成一个指定范围内的整数。结果指的是整数 random.randrange(10) #函数原型为:random.randrange([start],stop[,step]); #从指定范围内,按指定基数递增的集合中获取一个随机数。如random.randrange(10,100,2)。结果指的是范围 #random.randrange(10,100,2)在结果上与random.choice(range(10,100,2))等效。 random.choice('xxx') #random.choice从序列中获取一个随机元素。 #其函数原型为:random.choice(sequence).参数sequence表示一个有序类型。 #这里要说明下:sequence在python不是一种特定的类型,二十泛指一系列的类型。 #list,tuple,字符串都属于sequence。有关sequence可以查看python手册数据模型一章。 random.sample([1,2,3],2) #random.sample的函数原型为random.sample(sequence,k),从指定序列中随机获取指定长度的片段,K不能超过总长度。 items = [1,2,3,4,5,6] #列表都是有顺序的,怎么让他无序呐 random.shuffle(items) print(items) #可以看见通过shuffle函数列表的顺序变了 #简单的随机数字游戏 #该列子加列表是为了突出字符是循环单个组成的
#check = ''
check = []
for i in range(5):
num = random.randrange(5)
if num == i:
tmp = chr(random.randint(60,100))
else:
tmp = random.randint(0,9)
check.append(str(tmp))
print(check)
os
import os os.getcwd() #获取当前工作目录,即当前python脚本工作的目录路径 os.chdir("dirname") #改变当前脚本工作目录;相当于shell下cd os.curdir #返回当前目录: ('.') os.pardir #获取当前目录的父目录字符串名:('..') os.makedirs('dirname1/dirname2') #可生成多层递归目录 os.removedirs('dirname1') #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推 os.mkdir('dirname') #生成单级目录;相当于shell中mkdir dirname os.rmdir('dirname') #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印 os.remove() #删除一个文件 os.rename("oldname","newname") #重命名文件/目录 os.stat('path/filename') #获取文件/目录信息 os.sep #输出操作系统特定的路径分隔符,win下为"\",Linux下为"/" os.linesep #输出当前平台使用的行终止符,win下为" ",Linux下为" " os.pathsep #输出用于分割文件路径的字符串 os.name #输出字符串指示当前使用平台。win->'nt'; Linux->'posix' os.system("bash command") #运行shell命令,直接显示 os.environ #获取系统环境变量 os.path.abspath(path) #返回path规范化的绝对路径 os.path.split(path) #将path分割成目录和文件名二元组返回 os.path.dirname(path) #返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) #返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素 os.path.exists(path) #如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) #如果path是绝对路径,返回True os.path.isfile(path) #如果path是一个存在的文件,返回True。否则返回False os.path.isdir(path) #如果path是一个存在的目录,则返回True。否则返回False os.path.join(path1[, #path2[, ...]]) 将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.join('e','目录名字') os.path.getatime(path) #返回path所指向的文件或者目录的最后存取时间 os.path.getmtime(path) #返回path所指向的文件或者目录的最后修改时间os.path.exists()
sys模块
sys.argv #命令行参数List,第一个元素是程序本身路径 sys.exit() #退出程序,正常退出时exit(0) sys.path #返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 sys.version #获取python的版本信息 sys.platform #返回操作系统平台名称
等待进度条:
1 for i in range(10): 2 sys.stdout.write('#') 3 sys.stdout.flush() 4 time.sleep(0.5)
shutil模块
shutil.copyfileobj(x,b) #复制文件x到b example: f11 = open('f1','r') f22 = open('f2','w') shutil.copyfileobj(f11,f22) f11.close() f22.close() shutil.copyfile('f1','f2') #直接写入文件名字进行文件复制。 shutil.copymode('f1','f3') #根据当前用户的umask接受权限。内容、组、用户、均不变。 shutil.copystat('f1','f3') #使用copystat()只会复制与文件关联的权限和日期。 shutil.copy(src,dst) #复制一个文件到一个文件或一个目录。 shutil.copy2(src,dst) #在copy上的基础上再复制文件最后访问时间与修改时间也复制过来了,类似于cp –p的东西。 shutil.copytree( olddir, newdir, True/Flase) #把olddir拷贝一份newdir,如果第3个参数是True,则复制目录时将保持文件夹下的符号连接,如果第3个参数是False,则将在复制的目录下生成物理副本来替代符号连接。 shutil.rmtree('src') #删除目录。 shutil.make_archive(base_name,format,..) #shutil.make_archive('D:\pythonl\nn','zip','D:\pythonl\M') 将M这个目录打包到指定目录D:\pythonl下,并起名为nn.zip压缩包 #创建压缩包并返回文件路径,例如:zip,tar #base_name:压缩包的文件名,也可以是压缩包的路径。只是文件名时,则保存至当前目录,否则保存至指定路径。 #如:www ==》 保存至当前路径 #如:/user/www ==》保存至/User/xxx #format:压缩包种类,‘zip’,‘tar’,‘bztar’,‘gztar’ #root_dir:要压缩的文件夹路径(默认当前目录) #owner:用户,默认当前用户 #group:组,默认当前组 #logger:用于记录日志,通常是logging.logger对象
zipfile模块
1 import zipfile 2 3 #压缩文件 4 z = zipfile.ZipFile("11-1.zip","w") 5 6 z.write("f3") 7 z.write("f1") 8 9 z.close() 10 11 #解压文件 12 z = zipfile.ZipFile("11-1.zip","r") 13 z.extractall() 14 z.close()
configparser模块
configParser 模块用于操作配置文件,注:Parser汉译为“解析”之意。 import configparser config = configparser.ConfigParser() #创建ConfigParser实例 #第一种写法 config['DEFAULT]'] = {'ServerAliveInterval':'45', 'Compression':'yes', 'CompressionLevel':'9', 'ForwardX11':'yes' } #第二种写法 config['bitbucket.org'] = {} config['bitbucket.org']['User'] ='hg' config['topsecret.server.com']={} config['topsecret.server.com']['Port'] ='50022' config['topsecret.server.com']['ForwardX11'] ='no' #将上面内容写入文件中 with open('f2','w') as configfile: config.write(configfile)
#生成文件内容如下
conf.read('f2') #读取配置文件 conf['bitbucket.org']['user'] #返回值hg
hashlib模块
import hashlib """用于加密相关的操作,3.X里代替了md5模块和啥模块,主要提供SHA1,SHA224,SHA256,SHA384,SHA512,MD5算法""" 例子: m = hashlib.md5() m.update(b"hhhh") print(m.hexdigest()) m.update(b'xxx') print(m.hexdigest())
结果:
logging模块
logging模块提供了标准的日志接口,你可以通过它存储各式格式的日志,logging的日志可以分为debug(),info(),warning(),error()and critical()5个级别
日志级别大小关系为:CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET。
#日志级别从大到小
1 logging.critical("server is run") 2 logging.error("error...") 3 logging.warning("user ....login in") 4 logging.info("This is info.") 5 logging.debug("debug...")
#将日志输入文件
1 logging.basicConfig(filename='f3',level=logging.INFO, 2 format='%(name)s %(filename)s %(funcName)s %(module)s %(lineno)d %(created)f %(relativeCreated)d %(asctime)s %(message)s', 3 datefmt='%m/%d/%Y %I:%M:%S %p') 4 def run(): 5 logging.info("xxx") 6 7 run() #函数调用
#日志格式
%(name)s #Logger的名字 |
%(levelno)s #数字形式的日志级别 |
%(levelname)s #文字形式的日志级别 |
%(pathname)s #调用日志输出函数的模块的完整路径名。可能没有 |
%(filename)s #调用日志输出函数的模块的文件名 |
%(module)s #调用日志输出函数的模块名 |
%(funcName)s #调用日志输出函数的函数名 |
%(lineno)d #调用日至输出函数的语句所在的代码行 |
%(created)f # 当前时间,用UNIX标准的表示时间的浮点数表示 |
%(relativeCreated)d #输出日志信息时,自Logger创建以来的毫秒数 |
%(asctime)s #字符串形式的当前时间,默认格式“11/02/2017 04:32:51,98”.逗号后面是毫秒 |
%(message)s #用户输出消息 |
%(thread)s #线程ID。可能没有 |
%(process)s #进程ID。可能没有 |
%(threadName)s #线程名。可能没有 |
# Python 使用logging模块记录日志涉及四个主要类,使用官方文档中的概括最为合适: # 1.logger提供了应用程序可以直接使用的接口 # 2.handler将(logger创建的)日志记录发送到合适的目的输出 # 3.filter提供了细度设备来决定输出哪条日志记录 # 4.formatter决定日志记录的最终输出格式 # # logger # 每个程序在输出信息之前都要获得一个Logger。logger通常对应了程序的模块名。比如聊天工具的图形界面模块: # LOG = logging.getLogger("chat.gui") # 核心模块: # LOG = logging.getLogger("chat.kernel")
Logger接口例子:
import logging
#创建一个logger logger = logging.getLogger('test') logger.setLevel(logging.DEBUG) #创建一个handler 和设置级别,屏幕上展示 ch = logging.StreamHandler() ch.setLevel(logging.WARNING) #创建一个handler和设置一个级别,写入到文件里面 fh = logging.FileHandler("access.log",encoding='utf-8') #如果不加,中文是乱码 fh.setLevel(logging.ERROR) #定义一个日志格式 ch_format=logging.Formatter('%(name)s - %(filename)s - %(asctime)s - %(message)s') fh_format=logging.Formatter('%(name)s %(filename)s %(asctime)s %(message)s') #结合起来 ch.setFormatter(ch_format) fh.setFormatter(fh_format) logger.addHandler(ch) logger.addHandler(fh) logger.warning("这是警告级别") #因为日志级别为WARNING,所以只有屏幕展示,不符合文件写入级别,所以文件无内容 logger.error("这是错误级别") #符合文件和屏幕日志级别,都展示
日志自动截断
1 import logging 2 import time 3 from logging import handlers 4 5 logger = logging.getLogger('test') 6 7 log_file ="timelog.log" 8 9 #定义日志大小最大10个字节,2个文件 10 #除了日志大小截断,还可以根据时间,when参数是一个字符串。表示时间间隔单位,不区分大小写,他以下取值: 11 #S秒,M分,H小时,D天,W每星期(interval==0时代表星期一),midnight每天凌晨 12 13 #fh = handlers.RotatingFileHandler(filename=log_file,maxBytes=10,backupCount=2) 14 fh = handlers.TimedRotatingFileHandler(filename=log_file,when='S',backupCount=2) 15 16 17 18 19 formatter = logging.Formatter('%(asctime)s %(module)s %(message)s') 20 21 fh.setFormatter(formatter) 22 23 logger.addHandler(fh) 24 25 #logging开始调用 26 logger.warning("1") 27 logger.warning("12") 28 logger.warning("123") 29 time.sleep(2) 30 logger.warning("12345") 31 logger.warning("13456789")
re模块
常用正则表达式符号:
1 '.' 默认匹配除 之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行 2 '^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a"," abc eee",flags=re.MULTILINE) 3 '$' 匹配字符结尾,或e.search("foo$","bfoo sdfsf",flags=re.MULTILINE).group()也可以 4 '*' 匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac") 结果为['abb', 'ab', 'a'] 5 '+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb'] 6 '?' 匹配前一个字符1次或0次 7 '{m}' 匹配前一个字符m次 8 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb'] 9 '|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC' 10 '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c 11 12 13 'A' 只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的 14 '' 匹配字符结尾,同$ 15 'd' 匹配数字0-9 16 'D' 匹配非数字 17 'w' 匹配[A-Za-z0-9] 18 'W' 匹配非[A-Za-z0-9] 19 's' 匹配空白字符、 、 、 , re.search("s+","ab c1 3").group() 结果 ' ' 20 21 '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}
最常用的匹配语法
1 re.match 从头开始匹配 2 re.search 匹配包含 3 >>> a = re.search("(d{1,3}.){3}d{1,3}","inet 192.168.15.111 netmask 0xffffff00 4 >>> a 5 <_sre.SRE_Match object; span=(5, 19), match='192.168.15.111'> 6 >>> a.group() 7 '192.168.15.111' 8 9 10 re.findall 把所有匹配到的字符放到以列表中的元素返回 11 >>> re.findall("d+","asdasd1231zxc222") 12 ['1231', '222'] 13 14 re.splitall 以匹配到的字符当做列表分隔符 15 >>> re.split("d+","asdasd1231zxc222dd") 16 ['asdasd', 'zxc', 'dd'] 17 18 re.sub 匹配字符并替换 19 >>> re.sub("d+","|","asdasd1231zxc222dd123vvgh",count=2) 20 'asdasd|zxc|dd123vvgh'