• 常用模块学习


    本节大纲

     1 模块介绍
     2 Time&datetime
     3 Random
     4 Os
     5 Sys
     6 Shutil
     7 Json & picle
     8 Shelve
     9 Xml处理
    10 Yaml处理
    11 Configparser
    12 Hashlib
    13 Subprocess
    14 Logging
    15 Re正则表达式

    模块介绍:

    模块:

    用来从逻辑上组织python代码(变量,函数,类,逻辑:实现一个功能),本质就是.py结尾的python文件(文件名:文件名为test.py,模块名:test)

    程序包:

             用来从逻辑上组织模块,本质是一个目录(必须带有一个__init__.py文件)。

    使用方法:

    1         Import  module_name
    2     From module_name import *
    3     From module_name import m1,m2,m3
    4     From module_name import logger as logger_xxx  #如果在改文件下有相同函数,重命名再调用。

    Import本质:

    1 Import module_name 相当于将module_name中module_name.py所有的代码赋值给module_name调用;
    2 From module_name import m1相当于已经定义了某个函数或者变量,直接使用。
    3     导入模块的本质就是把python文件解释一遍。
    4     导入一个程序包import 文件夹的本质就是执行该包下的__init__.py文件
    5     导入不通目录时添加路径:
    6     base = os.path.dirname(os.path.abspath(__file__))
    7 sys.path.append(base)

    导入优化:

     1 每次会去寻找mud.name,怎么优化呢?
     2     import mud
     3 
     4 def all():
     5     mud.name()
     6     print("这是number")
     7 
     8 def search():
     9     mud.name()
    10     print("这是search")
    11 
    12 优化方案:
    13 
    14 from mud import name
    15 
    16 def all1():
    17         name()
    18         print("这是number")
    19 
    20 def search2():
    21         name()
    22         print("这是search")

    Time&datetime

    Time:import time  

    在Python中,通常有这几种方式来表示时间:
        1.时间戳
        2.格式化的时间字符串
        3.元组(struct_time)
    共九个元素。由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。
    UTC(Coordinated Universal Time,世界协调时)亦即格林威治天问世间,世界标准时间。在
    中国为UTC+8。DST(Daylight Saving Time)中国夏令时。
        时间戳(timestamp)的方式:通常来说,时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”,返回float类型。返回时间戳方式的函数主要有time(),clock()等。
        元组(struct_time)方式:struct_time元组共有9个元素,返回struct_time的函数主要有gmtime(),localtime(),strptime().下面列出这种方式元组中的几个元素:
    gmtime:
    
    >>> time.gmtime(31536000)
    
    time.struct_time(tm_year=1971, tm_mon=1, tm_mday=1, tm_hour=0, tm_min=0, tm_sec=
    
    0, tm_wday=4, tm_yday=1, tm_isdst=0)
    
    time.localtime和time.mktime(x)间的转换:
    
    >>> time.localtime()
    
    time.struct_time(tm_year=2017, tm_mon=10, tm_mday=27, tm_hour=10, tm_min=59, tm_
    
    sec=41, tm_wday=4, tm_yday=300, tm_isdst=0)
    
     
    
    >>> x = time.localtime()
    
    >>> time.mktime(x)
    
    1509073402.0
    
    strftime:
    
    >>> x = time.localtime()
    
    >>> time.strftime("%Y-%m-%d %H:%M:%S",x) 解释%Y == x.tm_year
    
    '2017-10-27 11:03:22'
    
    
    strptime:
    
    >>> time.strptime('2017-10-27 11:03:22',"%Y-%m-%d %H:%M:%S")
    
    time.struct_time(tm_year=2017, tm_mon=10, tm_mday=27, tm_hour=11, tm_min=3, tm_s
    
    ec=22, tm_wday=4, tm_yday=300, tm_isdst=-1)
    
    asctime:
    
    >>> time.asctime()
    
    'Fri Oct 27 14:52:02 2017'
    
    >>> time.asctime((2017,12,10,14,12,10,10,3,10))
    
    'Thu Dec 10 14:12:10 2017'
    
    Ctime:
    
    >>> time.ctime()
    
    'Fri Oct 27 14:56:55 2017'
    
    >>> time.ctime(100)
    
    'Thu Jan  1 08:01:40 1970'

    Datetime:import datetime

    >>> datetime.datetime.now()
    datetime.datetime(2017, 10, 27, 15, 0, 56, 32101) #当前时间
    
    >>> datetime.datetime.now()+datetime.timedelta(3) #修改时间到3天后
    datetime.datetime(2017, 10, 30, 15, 1, 55, 331101)
    
    >>> datetime.datetime.now()+datetime.timedelta(-3) #修改时间到3天前
    datetime.datetime(2017, 10, 24, 15, 2, 20, 788101)
    
    >>> datetime.datetime.now()+datetime.timedelta(hours=3) #修改时间到3小时后
    datetime.datetime(2017, 10, 27, 18, 2, 55, 763101)
    
    >>> datetime.datetime.now()+datetime.timedelta(hours=-3) #修改时间到3小时前
    datetime.datetime(2017, 10, 27, 12, 3, 13, 788101)

    Random:import random

    
    random.random()
    #用于生成一个0到1的随机浮点数:0<= N <1.0
    
    random.randint(1,4)
    #函数原型为random.randint(a,b),用于生成一个指定范围内的整数。结果指的是整数
    
    random.randrange(10)
    #函数原型为:random.randrange([start],stop[,step]);
    #从指定范围内,按指定基数递增的集合中获取一个随机数。如random.randrange(10,100,2)。结果指的是范围
    #random.randrange(10,100,2)在结果上与random.choice(range(10,100,2))等效。
    
    random.choice('xxx')
    #random.choice从序列中获取一个随机元素。
    #其函数原型为:random.choice(sequence).参数sequence表示一个有序类型。
    #这里要说明下:sequence在python不是一种特定的类型,二十泛指一系列的类型。
    #list,tuple,字符串都属于sequence。有关sequence可以查看python手册数据模型一章。
    
    random.sample([1,2,3],2)
    #random.sample的函数原型为random.sample(sequence,k),从指定序列中随机获取指定长度的片段,K不能超过总长度。
    
    items = [1,2,3,4,5,6]
    #列表都是有顺序的,怎么让他无序呐
    random.shuffle(items)
    print(items)
    #可以看见通过shuffle函数列表的顺序变了
    
    
    #简单的随机数字游戏
    #该列子加列表是为了突出字符是循环单个组成的

    #check = ''
    check = []
    
    for i in range(5):
        num = random.randrange(5)
        if num == i:
            tmp = chr(random.randint(60,100))
        else:
            tmp = random.randint(0,9)
        check.append(str(tmp))
    print(check)

    os

    import os
    
    os.getcwd() #获取当前工作目录,即当前python脚本工作的目录路径
    os.chdir("dirname")  #改变当前脚本工作目录;相当于shell下cd
    os.curdir  #返回当前目录: ('.')
    os.pardir  #获取当前目录的父目录字符串名:('..')
    os.makedirs('dirname1/dirname2')    #可生成多层递归目录
    os.removedirs('dirname1')    #若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
    os.mkdir('dirname')    #生成单级目录;相当于shell中mkdir dirname
    os.rmdir('dirname')    #删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
    os.listdir('dirname')    #列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
    os.remove()  #删除一个文件
    os.rename("oldname","newname")  #重命名文件/目录
    os.stat('path/filename')  #获取文件/目录信息
    os.sep    #输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"
    os.linesep    #输出当前平台使用的行终止符,win下为"	
    ",Linux下为"
    "
    os.pathsep    #输出用于分割文件路径的字符串
    os.name    #输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
    os.system("bash command")  #运行shell命令,直接显示
    os.environ  #获取系统环境变量
    os.path.abspath(path)  #返回path规范化的绝对路径
    os.path.split(path)  #将path分割成目录和文件名二元组返回
    os.path.dirname(path)  #返回path的目录。其实就是os.path.split(path)的第一个元素
    os.path.basename(path)  #返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
    os.path.exists(path)  #如果path存在,返回True;如果path不存在,返回False
    os.path.isabs(path)  #如果path是绝对路径,返回True
    os.path.isfile(path)  #如果path是一个存在的文件,返回True。否则返回False
    os.path.isdir(path)  #如果path是一个存在的目录,则返回True。否则返回False
    os.path.join(path1[, #path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略 os.path.join('e','目录名字')
    os.path.getatime(path)  #返回path所指向的文件或者目录的最后存取时间
    os.path.getmtime(path)  #返回path所指向的文件或者目录的最后修改时间os.path.exists()

     sys模块

    sys.argv #命令行参数List,第一个元素是程序本身路径
    sys.exit() #退出程序,正常退出时exit(0)
    sys.path    #返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
    sys.version #获取python的版本信息
    sys.platform   #返回操作系统平台名称

    等待进度条:
    1 for i in  range(10):
    2     sys.stdout.write('#')
    3     sys.stdout.flush()
    4     time.sleep(0.5)

    shutil模块

    shutil.copyfileobj(x,b) #复制文件x到b
    example:
    f11 = open('f1','r')
    f22 = open('f2','w')
    shutil.copyfileobj(f11,f22)
    f11.close()
    f22.close()
    
    
    shutil.copyfile('f1','f2') #直接写入文件名字进行文件复制。
    
    shutil.copymode('f1','f3') #根据当前用户的umask接受权限。内容、组、用户、均不变。
    
    shutil.copystat('f1','f3') #使用copystat()只会复制与文件关联的权限和日期。
    
    shutil.copy(src,dst) #复制一个文件到一个文件或一个目录。
    
    shutil.copy2(src,dst)      #在copy上的基础上再复制文件最后访问时间与修改时间也复制过来了,类似于cp –p的东西。
    
    shutil.copytree( olddir, newdir, True/Flase) #把olddir拷贝一份newdir,如果第3个参数是True,则复制目录时将保持文件夹下的符号连接,如果第3个参数是False,则将在复制的目录下生成物理副本来替代符号连接。
    
    shutil.rmtree('src') #删除目录。
    
    shutil.make_archive(base_name,format,..)
    #shutil.make_archive('D:\pythonl\nn','zip','D:\pythonl\M') 将M这个目录打包到指定目录D:\pythonl下,并起名为nn.zip压缩包
    #创建压缩包并返回文件路径,例如:zip,tar
    #base_name:压缩包的文件名,也可以是压缩包的路径。只是文件名时,则保存至当前目录,否则保存至指定路径。
    #如:www ==》 保存至当前路径
    #如:/user/www ==》保存至/User/xxx
    #format:压缩包种类,‘zip’,‘tar’,‘bztar’,‘gztar’
    #root_dir:要压缩的文件夹路径(默认当前目录)
    #owner:用户,默认当前用户
    #group:组,默认当前组
    #logger:用于记录日志,通常是logging.logger对象

    zipfile模块

     1 import zipfile
     2 
     3 #压缩文件
     4 z = zipfile.ZipFile("11-1.zip","w")
     5 
     6 z.write("f3")
     7 z.write("f1")
     8 
     9 z.close()
    10 
    11 #解压文件
    12 z = zipfile.ZipFile("11-1.zip","r")
    13 z.extractall()
    14 z.close()

    configparser模块

    configParser 模块用于操作配置文件,注:Parser汉译为“解析”之意。
    
    import configparser
    
    config = configparser.ConfigParser() #创建ConfigParser实例
    
    #第一种写法
    config['DEFAULT]'] = {'ServerAliveInterval':'45',
    'Compression':'yes',
    'CompressionLevel':'9',
    'ForwardX11':'yes'
    }
    
    #第二种写法
    config['bitbucket.org'] = {}
    config['bitbucket.org']['User'] ='hg'
    
    config['topsecret.server.com']={}
    config['topsecret.server.com']['Port'] ='50022'
    config['topsecret.server.com']['ForwardX11'] ='no'
    
    #将上面内容写入文件中
    with open('f2','w') as  configfile:
        config.write(configfile)
    #生成文件内容如下
    conf.read('f2') #读取配置文件  conf['bitbucket.org']['user'] #返回值hg

     hashlib模块

    import hashlib
    
    """用于加密相关的操作,3.X里代替了md5模块和啥模块,主要提供SHA1,SHA224,SHA256,SHA384,SHA512,MD5算法"""
    
    例子:
    m = hashlib.md5()
    m.update(b"hhhh")
    print(m.hexdigest())
    m.update(b'xxx')
    print(m.hexdigest())

    结果:
    
    

     logging模块

    logging模块提供了标准的日志接口,你可以通过它存储各式格式的日志,logging的日志可以分为debug(),info(),warning(),error()and critical()5个级别
    日志级别大小关系为:CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET。
    #日志级别从大到小
    1  logging.critical("server is run")
    2  logging.error("error...")
    3  logging.warning("user ....login in")
    4  logging.info("This is info.")
    5  logging.debug("debug...")
    #将日志输入文件
    1 logging.basicConfig(filename='f3',level=logging.INFO,
    2                     format='%(name)s %(filename)s %(funcName)s %(module)s %(lineno)d %(created)f  %(relativeCreated)d %(asctime)s  %(message)s',
    3                     datefmt='%m/%d/%Y %I:%M:%S %p')
    4 def run():
    5     logging.info("xxx")
    6 
    7 run() #函数调用
    #日志格式
    
    

    %(name)s          #Logger的名字

    %(levelno)s                 #数字形式的日志级别

    %(levelname)s         #文字形式的日志级别

    %(pathname)s           #调用日志输出函数的模块的完整路径名。可能没有

    %(filename)s             #调用日志输出函数的模块的文件名

    %(module)s          #调用日志输出函数的模块名

    %(funcName)s              #调用日志输出函数的函数名

    %(lineno)d          #调用日至输出函数的语句所在的代码行

    %(created)f            # 当前时间,用UNIX标准的表示时间的浮点数表示

    %(relativeCreated)d       #输出日志信息时,自Logger创建以来的毫秒数

    %(asctime)s       #字符串形式的当前时间,默认格式“11/02/2017 04:32:51,98”.逗号后面是毫秒

    %(message)s                #用户输出消息

    %(thread)s                   #线程ID。可能没有

    %(process)s                #进程ID。可能没有

    %(threadName)s       #线程名。可能没有

     
    # Python 使用logging模块记录日志涉及四个主要类,使用官方文档中的概括最为合适:
    # 1.logger提供了应用程序可以直接使用的接口
    # 2.handler将(logger创建的)日志记录发送到合适的目的输出
    # 3.filter提供了细度设备来决定输出哪条日志记录
    # 4.formatter决定日志记录的最终输出格式
    #
    # logger
    # 每个程序在输出信息之前都要获得一个Logger。logger通常对应了程序的模块名。比如聊天工具的图形界面模块:
    # LOG = logging.getLogger("chat.gui")
    # 核心模块:
    # LOG = logging.getLogger("chat.kernel")

    Logger接口例子:

    import logging 
    #
    创建一个logger logger = logging.getLogger('test') logger.setLevel(logging.DEBUG) #创建一个handler 和设置级别,屏幕上展示 ch = logging.StreamHandler() ch.setLevel(logging.WARNING) #创建一个handler和设置一个级别,写入到文件里面 fh = logging.FileHandler("access.log",encoding='utf-8') #如果不加,中文是乱码 fh.setLevel(logging.ERROR) #定义一个日志格式 ch_format=logging.Formatter('%(name)s - %(filename)s - %(asctime)s - %(message)s') fh_format=logging.Formatter('%(name)s %(filename)s %(asctime)s %(message)s') #结合起来 ch.setFormatter(ch_format) fh.setFormatter(fh_format) logger.addHandler(ch) logger.addHandler(fh) logger.warning("这是警告级别") #因为日志级别为WARNING,所以只有屏幕展示,不符合文件写入级别,所以文件无内容 logger.error("这是错误级别") #符合文件和屏幕日志级别,都展示
    
    

    日志自动截断 

     
     1 import logging
     2 import time
     3 from logging import handlers
     4 
     5 logger = logging.getLogger('test')
     6 
     7 log_file ="timelog.log"
     8 
     9 #定义日志大小最大10个字节,2个文件
    10 #除了日志大小截断,还可以根据时间,when参数是一个字符串。表示时间间隔单位,不区分大小写,他以下取值:
    11 #S秒,M分,H小时,D天,W每星期(interval==0时代表星期一),midnight每天凌晨
    12 
    13 #fh = handlers.RotatingFileHandler(filename=log_file,maxBytes=10,backupCount=2)
    14 fh = handlers.TimedRotatingFileHandler(filename=log_file,when='S',backupCount=2)
    15 
    16 
    17 
    18 
    19 formatter = logging.Formatter('%(asctime)s %(module)s %(message)s')
    20 
    21 fh.setFormatter(formatter)
    22 
    23 logger.addHandler(fh)
    24 
    25 #logging开始调用
    26 logger.warning("1")
    27 logger.warning("12")
    28 logger.warning("123")
    29 time.sleep(2)
    30 logger.warning("12345")
    31 logger.warning("13456789")
    
    

     re模块

    常用正则表达式符号:

     1 '.'     默认匹配除
    之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
     2 '^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","
    abc
    eee",flags=re.MULTILINE)
     3 '$'     匹配字符结尾,或e.search("foo$","bfoo
    sdfsf",flags=re.MULTILINE).group()也可以
     4 '*'     匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
     5 '+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
     6 '?'     匹配前一个字符1次或0次
     7 '{m}'   匹配前一个字符m次
     8 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
     9 '|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
    10 '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
    11  
    12  
    13 'A'    只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的
    14 ''    匹配字符结尾,同$
    15 'd'    匹配数字0-9
    16 'D'    匹配非数字
    17 'w'    匹配[A-Za-z0-9]
    18 'W'    匹配非[A-Za-z0-9]
    19 's'     匹配空白字符、	、
    、
     , re.search("s+","ab	c1
    3").group() 结果 '	'
    20  
    21 '(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}

    最常用的匹配语法

     1 re.match 从头开始匹配
     2 re.search 匹配包含
     3 >>> a = re.search("(d{1,3}.){3}d{1,3}","inet 192.168.15.111 netmask 0xffffff00
     4 >>> a
     5 <_sre.SRE_Match object; span=(5, 19), match='192.168.15.111'>
     6 >>> a.group()
     7 '192.168.15.111'
     8 
     9 
    10 re.findall 把所有匹配到的字符放到以列表中的元素返回
    11 >>> re.findall("d+","asdasd1231zxc222")
    12 ['1231', '222']
    13 
    14 re.splitall 以匹配到的字符当做列表分隔符
    15 >>> re.split("d+","asdasd1231zxc222dd")
    16 ['asdasd', 'zxc', 'dd']
    17 
    18 re.sub      匹配字符并替换 
    19 >>> re.sub("d+","|","asdasd1231zxc222dd123vvgh",count=2)
    20 'asdasd|zxc|dd123vvgh'
  • 相关阅读:
    const修饰指针
    C++中引用
    C++引用做函数返回值
    C++内存分区模型
    轻量级图卷积网络LightGCN介绍和构建推荐系统示例
    JavaJDBC
    页面跳转/onclick后顶在网页最上面:href锚点的使用
    Java数据结构定义
    java设计模式之MVC模式
    java面向对象:封装
  • 原文地址:https://www.cnblogs.com/jesse-gong/p/7738201.html
Copyright © 2020-2023  润新知