python 内置模块

一、序列号模块(*****)

　　1.1 什么是序列化,反序列化

#   序列化: 把内存中的数据转化成一种中间的格式（json或pickle），然后存放在硬盘中，永久保存
#   反序列化：从硬盘中读出（json或pickle）格式，然后反解成python 的数据类型

　　1.2 为什么要使用序列化

#   1、数据格式的持久化
#   2、跨平台交互

　　1.3 如何使用序列化

import json

dict = {'name':'jmz','age':23,'sex':'boy','school':{'small_school':'lala','middle_school':'chajj school'}}


with open('json.txt','w',encoding='utf-8') as f:
    f.write(json.dumps(dict))
    # json.dump(dict,f)     # 这是上面的简写


with open('json.txt','r',encoding='utf-8') as f:
    res = json.loads(f.readline())
    # res = json.load(f)        # 上面的简写


print(res['name'])

json_mod.py

import pickle               
                            
def func(name):             
    print(name)             
                            
dict = {'name':'jmz','school
                            
with open('pick.pkl','wb') a
    # pickle 只保存 bytes 类型的数据
    f.write(pickle.dumps(dic
    # pickle.dump(dict,f)   
                            
with open('pick.pkl','rb') a
    res = pickle.loads(f.rea
    # res = pickle.load(f)  
                            
print(res)                  
res['func'](res['name'])

pickle_mod

　　1.4 总结

# json：
#       优点：所有的语言都支持json
#       缺点：只支持 部分的python 数据类型

# pickle:
#       优点：支持所有的python 数据类型
#       缺点：只有python 语言支持

# 注意：
    # pickle 在保存数据时，只保存bytes类型，在转化成pickle 时已是bytes类型了

二、hash模块(*****)

　　2.1 什么是hash

#   hash 是一种算法，该算法是用来效验数据内容的
#   多数用来加密数据，保证数据的安全。

　　2.2 怎么使用

import hashlib

m1= hashlib.md5()                   # 创建 一个md5的工厂
m1.update('中文'.encode('utf-8'))    # 向 工厂中添加内容   # 注意内容必须是 bytes类型
print(m1.hexdigest())               # 得到hash 结果，md5 是固定32位的 hash算法加密




m2 = hashlib.sha512()
m2.update(b'hello')
m2.update(b'jmz')
m2.update(b'shanghai')
m2.update(b'haha')
print(m2.hexdigest())     # sha512 是可变长的 hash算法加密

hash_mod.py

　　2.3 流程

# 流程:
#     1、创建一个hash 工厂(hashlib.XXX())
#     2、向工厂中添加 bytes 数据。      一定要是 bytes 数据类型
#     3、得出hash算法后结果

三、日志模块(*****)

　　3.1 错误级别

# 1、debug   10 调试错误
# 2、info    20 提示错误
# 3、warning 30 警告错误
# 4、error   40 错误
# 5、critical 50 致命错误

　　3.2 日志基础使用(了解)

import logging
logging.basicConfig(
    filename='access.log',
    format = '%(asctime)s - %(name)s -%(levelname)s -%(module)s:%(message)s',
    datefmt='%Y-%m-%d %X',
    level=10,       # 可以接受的至少什么等级的错误
)



logging.debug('这是一个调试错误')
logging.info('这是一个info错误')
logging.warning('这是一个warining错误')
logging.error('这是一个error错误')
logging.critical('这是一个critical错误')


# 中文错误在文件的编码使用的是系统的默认编码

简单运用,只做了解

　　3.3 日志原理(项目中不推荐使用,需了解)

#logger：产生日志的对象

#Filter：过滤日志的对象

#Handler：接收日志然后控制打印到不同的地方，FileHandler用来打印到文件中，StreamHandler用来打印到终端

#Formatter对象：可以定制不同的日志格式对象，然后绑定给不同的Handler对象使用，以此来控制不同的Handler的日志格式

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author Jmz

import logging

# logger对象： 生成对象，产生atm日志
logger1=logging.getLogger('atm')


# handle对象, 控制日志内容的去向，文件or终端
#      FileHandler 文件
#      StreamHandler 终端
a1=logging.FileHandler('a1.log',encoding='utf-8')
a2=logging.FileHandler('a2.log',encoding='utf-8')
ch = logging.StreamHandler()

# 建立 logger 和 handle 之间的绑定关系
logger1.addHandler(a1)
logger1.addHandler(a2)
logger1.addHandler(ch)


# Formatter 对象： 定制日志格式
format1 = logging.Formatter('%(asctime)s - %(name)s -%(levelname)s -%(module)s:%(message)s',datefmt='%Y-%m-%d %X')
format2 = logging.Formatter('%(asctime)s-%(module)s:%(message)s',datefmt='%Y-%m-%d %X')

# 为handle对象定制 日志格式
a1.setFormatter(format1)
a2.setFormatter(format2)


# 设置 保存 错误的级别     先 logger  后a1 or a2    # 先顶级过滤 logger 后 才是handle过滤
logger1.setLevel(10)
a1.setLevel(20)
a2.setLevel(30)




# 输出错误
logger1.debug('这是一个bug错误')
logger1.error('这是一个error错误')
logger1.info('这是一个info错误')

企业项目中一般不使用,但须知原理

format参数中可能用到的格式化串：
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名，可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间，用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的，自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

日志格式化串

　　原理图

　　3.4 日志记录,公司常用

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author Jmz

"""
logging配置
"""

import os
import logging.config

# 定义三种日志输出格式 开始

standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' 
                  '[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字

simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'

id_simple_format = '[%(levelname)s][%(asctime)s] %(message)s'

# 定义日志输出格式 结束

logfile_dir = os.path.dirname(os.path.abspath(__file__))  # log文件的目录

logfile_name = 'all2.log'  # log文件名

# 如果不存在定义的日志目录就创建一个
if not os.path.isdir(logfile_dir):
    os.mkdir(logfile_dir)

# log文件的全路径
logfile_path = os.path.join(logfile_dir, logfile_name)

# log配置字典
LOGGING_DIC = {
    'version': 1,
    'disable_existing_loggers': False,
    'formatters': {
        'standard': {
            'format': standard_format
        },
        'simple': {
            'format': simple_format
        },
    },
    'filters': {},
    'handlers': {
        #打印到终端的日志
        'console': {
            'level': 'DEBUG',
            'class': 'logging.StreamHandler',  # 打印到屏幕
            'formatter': 'simple'
        },
        #打印到文件的日志,收集info及以上的日志
        'default': {
            'level': 'DEBUG',
            'class': 'logging.handlers.RotatingFileHandler',  # 保存到文件
            'formatter': 'standard',
            'filename': logfile_path,  # 日志文件
            'maxBytes': 1024*1024*5,  # 日志大小 5M
            'backupCount': 5,
            'encoding': 'utf-8',  # 日志文件的编码，再也不用担心中文log乱码了
        },
    },
    'loggers': {
        #logging.getLogger(__name__)拿到的logger配置
        '': {
            'handlers': ['default', 'console'],  # 这里把上面定义的两个handler都加上，即log数据既写入文件又打印到屏幕
            'level': 'DEBUG',
            'propagate': True,  # 向上（更高level的logger）传递
        },
    },
}


def load_my_logging_cfg():
    logging.config.dictConfig(LOGGING_DIC)  # 导入上面定义的logging配置
    logger = logging.getLogger(__name__)  # 生成一个log实例
    logger.info('It works!')  # 记录该文件的运行状态

if __name__ == '__main__':
    load_my_logging_cfg()

通过配置,设置日志

四、正则模块(*****)

　　4.1 正则方法

_compile(pattern, flags)           # 匹配正则

search(pattern,[string,],flags=0)  ===> _compile(pattern, flags).search(string)
    # 查找符合正则规则的pattern的string,
    # 存在返回 匹配对象，不存在返回None
re.search(pattern,string).group()  # 返回第一个匹配到的结果，没有匹配则报错

split(pattern,string,maxsplit=0)   # 以pattern 分割 string,并确认分割maxsplit份。默认分割全部，返回分割后的新列表

sub(pattern,repl,string)      # 在string 将匹配(pattern)到的内容替换成repl 返回替换后的结果

findall(pattern,string)    # 在 string 在 匹配到所有的pattern ，返回 列表

match(pattern,string)      # 在string的起始位置开始匹配pattern，存在返回对象，不存在，返回None
re.match(pattern,string).group(1)   # 返回匹配到的下标为1的结果，下标为0则为本身

　　4.2 举例使用方式

import re
content = 'asd3fdsjk43dsndf'
print(re.findall('d',content))
# ['3', '4', '3']

findall.py

import re

test = '+-dsad-+dsa--dd++'
print(re.sub('+-','-',test))
# -dsad-+dsa--dd++

sub.py

import re

a = '23dasd2321dasdf3'

# search().group() 只取都第一个
print(re.search('d',a).group())
# 2

#单纯使用search 可以确认是否存在值,存在为真 不存在为假
if re.search('d',a):
    print('ok')
else:
    print('no')
# ok

search.py

import re

a = 'sda123dsa432'

# 已什么作为分割点，分割，  1 别是分割1次
res = re.split('d',a,1)
print(res)
# ['sda', '23dsa432']

split.py

import re
content = 'jmz3s4[22],[3],[dsada]'

res = re.match('.*?[(.*?)].*?[(.*?)].*?[(.*?)]',content)

print(res.group())    # jmz3s4[22],[3],[dsada]
print(res.group(1))   # 22
print(res.group(2))   # 3
print(res.group(3))   # dsada

match.py

五、os模块(*****)

　　os模块是与操作系统交互的一个接口

os.getcwd() 获取当前工作目录，即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录；相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名：('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.mkdir('dirname')    生成单级目录；相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符，win下为"\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符，win下为"	
",Linux下为"
"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令，直接显示
os.environ  获取系统环境变量
os.path.abspath(path)  返回path规范化的绝对路径
os.path.split(path)  将path分割成目录和文件名二元组返回
os.path.dirname(path)  返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)  返回path最后的文件名。如何path以／或结尾，那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)  如果path是绝对路径，返回True
os.path.isfile(path)  如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小

os模块的方法

在Linux和Mac平台上，该函数会原样返回path，在windows平台上会将路径中所有字符转换为小写，并将所有斜杠转换为饭斜杠。
>>> os.path.normcase('c:/windows\system32\')   
'c:\windows\system32\'   
   

规范化路径，如..和/
>>> os.path.normpath('c://windows\System32\../Temp/')   
'c:\windows\Temp'   

>>> a='/Users/jieli/test1/\a1/\\aa.py/../..'
>>> print(os.path.normpath(a))
/Users/jieli/test1

os路径处理
#方式一：推荐使用
import os
#具体应用
import os,sys
possible_topdir = os.path.normpath(os.path.join(
    os.path.abspath(__file__),
    os.pardir, #上一级
    os.pardir,
    os.pardir
))
sys.path.insert(0,possible_topdir)


#方式二：不推荐使用
os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

六、sys模块(****)

1  sys.argv           命令行参数List，第一个元素是程序本身路径
2  sys.exit(n)        退出程序，正常退出时exit(0)
3  sys.version        获取Python解释程序的版本信息
4  sys.maxint         最大的Int值
5  sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值
6  sys.platform       返回操作系统平台名称

import time

# print('
[#          ]',end='')
# time.sleep(0.3)
# print('
[###        ]',end='')
# time.sleep(0.3)
# print('
[#######    ]',end='')
# time.sleep(0.3)
# print('
[###########]',end='')

# x = 0
# while x <= 50:
#     print('
[%-50s] %d%%'%(x*'#',x//50*100),end='')    # %-50s  表示总共50个字符，不足以空格补充
#     x+=10
#     time.sleep(0.3)


def proccess(x,width=40):
    if x > 1:
        x =1
    pro_format = ('[%%-%ds]'%width) %(int(x*width)*'#')  # '%%' 表示%
    res = '%s %d%%'%(pro_format,int(x*100))
    print('
 %s'%res,end='')

start =0
total = 10484
while start <= total:
    start += 1024
    proccess(start/total)
    time.sleep(0.3)



# 补充知识点 1
#   在windows 中 
 表示光标移动至行首， 
 跳到下一行，光标不变
#   linux 
 表示就是



# 补充知识点2
#   %-30s 表示共30个字符，不足以空格补充
#   %% 表示%， 因为格式化操作 % 有特殊意义
#   ('[%%-%ds]'%10)%('###')   ===> '[%-10s]'%('###')   ===> [###       ]

打印进度条

七、random 随机模块(*****)

1 random.random()      # (0,1)     0-1 之间取不到0和1
2 random.randint(2,5)   # [2,5]    取2与5之间的整数
3 random.choice([1,2,['jmz','ggf'],'aa'])  # 在 [1,2,['jmz','ggf'],'aa'] 列表 中随机取一个返回
4 random.sample([1,2,['jmz','ggf'],'aa'],2)  # 在 [1,2,['jmz','ggf'],'aa'] 列表中 随机取2个组成新的列表
5 random.shuffle([1,2,['jmz','ggf'],'aa'])  # 将列表的下标打乱。
6 random.uniform(4,6)        # （4,6） 取大于4小于6的小数

方法

import random
print(random.random())       # (0,1)  去小数
# 0.644271281361324

print(random.randint(2,4))   # [2,4]
# 4

print(random.choice([1,2,3,['a','jmz']]))     # 在[1,2,3,['a','jmz']] 中随机取一个
# 2

print(random.sample([1,2,3,['a','jmz']],2))   # [1,2,3,['a','jmz']] 中取两个 组成 新历史列表
# [3, 2]

print(random.uniform(2,5))
# 4.7414246822271595

l = ['a','d',3,4,5]
print(random.shuffle(l))   # None
print(l)                   # ['d', 'a', 3, 5, 4]

具体用法

# ascii编码表 十进制数与字符的转化
# chr()   ord()

#  十进制 转 字符
print(chr(43))

# 字符装 十进制数
print(ord('+'))

import random
def make_code_one():
    '''
    随机生成以为字符
    a-z A-Z 0-9
    :return:
    '''
    s1 = random.randint(ord('a'),ord('z'))
    s2 = random.randint(ord('A'),ord('Z'))
    s3 = random.randint(ord('0'),ord('9'))
    res = random.choice([s1,s2,s3])
    return chr(res)

def make_code(n):
    res = ''
    for i in range(n):
        res = res + make_code_one()
    return res

print(make_code(4))

随机验证码生成

八、time模块(*****)

　　8.1 时间戳,结构化时间,格式化时间

import time

# 1、时间戳 以unix元年（1970-01-01 00:00:00）开始计算一直到当前时间的秒数
print(time.time())
# 1526911211.354357


# 2、结构化时间
print(time.localtime())  # 本地的结构化时间
# time.struct_time(tm_year=2018, tm_mon=5, tm_mday=21, tm_hour=22, tm_min=0, tm_sec=11, tm_wday=0, tm_yday=141, tm_isdst=0)
print(time.localtime().tm_year)
# 2018
print(time.gmtime())     # 世界的结构化时间
# time.struct_time(tm_year=2018, tm_mon=5, tm_mday=21, tm_hour=14, tm_min=0, tm_sec=11, tm_wday=0, tm_yday=141, tm_isdst=0)


# 3、格式化时间
print(time.strftime('%Y-%m-%d %X'))
# 2018-05-21 22:00:11

　　8.2时间戳,结构化时间与格式化时间之间的相互转化

# 1、时间戳  结构化时间  相互转化
print(time.localtime(1526911211.354357))     # 时间戳转结构化时间
# time.struct_time(tm_year=2018, tm_mon=5, tm_mday=21, tm_hour=22, tm_min=0, tm_sec=11, tm_wday=0, tm_yday=141, tm_isdst=0)

print(time.mktime((2009, 2, 17, 17, 3, 38, 1, 48, 0)))    # 格式化时间转 时间戳
# 1234861418.0

# 2、结构化时间 格式化时间 相互转化
print(time.strftime('%Y-%m-%d %X',(2009, 2, 17, 17, 3, 38, 1, 48, 0)))  # 结构化时间转 格式化时间
# 2009-02-17 17:03:38
print(time.strptime('2018-04-09 14:23:14','%Y-%m-%d %H:%M:%S'))   # 格式化时间转 结构化时间

# 1.1   时间戳转结构化时间  ===> localtime,gmtime
# 1.2   结构化时间转时间戳  ===> mktime

# 2.1   结构化时间转格式化时间 ===> strftime
# 2.2   格式化时间转结构化时间 ===> strptime

　　图解

# time 模块没有之间进行时间戳与格式化时间的转换,但可以自己手写一个

import time

# 格式化时间转 时间戳
def mktime(string,format):
    return time.mktime(time.strptime(string,format))

# 时间戳转 格式化时间
def date(format,strtime=time.time()):
    struct_time = time.localtime(strtime)
    return time.strftime(format,struct_time)

print(mktime('2017-08-09 14:13:34','%Y-%m-%d %H:%M:%S'))
# 1502259214.0


print(date('%Y-%m-%d'))
# 2018-05-21

时间戳与格式化时间的转化

%a    Locale’s abbreviated weekday name.     
%A    Locale’s full weekday name.     
%b    Locale’s abbreviated month name.     
%B    Locale’s full month name.     
%c    Locale’s appropriate date and time representation.     
%d    Day of the month as a decimal number [01,31].     
%H    Hour (24-hour clock) as a decimal number [00,23].     
%I    Hour (12-hour clock) as a decimal number [01,12].     
%j    Day of the year as a decimal number [001,366].     
%m    Month as a decimal number [01,12].     
%M    Minute as a decimal number [00,59].     
%p    Locale’s equivalent of either AM or PM.    (1)
%S    Second as a decimal number [00,61].    (2)
%U    Week number of the year (Sunday as the first day of the week) as a decimal number [00,53]. All days in a new year preceding the first Sunday are considered to be in week 0.    (3)
%w    Weekday as a decimal number [0(Sunday),6].     
%W    Week number of the year (Monday as the first day of the week) as a decimal number [00,53]. All days in a new year preceding the first Monday are considered to be in week 0.    (3)
%x    Locale’s appropriate date representation.     
%X    Locale’s appropriate time representation.     
%y    Year without century as a decimal number [00,99].     
%Y    Year with century as a decimal number.     
%z    Time zone offset indicating a positive or negative time difference from UTC/GMT of the form +HHMM or -HHMM, where H represents decimal hour digits and M represents decimal minute digits [-23:59, +23:59].     
%Z    Time zone name (no characters if no time zone exists).     
%%    A literal '%' character.

时间格式

九、datetime模块(*****)

# datetime 就是基于time 模块发展而来，到用法更简单

import datetime,time
print(datetime.datetime.now())
# 2018-05-21 22:52:39.542560

print(datetime.date.fromtimestamp((time.time())))
# 2018-05-21  时间转日期

print(datetime.datetime.now() + datetime.timedelta(-3))
print(datetime.datetime.now() - datetime.timedelta(3))
# 2018-05-18 22:56:21.981011  上面两个的效果是 一样的  都是 在当天的基础上减3天

print(datetime.datetime.now() + datetime.timedelta(hours=-3))
print(datetime.datetime.now() - datetime.timedelta(hours=3))
# 2018-05-21 19:58:22.163141   上面两个的效果是 一样的  都是 在当天的基础上减3小时

print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分
# 2018-05-21 23:29:06.690998

c_time = datetime.datetime.now()
print(c_time.replace(minute=30,hour=2,day=19))
# 2018-05-19 02:30:19.485846

十、configparser 模块(***)

# 用户对 ini 一类文件的读写操作
# 一般使用与 对环境，或系统 配置文件的 读写操作

import configparser
config = configparser.ConfigParser()    #  生成object 对象
config["DEFAULT"] = {'ServerAliveInterval': '45',
                     'Compression': 'yes',
                     'CompressionLevel': '9',
                     'time' : 12.34}

config['bitbucket.org'] = {}
config['bitbucket.org']['User'] = 'hg'
config['topsecret.server.com'] = {}
topsecret = config['topsecret.server.com']
topsecret['Host Port'] = '50022'  # mutates the parser
topsecret['ForwardX11'] = 'no'  # same here
config['DEFAULT']['ForwardX11'] = 'yes'
with open('example.ini', 'w') as configfile:
    config.write(configfile)

写一个example.ini 的配置文件

res = configparser.ConfigParser()
res.read('example.ini')

print(res.sections())
print(res.options('topsecret.server.com'))

print(res.get('bitbucket.org','forwardx11'))
print(res.getint('bitbucket.org','CompressionLevel'))
print(res.getfloat('bitbucket.org','time'))

读 example.ini 配置文件

十一、subprocess 模块(*****)

# 看名字即知 和 子进程有关。
# 主要使用：
#     执行命令获取进程执行的结果保存。


# 注意
#       os模块 也可以执行命令 开启了一个进程，但是无法保存结果。

import subprocess,time
# 开启子进程执行
res = subprocess.Popen('tasklist'
                       ,shell=True
                       # ,stdout=subprocess.PIPE          # 标准化输出
                       # ,stderr=subprocess.PIPE          # 错误输出
)
time.sleep(1)
print(res)
print(res.stdout.read().decode('gbk'))           # res.stdout.read() 拿到的是一个utf-8或者gbk的16进制码，这个是操作系统默认字符编码有关


# 在没有stdout=subprocess.PIPE的情况下，子进程命令结果或直接输入到终端，能否正常显示，取决于该程序的结束时间是否大于子进程的结束时间，大于则显示，小于则来不急显示
# 在有stdout=subprocess.PIPE的情况下，只有需要（res.stdout.read()）是才会显示

十二、shutil模块(***)

# 高级的 文件、文件夹、压缩包 处理模块

# 1、shutil.copyfileobj(fsrc, fdst[, length])
# 将文件内容拷贝到另一个文件中
#  shutil.copyfileobj(open('old.xml','r'), open('new.xml', 'w'))

# 2、shutil.copyfile(src, dst) #拷贝文件

# 3、shutil.copymode(src, dst) # 仅拷贝权限。内容、组、用户均不变

# 4、shutil.copystat(src, dst) # 仅拷贝状态的信息，包括：mode bits, atime, mtime, flags

# 5、shutil.copy(src, dst) # 拷贝文件和权限

# 6、 shutil.copy2(src, dst) # 拷贝文件和状态信息

# 7、shutil.copytree(src, dst, symlinks=False, ignore=None) #递归的去拷贝文件夹
#   shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*'))
# #目标目录不能存在，注意对folder2目录父级目录要有可写权限，ignore的意思是排除


# 8、shutil.rmtree(path[, ignore_errors[, onerror]]) # 递归的去删除文件

# 9、shutil.move(src, dst) # mv 递归的去移动文件，它类似mv命令，其实就是重命名。

# 10、shutil.make_archive(base_name, format,...)
#    base_name： 压缩包的文件名，也可以是压缩包的路径。只是文件名时，则保存至当前目录，否则保存至指定路径，
#    如 data_bak                       =>保存至当前路径
#    如：/tmp/data_bak =>保存至/tmp/
#    format：    压缩包种类，“zip”, “tar”, “bztar”，“gztar”
#    root_dir：    要压缩的文件夹路径（默认当前目录）
#    owner：    用户，默认当前用户
#    group：    组，默认当前组
#    logger：    用于记录日志，通常是logging.Logger对象

# 压缩
import shutil
res =shutil.make_archive('a',format='zip')
print(res)

压缩

# 解压
import zipfile
z= zipfile.ZipFile('a.zip','r')
z.extractall('./a')
z.close()

解压

shutil 压缩的原理就是通过zipfile,tarfile 进行压缩

import zipfile

# zip 压缩
z = zipfile.ZipFile('a.zip','w')
z.write('a.txt')
z.write('index.py')
z.close()


# zip解压
z = zipfile.ZipFile('a.zip','r')
z.extractall('./a')
z.close()

zipfile

import tarfile,os

# 压缩
t = tarfile.TarFile('a.tar','w')
t.add('a.txt')
t.close()

# 解压
t= tarfile.TarFile('a.tar','r')
t.extractall('./a')
t.close()

tarfile

十三、shelve模块(***)

import shelve
# shelve 比 pickle 更简单

# 添加数据
f= shelve.open(r'test')
f['jmz'] = {'name':'jmz','age':25,'weight':175.3}
f['jly'] = {'name':'jly','age':27,'weight':165.3}
f.close()


# 读和改
f= shelve.open(r'test',writeback=True)         # 改变数据必须要加writeback=True，添加则不需要
f['jmz']['age'] =35    # 改数据
print(f['jmz'])
f.close()

十四、xml 模块(***)

xml是实现不同语言或程序之间进行数据交换的协议，跟json差不多，但json使用起来更简单，不过，古时候，在json还没诞生的黑暗年代，大家只能选择用xml呀，至今很多传统公司如金融行业的很多系统的接口还主要是xml。

xml的格式如下，就是通过<>节点来区别数据结构的:

<?xml version="1.0"?>
<data>
    <country name="Liechtenstein">
        <rank updated="yes">2</rank>
        <year>2008</year>
        <gdppc>141100</gdppc>
        <neighbor name="Austria" direction="E"/>
        <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
        <rank updated="yes">5</rank>
        <year>2011</year>
        <gdppc>59900</gdppc>
        <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
        <rank updated="yes">69</rank>
        <year>2011</year>
        <gdppc>13600</gdppc>
        <neighbor name="Costa Rica" direction="W"/>
        <neighbor name="Colombia" direction="E"/>
    </country>
</data>

xml 数据结构

xml协议在各个语言里的都是支持的，在python中可以用以下模块操作xml：

import xml.etree.ElementTree as ET

tree = ET.parse('b.xml')
root = tree.getroot()           # 获取内容主体
print(root)

print(tree.find('country'))         # 返回第一个country子节点元素
print(tree.findall('country'))      # 返回所有的country子节点元素
print(tree.iter('year'))            # 返回所有的 year 元素

# 遍历
for country in tree.findall('country'):
    rank = country.find('rank')
    print('%s-->%s-->%s'%(rank.tag,rank.attrib,rank.text))

# tag 标签
# attrib 获取的是元素的属性
# text 获取元素的文本内容
# {'updated': 'yes'}---->2
# {'updated': 'yes'}---->5
# {'updated': 'yes'}---->69





# 增加元素
country2 = ET.Element('country')    # 创建一个新元素
country2.text='jmz'
country2.attrib = {'updated':'yes','version':'1.0'}
root.append(country2)     # 主体部分 添加一个新元素

tree.write('new.xml',encoding='utf-8')    # tree



# 修改
for year in tree.iter('year'):
    year.text = str(2016)    # xml 必须是str类型
    year.set('updated','yes')
    year.set('version','1.0')

tree.write('b.bat.xml')

xml 操作

import xml.etree.ElementTree as ET

new_xml = ET.Element('namelist')
name = ET.SubElement(new_xml,'jmz',attrib={'updated':'yes'})   # 创建子节点
age = ET.SubElement(name,'age',attrib={'year':'1994'})
age.text = 'jmz'
sex = ET.SubElement(name,'sex',text='男')
sex.text = '男'

name2 = ET.SubElement(new_xml,'jly',attrib={'updated':'yes'})
age2 = ET.SubElement(name2,'age',attrib={'year':'1994'})
age2.text = 'jly'
sex2 = ET.SubElement(name2,'sex')
sex2.text = '女'

object = ET.Element('object')
object.text = 'oldboy'
object.attrib={'addr':'shanghai','time':'2018-01-01'}


et=ET.ElementTree(new_xml)
et.write('namelist.xml',encoding='utf-8',xml_declaration=True)

ET.dump(new_xml)

创建一个xml

相关阅读:
将才和帅才之的区别
 百胜集团XX：BPM实现业务流程全过程无缝链接（案例）
心、肝、脾、肺、肾五脏解说+ 五脏六腑的作用
 人体的五行属性
 易经卦的通例
 《孙子兵法》中的企业领导艺术和方法
 五行盘谱
 大容量高并发性服务器组的技术解析
 中华哲学的领导艺术
 如何在WINDOW环境下搭建ActivateMQ和zookeeper集群环境
原文地址：https://www.cnblogs.com/xiaobaiskill/p/9053885.html