一、collections模块
collections模块主要封装了⼀些关于集合类的相关操作。比如,我们学过的Iterable,Iterator等等。除了这些以外, collections还提供了⼀些除了基本数据类型以外的数据集合类
型。Counter, deque, OrderDict, defaultdict以及namedtuple。
1. Counter
counter是⼀个计数器,主要⽤来计数。
计算⼀个字符串中每个字符出现的次数:
from collections import Counter#from是来自于哪个,import是倒入哪个
s = 'abc123abc'
d = Counter(s)
print(d)#可以把d当做字典使用
结果:
Counter({'a': 2, 'b': 2, 'c': 2, '1': 1, '2': 1, '3': 1})
2. deque 双向队列.
说双向队列之前我们需要了解两种数据结构。
- 栈: FILO(先进后出)
- 队列: FIFO(先进先出)
由于python没有给出Stack模块,所以我们⾃⼰⼿动写⼀个粗略版本(注意, 此版本有严重的并发问题),其实就是把列表修改了一下,列表就是一个栈,append时,向栈顶添加,pop时,从栈顶清除,后进先出。看代码:
class StackEmptyError(Exception): pass class StackFullError(Exception): pass class Stack: def __init__(self, size): self.index = 0 self.size = size self.lst = [] def pop(self): if self.index > self.size: raise StackFullError("stack is full") else: self.lst[self.index] = el self.index = self.index + 1
def push(self, el):
if self.index > self.size:
raise StackFullError("stack is full")
else:
self.lst[self.index] = el
self.index = self.index + 1
队列: python提供了queue模块. 使⽤起来非常⽅便
import queue#倒入queue类 q = queue.Queue() q.put("李嘉诚") q.put("张三") q.put("李四") print(q) print(q.get()) print(q.get()) print(q.get())
注意:如果队列⾥没有元素了,再也拿不出来元素了,此时程序会阻塞。
接下来, 我们来看⼀下deque, 注意, 此队列是collections中的。
from collections import deque q = deque() q.append("张三") # 右侧添加 q.append("李四") q.appendleft("王五") # 左侧添加 q.appendleft("赵六") print(q) print(q.pop()) # 右侧删除 print(q.popleft()) # 左侧删除
3. namedtuple 命名元组
命名元组,顾名思义,给元组内的元素进⾏命名。比如,我们说(x, y) 这是⼀个元组。同时,我们还可以认为这是⼀个点坐标。这时, 我们就可以使⽤namedtuple对元素进⾏命名。
from collections import namedtuple # ⾃⼰定义了⼀个元组, 如果灵性够好, 这其实就是创建了⼀个类 nt = namedtuple("point", ["x", "y"]) p = nt(1, 2) print(p) print(p.x) print(p.y) #还可以按照下面这样操作 # print(p[0], p[1]) # d = p._asdict() # print(d['x'], d['y']) #p = p._replace(x = 120)#返回一个新的值 #print(p.x, p.y)
4. orderdict和defaultdict
1)orderdict 顾名思义. 字典的key默认是⽆序的. ⽽OrderedDict是有序的 dic = {'a':'娃哈哈', 'b':'薯条', 'c':'胡辣汤'} print(dic) from collections import OrderedDict od = OrderedDict({'a':'娃哈哈', 'b':'薯条', 'c':'胡辣汤'}) print(od) #感觉这个OrderedDict作用不是很大,现在字典表面来看是有顺序的。 2)defaultdict: 可以给字典设置默认值. 当key不存在时. 直接获取默认值: from collections import defaultdict dd = defaultdict(list) # 默认值list,这个值,必须是可以被调用的就是callable的 print(dd['娃哈哈']) # [] 当key不存在的时候. 会⾃动执⾏构造⽅法中传递的内容.
二、time 时间模块(重点)
时间模块是我们要熟记的,到后⾯写程序的时候经常能⽤到。比如:如何计算时间差,如何显示用户看得懂的时间等。
import time print(time.time()) # 1538927647.483177 系统时间,这里是秒级的
此时,我们已经获取到了系统时间,但是这个时间看不懂,怎么办呢?需要对时间进⾏格式化。那这样就引出了另⼀种时间的格式,在python中时间分成三种表现形式:
1. 时间戳(timestamp). 时间戳使⽤的是从1970年01⽉01⽇ 00点00分00秒到现在⼀共经过了多少秒,使⽤float来表⽰
2. 格式化时间(strftime). 这个时间可以根据我们的需要对时间进⾏任意的格式化.
3. 结构化时间(struct_time). 这个时间主要可以把时间进⾏分类划分. 比如. 1970年01⽉01⽇ 00点00分00秒 这个时间可以被细分为年, ⽉, ⽇.....⼀⼤堆东⻄。
时间戳我们已经⻅过了就是time.time(),⼀般, 我们不会把这样的时间显⽰给用户。那就需要对时间进⾏格式化操作。
s = time.strftime("%Y-%m-%d %H:%M:%S") # 必须记住 print(s)
%y 两位数的年份表示(00-99) %Y 四位数的年份表示(000-9999) %m ⽉份(01-12) %d ⽉内中的⼀天(0-31) %H 24⼩时制⼩时数(0-23) %I 12⼩时制⼩时数(01-12) %M 分钟数(00=59) %S 秒(00-59) %a 本地简化星期名称 %A 本地完整星期名称 %b 本地简化的⽉份名称 %B 本地完整的⽉份名称 %c 本地相应的⽇期表示和时间表示 %j 年内的⼀天(001-366) %p 本地A.M.或P.M.的等价符 %U ⼀年中的星期数(00-53)星期天为星期的开始 %w 星期(0-6),星期天为星期的开始 %W ⼀年中的星期数(00-53)星期⼀为星期的开始 %x 本地相应的⽇期表示 %X 本地相应的时间表示 %Z 当前时区的的名称
看⼀下结构化时间:
print(time.localtime()) 结果: time.struct_time(tm_year=2017, tm_mon=05, tm_mday=8, tm_hour=10, tm_min=24, tm_sec=42, tm_wday=0, tm_yday=126, tm_isdst=0)
好了,现在看到的都是当前系统时间, 那如果碰到时间转换呢? 比如,我们的数据库中存储了这样⼀个时间: 1888888888。 如何显⽰成xxxx年xx⽉xx⽇,那时间的转化必须要记住: 所有的转化都要通过结构化时间来转化.
t = time.localtime(1888888888) # 结构化时间 s = time.strftime("%Y-%m-%d %H:%M:%S", t) # 格式化这个时间 print(s)
那如果说, 我让⽤户输入⼀个时间, 怎么把它转化成我们数据库存储的时间戳呢? 还是要⽤到结构化时间:
s = "2020-10-01 12:18:12" t = time.strptime(s, "%Y-%m-%d %H:%M:%S") # 转化成结构时间 print(time.mktime(t)) # 转换成时间戳
三、 random模块
所有关于随机相关的内容都在random模块中.
import random print(random.random()) # 0-1⼩数 print(random.uniform(3, 10)) # 3-10⼩数 print(random.randint(1, 10)) # 1-10整数 [1, 10] print(random.randrange(1, 10, 2)) # 1-10奇数 [1,10) print(random.choice([1, '张三', ["李四", "王五"]])) # 1或者张三或者["李四", "王五"]) print(random.sample([1, '23', [4, 5]], 2)) # 列表元素任意2个组合,前后顺序不定 lst = [1, 2, 3, 4, 5, 6, 7, 8] random.shuffle(lst) # 随机打乱顺序,类似洗牌 print(lst)
四、 os模块
所有和操作系统相关的内容都在os模块
os.makedirs('dirname1/dirname2') 可⽣成多层递归⽬录 os.removedirs('dirname1') 若⽬录为空,则删除,并递归到上⼀级⽬录,如若也为空,则删除,依此类推 os.mkdir('dirname') ⽣成单级⽬录;相当于shell中mkdir dirname os.rmdir('dirname') 删除单级空⽬录,若⽬录不为空则⽆法删除,报错;相当于shell中rmdir dirname os.listdir('dirname') 列出指定⽬录下的所有⽂件和⼦⽬录,包括隐藏⽂件,并以列表⽅式打印 os.remove() 删除⼀个⽂件 os.rename("oldname","newname") 重命名⽂件/⽬录 os.stat('path/filename') 获取⽂件/⽬录信息 os.system("bash command") 运⾏shell命令,直接显示 os.popen("bash command).read() 运⾏shell命令,获取执⾏结果 os.getcwd() 获取当前⼯作⽬录,即当前python脚本⼯作的⽬录路径 os.chdir("dirname") 改变当前脚本⼯作⽬录;相当于shell下cd # os.path os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成⽬录和⽂件名⼆元组返回 os.path.dirname(path) 返回path的⽬录。其实就是os.path.split(path)的第⼀个元素 os.path.basename(path) 返回path最后的⽂件名。如何path以/或结尾,那么就会返回空值。 即os.path.split(path)的第⼆个元素 os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False os.path.isabs(path) 如果path是绝对路径,返回True os.path.isfile(path) 如果path是⼀个存在的⽂件,返回True。否则返回False os.path.isdir(path) 如果path是⼀个存在的⽬录,则返回True。否则返回False os.path.join(path1[, path2[, ...]]) 将多个路径组合后返回,第⼀个绝对路径之前的参数 将被忽略 os.path.getatime(path) 返回path所指向的⽂件或者⽬录的最后访问时间 os.path.getmtime(path) 返回path所指向的⽂件或者⽬录的最后修改时间 os.path.getsize(path) 返回path的⼤⼩ # 特殊属性: os.sep 输出操作系统特定的路径分隔符,win下为"\",Linux下为"/" os.linesep 输出当前平台使⽤的⾏终⽌符,win下为" ",Linux下为" " os.pathsep 输出⽤于分割⽂件路径的字符串 win下为;,Linux下为: os.name 输出字符串指示当前使⽤平台。win->'nt'; Linux->'posix' os.stat() 属性解读: stat 结构: st_mode: inode 保护模式 st_ino: inode 节点号。 st_dev: inode 驻留的设备。 st_nlink: inode 的链接数。 st_uid: 所有者的⽤户ID。 st_gid: 所有者的组ID。 st_size: 普通⽂件以字节为单位的⼤⼩;包含等待某些特殊⽂件的数据。 st_atime: 上次访问的时间。 st_mtime: 最后⼀次修改的时间。 st_ctime: 由操作系统报告的"ctime"。在某些系统上(如Unix)是最新的元数据更改的时间,在其它系统上(如Windows)是创建时间(详细信息参⻅平台的⽂档)。
五、sys模块
所有和python解释器相关的都在sys模块.
sys.argv 命令⾏参数List,第⼀个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0),错误退出sys.exit(1) sys.version 获取Python解释程序的版本信息 sys.path 返回模块的搜索路径,初始化时使⽤PYTHONPATH环境变量的值 sys.platform 返回操作系统平台名称
六、functolls
1.reduce
这个函数是与map相对应的,map是发散,这个是归拢。
from functools import reduce lst = [1,2,3,4] print(reduce(lambda x,y:x+y,lst))
2.wraps
这个是为装饰器服务的。看代码:
from functools import wraps def wrapper(fn): @wraps(fn) def inner(*args, **kwargs): print('befor') ret = fn() print('after') return ret return inner @wrapper def test(): print('hahahha',test) test() print(test)
inner这个内部函数上面如果不加@wraps,最后print打印出来的是inner的值,但是如果加了后,再打印出来后,就是test在内存中的地址了。@wraps改变了返回值的inner的值。
3.partial(偏函数)
在这里作用是为不能更改的函数设置一些固定值,下面修改一下最常使用的print函数:
from functools import partial p = partial(print,end='mmm') p('123456') 结果: 123456mmm