一.生成器
什么是生成器.生成器实质就是迭代器.
在python中三种方式来获取生成器:
1.通过生成器函数
2.通过各种推导式来实现生成器.
3.通过数据的转换也可以获取生成器.
(一).初始生成器
我们知道的迭代器有两种:一种是调用方法直接返回的,一种是可迭代对象通过执行iter方法得到的,迭代器有的好处是可以节省内存。
如果在某些情况下,我们也需要节省内存,就只能自己写。我们自己写的这个能实现迭代器功能的东西就叫生成器。
Python中提供的生成器:
1.生成器函数:常规函数定义,但是,使用yield语句而不是return语句返回结果。yield语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行
2.生成器表达式:类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表
生成器Generator:
本质:迭代器(所以自带了__iter__方法和__next__方法,不需要我们去实现)
特点:惰性运算,开发者自定义
(二).生成器函数
一个包含yield关键字的函数就是一个生成器函数。yield可以为我们从函数中返回值,但是yield又不同于return,return的执行意味着程序的结束,调用生成器函数不会得到返回的具体的值,而是得到一个可迭代的对象。每一次获取这个可迭代对象的值,就能推动函数的执行,获取新的返回值。直到函数执行结束。
1 import time 2 def genrator_fun1(): 3 a = 1 4 print('现在定义了a变量') 5 yield a 6 b = 2 7 print('现在又定义了b变量') 8 yield b 9 10 g1 = genrator_fun1() 11 print('g1 : ',g1) #打印g1可以发现g1就是一个生成器 12 print('-'*20) #我是华丽的分割线 13 print(next(g1)) 14 time.sleep(1) #sleep一秒看清执行过程 15 print(next(g1)) 16 17 初识生成器函数 18 19 初始生成器函数
生成器有什么好处呢?就是不会一下子在内存中生成太多数据
假如我想让工厂给学生做校服,生产2000000件衣服,我和工厂一说,工厂应该是先答应下来,然后再去生产,我可以一件一件的要,也可以根据学生一批一批的找工厂拿。
而不能是一说要生产2000000件衣服,工厂就先去做生产2000000件衣服,等回来做好了,学生都毕业了。。。
1 def produce(): 2 """生产衣服""" 3 for i in range(2000000): 4 yield "生产了第%s件衣服"%i 5 6 product_g = produce() 7 print(product_g.__next__()) #要一件衣服 8 print(product_g.__next__()) #再要一件衣服 9 print(product_g.__next__()) #再要一件衣服 10 num = 0 11 for i in product_g: #要一批衣服,比如5件 12 print(i) 13 num +=1 14 if num == 5: 15 break
(三).send
1 def generator(): 2 print(123) 3 content = yield 1 4 print('=======',content) 5 print(456) 6 yield2 7 8 g = generator() 9 ret = g.__next__() 10 print('***',ret) 11 ret = g.send('hello') #send的效果和next一样 12 print('***',ret) 13 14 #send 获取下一个值的效果和next基本一致 15 #只是在获取下一个值的时候,给上一yield的位置传递一个数据 16 #使用send的注意事项 17 # 第一次使用生成器的时候 是用next获取下一个值 18 # 最后一个yield不能接受外部的值
send和__next__()区别:
1.send和next()都是让生成器向下走一次
2.send可以给上一个yield的位置传递值,不能给最后一个yield发送值.在第一次执行生成器代码的时候不能使用send()
二.列表推导式和生成器表达式
1 l = [i for i in range(10)] 2 print(l) 3 l1 = ['选项%s'%i for i in range(10)] 4 print(l1)
1.把列表解析的[]换成()得到的就是生成器表达式
2.列表解析与生成器表达式都是一种便利的编程方式,只不过生成器表达式更节省内存
3.Python不但使用迭代器协议,让for循环变得更加通用。大部分内置函数,也是使用迭代器协议访问对象的。例如, sum函数是Python的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议,所以,我们可以直接这样计算一系列值的和:
sum(x ** 2 for x in range(4))
(一).列表推导式
例一:30以内所有能被3整除的数
1 multiples = [i for i in range(30) if i % 3 is 0] 2 print(multiples) 3 # Output: [0, 3, 6, 9, 12, 15, 18, 21, 24, 27]
例二:30以内所有能被3整除的数的平方
1 def squared(x): 2 return x*x 3 multiples = [squared(i) for i in range(30) if i % 3 is 0] 4 print(multiples)
例三:找到嵌套列表中名字含有两个‘e’的所有名字
names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven', 'Joe'], ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry', 'Eva']] print([name for lst in names for name in lst if name.count('e') >= 2]) # 注意遍历顺序,这是实现的关键
(二).字典推导式
例一:将一个字典的key和value对调
1 mcase = {'a': 10, 'b': 34} 2 mcase_frequency = {mcase[k]: k for k in mcase} 3 print(mcase_frequency)
例二:合并大小写对应的value值,将k统一成小写
1 mcase = {'a': 10, 'b': 34, 'A': 7, 'Z': 3} 2 mcase_frequency = {k.lower(): mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0) for k in mcase.keys()} 3 print(mcase_frequency)
(三).集合推导式
例:计算列表中每个值的平方,自带去重功能
1 squared = {x**2 for x in [1, -1, 2]} 2 print(squared) 3 # Output: set([1, 4])
生成器表达式和列表推导式的区别
1.列表推导式比较耗内存.一次性加载.生成器表达式几乎不占用内存.使用的时候才分配和使用内存.
2.得到的值不一样,列表推导式得到的是一个列表.生成器表达式获取的是一个生成器.
深坑==>生成器,要值的时候才拿值
一个重要的例子
1 def add(a,b): 2 return a+b 3 4 def test(): 5 for r_i in range(4): 6 yield r_i 7 8 g=test() 9 for n in [2,10]: 10 g=(add(n,i) for i in g) 11 12 13 print(list(g))