生成器
如果创建一个有很多元素的列表,但是只需要访问前几个元素,后面的元素占着的空间就白白浪费了
在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。
在Python中,这种一边循环一边计算的机制,称为生成器:generator。
要创建一个generator,有很多种方法
第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:
L = [x * x for x in range(10)] g = (x * x for x in range(10)) print(L)# print(g)
可以直接打印出list的每一个元素,但怎么打印出generator的每一个元素
print(next(g)) print(next(g))
如果要一个一个打印出来,可以通过next()函数获得generator的下一个返回值:
generator保存的是算法,比如我要知道计算第四次的值,next要调用四次,这太麻烦了
for n in g: print(n)
如果要计算很多次,不断调用next实在是太变态了,正确的方法是使用for循环,generator也是可迭代对象,
如果某些算法用列表生成式的for循环无法实现,还可以用函数,比如著名的斐波拉契数列(Fibonacci)
def fib(max): n,a ,b = 0,0,1#n是用来控制迭代的次数 while n < max: yield b a,b = b,a+b n = n+1 return 'done'
如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
函数是顺序执行,遇到return语句或者最后一行函数语句就返回
在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,
返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行
def add(): print('step 1') yield 1 print('step 2') yield (3) print('step 3') yield (5)
在调用该generator时,首先要生成一个generator对象,然后用next()函数不断获得下一个返回值:
o = add() print(next(o)) print(next(o)) print(next(o))
通过next调用时,遇到yield就停下了,再次调用在中断的地方继续往下执行
for n in add(): print(n)
同样的,把函数改成generator后,基本上从来不会用next()来获取下一个返回值,而是直接使用for循环来迭代
要实验for需要把上面三次调用的代码删除,因为三次调用已经把函数全部执行完了,不会再去执行了。
但是用for循环调用generator时,发现拿不到generator的return语句的返回值
如果想要拿到返回值,必须捕获StopIteration错误,返回值包含在StopIteration的value中:
g = fib(6) while True: try: x = next(g) print('g:',x) except StopIteration as e: print('Generator return value:',e.value) break
generator的工作原理,它是在for循环的过程中不断计算出下一个元素,并在适当的条件结束for循环。对于函数改成的generator来说,遇到return语句或者执行到函数体最后一行语句,就是结束generator的指令,for循环随之结束
注意区分普通函数和generator函数,普通函数调用直接返回结果
generator函数的“调用”实际返回一个generator对象
迭代器
凡是可作用于for循环的对象都是Iterable类型;比如list,tuple,dict,set,str,generator等
判断是否为Iterable类型
from collections import Iterable print(isinstance([], Iterable))
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;
#直到最后抛出StopIteration错误表示无法继续返回下一个值了。
可以使用isinstance()判断一个对象是否是Iterator对象,生成器都是Iterator对象
from collections import Iterator print(isinstance((x for x in range(10)), Iterator))
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。
isinstance(iter([]), Iterator) isinstance(iter('abc'), Iterator) list=[1,2,3,4] it = iter(list) print(next(it)) print(next(it)) #迭代器也可以用常规for语句进行遍历 for x in it: print('当前计算:',x)#上面调用了两次,所以这边会接着上一次继续下去,只会打印两句,如果上面只 #调用一次,这里会调用三次
小结
凡是可作用于for循环的对象都是Iterable类型 可迭代对象
凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列
集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象
Python的for循环本质上就是通过不断调用next()函数实现的
比较使用list和generator保存斐波拉契数列运算结果的的区别
通过返回 List 能满足复用性的要求,但是当max函数运行占用的内存会随着max的增大而增大
def fab(max): n, a, b = 0, 0, 1 L = [] while n < max: L.append(b) a, b = b, a + b n = n + 1 return L for n in fab(5): print(n)
一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。
yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。
def fab(max): n, a, b = 0, 0, 1 while n < max: yield b # 使用 yield # print b a, b = b, a + b n = n + 1 for n in fab(5): print(n)