python中有一个非常有用的语法叫做生成器,所利用到的关键字就是yield。有效利用生成器这个工具可以有效地节约系统资源,避免不必要的内存占用。
一段代码
def test_dict_sort(): _dict = {'b':2,'c':1,'a':3} print('abcd') for x in [1,2,3]: a = yield x print('a:',a) print(sorted(_dict.items(), key = lambda x:x[1]))
if __name__ == '__main__': a = test_dict_sort() print("_main_", a) print(a.send(None)) #等价a.__next__(),第一次调用的时候send的参数必须为None print(a.send(1)) print(a.send(2)) # print(a.__next__())
输出结果:
_main_ <generator object test_dict_sort at 0x000000000567BFC0> abcd 1 a: 1 2 a: 2 3 a: None [('c', 1), ('b', 2), ('a', 3)]
这段代码很短,但是诠释了yield关键字的核心用法,即逐个生成。在这里获取了生成器产生的值,即1,2,3。分别由next函数和send()函数获得,这两个函数的区别我们后面会详细阐述。
关于__next__函数,这里先说明一下,我们可以利用__next__()这个函数持续获取符合test_dict_sort函数规则的数。这段代码如下所示:
sent函数
这里特别强调了sent函数,因为sent函数没有那么直观。__next__函数很好理解,就是从上一个终止点开始,到下一个yield结束,返回值就是yield表达式的值。
例如在初始的那段代码里:
def test_dict_sort(): _dict = {'b':2,'c':1,'a':3} print('abcd') for x in [1,2,3]: a = yield x print('a:',a) print(sorted(_dict.items(), key = lambda x:x[1]))
第一次调用__next__函数的时候,我们从test_dict_sort的起点开始,然后在yield处结束,需要注意的是,赋值语句不会调用,此处yield i和含义和return差不多。但是第二次调用__next__函数的时候,就会直接从上一个yield的结束处开始,也就是先执行赋值语句,然后输出字符串,进入下一个循环,直到下一个yield或者生成器结束再次看初始的那段代码,可以发现第二次调用的时候没有选择使用__next__函数,而是使用了一个sent()函数。这里就需要注意,sent()函数的用法和__next__函数不太一样。sent()函数只能从yield之后开始,到下一个yield结束。这也就意味着第一次调用必须使用__next__函数。
sent()函数最重要的作用在于它可以给yield对应的赋值语句赋值,比如上面那一段代码中的
a=yield x
如果调用__next()__函数,那么x=None。但是如果调用sent(1),那么a=1。除了上述将的两个特征以外,sent和next并没有什么区别,sent函数也会返回yield表达式对应的值
心得:
阅读别人的python源码时碰到了这个yield这个关键字,各种搜索终于搞懂了,在此做一下总结:
1、通常的for...in...循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是mylist = [1, 2, 3],也可以是mylist = [x*x for x in range(3)]。
它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。
2、生成器是可以迭代的,但只可以读取它一次。因为用的时候才生成。比如 mygenerator = (x*x for x in range(3)),注意这里用到了(),它就不是数组,而上面的例子是[]。
3、我理解的生成器(generator)能够迭代的关键是它有一个next()方法,工作原理就是通过重复调用next()方法,直到捕获一个异常。可以用上面的mygenerator测试。
4、带有 yield 的函数不再是一个普通函数,而是一个生成器generator,可用于迭代,工作原理同上。
5、yield 是一个类似 return 的关键字,迭代一次遇到yield时就返回yield后面(右边)的值。重点是:下一次迭代时,从上一次迭代遇到的yield(yield相当于return )后面的代码(如果有赋值操作则将send传过来的参数赋值给变量)开始执行。
6、简要理解:yield就是 return 返回一个值,并且记住这个返回的位置,下次迭代就从这个位置后(如果有赋值操作则将send传过来的参数赋值给变量,否则执行下一行)开始。
7、带有yield的函数不仅仅只用于for循环中,而且可用于某个函数的参数,只要这个函数的参数允许迭代参数。比如array.extend函数,它的原型是array.extend(iterable)。
8、send(msg)与next()的区别在于send可以传递参数给yield表达式,这时传递的参数会作为yield表达式的值,而yield的参数是返回给调用者的值。——换句话说,就是send可以强行修改上一个yield表达式值。比如函数中有一个yield赋值,a = yield 5,第一次迭代到这里会返回5,a还没有赋值。第二次迭代时,使用.send(10),那么,就是强行修改yield 5表达式的值为10,本来是5的,那么a=10
9、send(msg)与next()都有返回值,它们的返回值是当前迭代遇到yield时,yield后面表达式的值,其实就是当前迭代中yield后面的参数。
10、第一次调用时必须先next()或send(None),否则会报错,send后之所以为None是因为这时候没有上一个yield(根据第8条)。可以认为,next()等同于send(None)。
Reference
1. https://www.cnblogs.com/zhenlingcn/p/8337788.html
2. https://blog.csdn.net/qq_36330643/article/details/78247070