编者注:本文主要参考了《Python核心编程(第二版)》
说到生成器,先说说列表解析。列表解析可以动态创建列表。
[expr for iter_var in iterable if cond_expr]
该句的核心是 for循环,它迭代了iterable对象的所有条目。如果满足cond_expr(条件表达式),则前面的expr(表达式)应用于该成员。最后生成的是满足条件的元素的该表达式的列表。对于lambda,map(),filter()等可以通过列表解析简化为一个列表解析式。 首先看看这三个函数的作用:
map(lambda x:x**2, range(6)) >>>[0, 1, 4, 9, 16, 25]
lambda 输入参数:输出表达式 允许创建一行函数对象,不用def定义,简化代码
map(操作,需要操作的列表) 对所有列表成员应用一个操作
可以用列表解析来简化上面的操作:
[x**2 for x in range(6)] >>>[0, 1, 4, 9, 16, 25]
同样也可以用列表解析来简化filter()操作,比如:
seq = [11, 10, 1, 9, 10, 2, 3, 44, 12, 11] print filter(lambda x: x % 2, seq) >>>[11, 1, 9, 3, 11]
可以用列表解析来简化上面的操作:
print [x for x in seq if x % 2] >>>[11, 1, 9, 3, 11]
生成器是列表解析的一个拓展。
(expr for iter_var in iterable if cond_expr)
它与列表解析器非常相似,且语法基本相同,但不是真正创建列表而是生成一个生成器。这个生成器在每次计算出一个条目后,把这个条目“产生(yield)出来”,生成器表达式使用了“延迟计算(lazy evaluation)”,所以它使用内存上更有效。
print (x for x in seq if x % 2) >>><generator object <genexpr> at 0x00000000025B6AB0>
那到底什么时候使用生成器呢?
当创建列表只是一共中间过程的时候,为了避免创建庞大的列表,我们可以使用生成器表达式来完成。比如,我们要计算一篇txt文本的单词数时,我们没必要先将列表生成再计算单词数。
f = open('*.txt','r') len([word for line in f for word in line.split()]) #使用列表解析,先生成列表后计数 len(word for line in f for word in line.split()) #使用生成器,对返回的生成器计数,没有生成列表
所做的只是把方括号去掉,不但少了两个字节,更节省了内存。
这让我想起了使用xrange()代替range(),道理是一样的。xrange返回一个生成器,而range返回一个列表。