1.迭代器与生成器
2.装饰器
1.迭代器与生成器
迭代器
迭代是Python最强大的功能之一,是访问集合元素的一种方式。
迭代器是一个可以记住遍历的位置的对象。
迭代器对象从集合等第一个元素开始访问,直到所有的元素被访问结束,迭代器只能往前不会后退。
迭代器有两个基本的方法:iter()和next()
字符串,列表或元组对象都可以用于创建迭代器。
迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件
特点:
访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
不能随机访问集合中的某个值 ,只能从头到尾依次访问
访问到一半时不能往回退
便于循环比较大的数据集合,节省内存
>>> list = [1,2,3,4]
>>> it = iter(list) # 创建迭代器对象
>>> print(next(it)) # 输出迭代器的下一个元素
1
>>> print(next(it))
2
迭代器对象可以使用常规for语句进行遍历:
list=[1,2,3,4]
it = iter(list) # 创建迭代器对象
for x in it:
print (x)
执行以上程序,输出结果如下:
1
2
3
4
也可以使用 next() 函数:
import sys # 引入 sys 模块
list=[1,2,3,4]
it = iter(list) # 创建迭代器对象
while True:
try:
print (next(it))
except StopIteration:
sys.exit()
执行以上程序,输出结果如下:
1
2
3
4
凡是能够用for循环遍历的数据结构和对象统统可以称为可迭代的,即Iterable。我们现在接触到Iterable数据结构有list、tuple、dict、string、set,还有生成器generator(下面将讲到)。
但是,他们之间有什么区别呢?generator不但可以使用for循环,还可以被next()函数不断调用并返回下一个值,直到返回StopIteration错误。
能够被next()函数不断调用并返回下一个值的对象称为迭代器Iterator。generator是Iterable,同时也是一个Iterator;而list、tuple、str、dict不是Iterator。
当然,可以通过isinstance()判断一个对象是否为Iterator。
>>> from collections import Iterator
>>> isinstance((x*x for x in range(10)), Iterator)
True
>>> isinstance([],Iterator)
False
>>> isinstance({},Iterator)
False
>>> isinstance("ABC",Iterator)
False
如果想让list、tuple、str、dict等Iterable对象转变成Iterator,用iter()函数能够让Iterable对象变为Iterator
>>> isinstance(iter("ABC"),Iterator)
True
>>> i = iter("ABC")
>>> next(i)
'A'
>>> next(i)
'B'
>>> next(i)
'C'
Iterable和Iterator对象到底有什么区别呢?
实际上,python中Iterator对象表示的是一个数据流,Iterator对象可以被next()函数不断调用返回下一个值,直到数据全部被返回。Iterator对象数据流可以被看作是一个序列,但是这个序列的长度是不可提前预知的,因为只能通过next()或者for循环按照需要调用下一个数据,所以Iterator对象的计算是一种惰性计算。
正是因为这样的特性,Iterator可以表示一个无限大的数据流,譬如全体自然数,而list是无法完成这样的任务的。
列表生成式
在讲到生成器之前我们先来讲一下列表生成式
列表生成式,顾名思义,就是用来生成列表的。以前我们生成列表的时候,一般都是先定义一个list = [] ,再用for循环将元素一个一个append到list中。
简单列表的生成,可以使用list(range(1,100)),那么如果需要生成[1*1,2*2,3*3....]呢?
>>> [x*x for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
同时,还可以添加一些更多的要素,判断使用符合要求的x参与计算。
>>> [x*x for x in range(10) if x%2==0]
[0, 4, 16, 36, 64]
使用多重循环还可以生成全排列
>>> [x+y for x in 'ABC' for y in 'LMN']
['AL', 'AM', 'AN', 'BL', 'BM', 'BN', 'CL', 'CM', 'CN']
>>>
>>> [x+y+z for x in 'ABC' for y in 'LMN' for z in 'OPQ' if z=='Q']
['ALQ', 'AMQ', 'ANQ', 'BLQ', 'BMQ', 'BNQ', 'CLQ', 'CMQ', 'CNQ']
生成器
通过列表生成器,我们可以创造一个列表。但是,受到内存容量的限制,列表的容量肯定是有限的,如若我们只需要使用列表中的一部分,就不需要一下子生成很大的列表,直接按需生成就好了,列表生成器就提供了这样的功能。
生成器相当于是一个生成列表元素的算法,有了这个算法,就不用一下子生成很多元素了,只需要在需要的时候生成就可以了,节省了很多空间。在Python中,这种一边循环一遍计算的机制,称为:generator。
创建一个generator只需要把列表生成器的[]改成()就可以了。
>>> [x*x for x in range(10)]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> (x*x for x in range(10))
<generator object <genexpr> at 0x00000259A50BD308>
获取generator里面的元素,可以使用next()函数生成generator的下一个元素。
>>> g=(x*x for x in range(10))
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
.
.
.
>>> next(g)
81
>>> next(g)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
一直调用next()函数就可以遍历generator的所有元素,直到抛出StopIteration错误。
但是最常用的当然还是for循环,毕竟generator也是Iterator的对象。
>>> g=(x*x for x in range(5))
>>> for element in g:
... print(element)
...
0
1
4
9
16
一般我们创建一个generator后,基本上不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。
有时候,推算元素的算法很复杂,并不能通过列表生成器实现,而需要通过函数打印出来,譬如菲波那切数列。
#!/usr/bin/env python
def fib(Max):
n = 0
a,b = 0,1
while n < Max:
print(b)
a,b = b,a+b
n = n + 1
fib(5)
结果:
1
1
2
3
5
在Python中,使用了yield的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中,每次遇到yield时函数会暂停并保存当前所有灯运行信息,返回yield的值。并在下一次执行next()方法时从当前位置继续运行。
#!/usr/bin/env python
def fib(Max):
n = 0
a,b = 0,1
while n < Max:
yield b
a,b = b,a+b
n = n + 1
g = fib(5)
print(next(g))
print(next(g))
for i in g:
print(i)
结果:
1
1
2
3
5
在函数的执行过程中,遇到return才会返回,但是变成了generator的函数,遇到了yield就会中断,并且返回yield的参数。
那么,遇到了yield就会中断并返回,我们能不能通过yield传一些参数进去呢?
#!/usr/bin/env python
def fib(Max):
n = 0
a,b = 0,1
while n < Max:
e = yield b
print(e)
a,b = b,a+b
n = n + 1
g = fib(5)
print(next(g))
print(next(g))
print(g.send("the third element"))
print(g.send("forth"))
结果:
1
None
1
the third element
2
forth
3
在上面的generator定义中,使用了e = yield b语句,这样遇到yield返回b的同时,还能够通过g.send(arg)传入一个参数赋值给e,这样,就可以通过generator进行参数传递了。
>>> def fib(Max):
... n = 0
... a,b = 0,1
... while n < Max:
... e = yield b
... print(e)
... a,b = b,a+b
... n = n + 1
...
>>> g = fib(5)
>>> g.send("the first element")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: can't send non-None value to a just-started generator
>>> g.send(None)
1
注意,看上面的代码,为什么会报错?说明启动一个generator的时候,只能传入None作为参数,而generator就相当于next(g)!
2.装饰器
原则:
1、不能修改被装饰函数的源代码。
2、不能修改被装饰函数的调用方式。
3、不能改变被装饰函数的执行结果。
装饰器对被装饰函数是透明的。
如何理解装饰器
1、函数即“变量”
2、高阶函数
a:把一个函数名作为实参传递给另外一个函数
b:返回值中包含函数名
3、嵌套函数
在一个函数体内声明另一个函数称为函数的嵌套
参考链接:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318435599930270c0381a3b44db991cd6d858064ac0000
装饰器(decorator)是一种高级的Python语法。装饰器可以对一个函数,方法或者类加工。
由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。
>>> def now():
... print('2017-05-01')
...
>>> f = now
>>> f()
2017-05-01
函数对象有一个__name__属性,可以拿到函数的名字:
>>> now.__name__
'now'
>>> f.__name__
'now'
现在,假设我们要增强now()函数的功能。比如,在函数调用前后自动打印日志,但是又不希望修改now()函数的定义,这种在代码运行期间动态增加功能的方式,就称之为:装饰器(decorator)。
本质上,decorator就是一个返回函数的高阶函数。所以,我们要定义一个能打印日志的decorator,可以定义如下:
def log(func):
def wrapper(*args, **kwargs):
print("call %s():" % func.__name__)
return func(*args, **kwargs)
return wrapper
观察上面的log,因为它是一个decorator,所以接受一个函数作为参数,并返回一个函数。我们要借助Python的@语法,吧decorator置于函数的定义处:
@log # 把这句放在这儿就相当于执行了 now = log(now)
def now():
print("2017-05-01")
调用now()函数,不仅会运行now()函数本身,还会运行now()函数前打印一行日志:
>>> now()
call now():
2017-05-01
把@log放在now()函数的定义处,就相当于执行了语句:
now = log( now )
由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。
如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本:
>>> def log(text):
... def decorator(func):
... def wrapper(*args, **kwargs):
... print("%s %s():" % (text, func.__name__))
... return func(*args, **kwargs)
... return wrapper
... return decorator
...
>>> @log("execute")
... def now():
... print("2017-05-01")
...
>>> now()
execute now():
2017-05-01
和两层嵌套的decorator相比,3层嵌套的效果是这样的:
>>> now = log("execute")(now)
我们来剖析上面的语句,首先执行log('execute'),返回的是的decorator函数,在调用返回的函数,参数是now函数,返回值最终是wrapper函数。
以上两种decorator的定义都没有问题,但还差最后一步。因为我们讲了函数也是对象。它有__name__等属性,但你去看经过decorator装饰之后的函数,它们的__name__已经从原来的'now'变成了'wrapper':
>>> now.__name__
'wrapper'
因为返回的那个wrapper()函数名字就是'wrapper',所以,需要把原始函数的__name__等属性复制到wrapper()函数中,否则,有些依赖函数签名的代码执行就会出错。
不需要编写wrapper.__name__ = func.__name__这样的代码,Python内置的functools.wraps就是干这个事的,所以,一个完整的decorator的写法如下:
import functools
def log(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
@log("execute")
def now():
print("2017-05-01")
now()
或者针对带参数的decorator:
import functools
def log(text):
def decorator(func):
@functools.wraps(func)
def wrapper(*args, **kwargs):
print("%s %s():" % (text, func.__name__))
return func(*args, **kwargs)
return wrapper
return decorator
@log("execute")
def now():
print("2017-05-01")
now()
装饰器小结:
在面向对象(OOP)的设计模式中,decorator被称为装饰模式。OOP的装饰模式需要通过继承和组合来实现,而Python除了能支持OOP的decorator外,直接从语法层次支持decorator(面向对象后面学到)。Python的decorator可以用函数实现,也可以用类实现。
decorator可以增强函数的功能,定义起来虽然有点复杂,但使用起来非常灵活和方便。