• python迭代器与生成器及yield


    一、迭代器(itertor)

    1.可迭代:

    在Python中如果一个对象有__iter__()方法或__getitem__()方法,则称这个对象是可迭代的(iterable)。
    其中__iter__()方法的作用是让对象可以用“for ... in...”方式来循环遍历,_getitem_()方法是让对象可以通过“实例名[index]”的方式访问实例中的元素。换句话说,两个条件只要满足一条,就可以说对象是可迭代的。

    python中的可迭代对象有:

    (1)序列:字符串、列表、元组
    (2)非序列:字典、文件
    (3)自定义类:用户自定义的类实现了__iter__()或__getitem__()方法的对象

    2.迭代器:

    在Python中如果一个对象有__iter__()方法和__next__()方法,则称这个对象是迭代器(Iterator);其中__iter__()方法是让对象可以用for ... in ...循环遍历,_next_()方法是让对象可以通过next(实例名)访问下一个元素。这两个方法必须同时具备,才能称之为迭代器。

    列表List、元组Tuple、字典Dictionary、字符串String等数据类型虽然是可迭代的,但都不是迭代器,因为他们都没有__next__()方法。

    from collections import Iterable,Iterator
    
    # 字符串、列表、元组、集合、字典都是可迭代对象
    print(isinstance('123',Iterable))   # True
    print(isinstance([1,2,3],Iterable))   # True
    print(isinstance((1,2,3),Iterable))   # True
    print(isinstance({1,2,3},Iterable))   # True
    print(isinstance({"one":1,"two":2,"three":3},Iterable))   # True
    
    # 字符串、列表、元组、集合、字典都不是迭代器
    print(isinstance('123',Iterator))   # False
    print(isinstance([1,2,3],Iterator))   # False
    print(isinstance((1,2,3),Iterator))   # False
    print(isinstance({1,2,3},Iterator))   # False
    print(isinstance({"one":1,"two":2,"three":3},Iterator))   # False
    

    3.总结:

    • 迭代器都是可迭代的,但可迭代的不一定是迭代器;可用for ... in ...循环的都是可迭代的,可用next()遍历的才是迭代器;
    • next()是单向的,一次只获取一个元素,获取到最后一个元素后停止;
    • 在可迭代的对象中提前存储了所有的元素,而迭代器是惰性的,只有迭代到了某个元素,该元素才会生成。

    4.延迟计算或惰性求值 (Lazy evaluation)

    迭代器不要求你事先准备好整个迭代过程中所有的元素。仅仅是在迭代至某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合。

    迭代之前元素可以是不存在的,迭代之后元素也可以被销毁,因此迭代器在处理大量数据甚至无限数据时具有加载数据快、占用内存小等优势。

    5.创建迭代器:

    (1)使用内建的工厂函数iter(iterable[, sentinel])

    iter()函数只传入一个参数时,参数必须为可迭代对象;当使用第二个参数sentinel(哨兵)时,第一个参数必须是一个可调用对象。

    当有第二个参数sentinel传入时,参数iterable应是一个可调用对象,这时候迭代器它会重复地调用第一个参数,当枚举到的值等于哨兵时,就会抛出异常StopIteration。

    s = "abcdefgh"
    iter1 = iter(s)
    print(isinstance(iter1,Iterator))   # True
    使用第二个参数的情况此处不描述了
    

    (2)自己写类,其中实现__iter__()方法和__next__()方法

    在__next__()方法中必须对迭代进行检查,超出范围则触发 StopIteration 异常。注意避免死循环。

    class MyIterator(object):
        def __init__(self, data):
            self.data = data
        def __iter__(self):
           return self
        def __next__(self):
            if self.data <= 20:
               self.data += 2
                return self.data
            else:
               raise StopIteration
    
    myIter = MyIterator(5)
    
    print(isinstance(myIter,Iterator))  # True
    print(next(myIter))     # 7
    print(next(myIter))     # 9
    print(next(myIter))     # 11
    ...
    

    二、生成器(generator)

    在Python中,不会一次性的生成所有的值,而是调用一次,生成一个值,再调用一次,生成下一个值。
    即生成器不会把结果保存在一个系列中,而是保存生成器的状态,在每次进行迭代时返回一个值,直到遇到StopIteration异常时结束。

    创建生成器的两种基本方法

    1.生成器表达式:

    通列表解析语法,在写列表生成式时,把[]换成()即可

    实例:

    # 列表生成式
    >>> l = [i for i in range(5)]
    >>> l
    [0, 1, 2, 3, 4]
    
    # 生成器表达式
    >>> g = (i for i in range(5))
    >>> g
    <generator object <genexpr> at 0x000001A5108D5938>
    >>> next(g)
    0
    >>> next(g)
    1
    >>> next(g)
    2
    

    2.生成器函数

    在 Python 中,使用了(一个或多个)yield语句的函数,就叫做生成器函数。

    解释器处理这种函数定义的时候将创建特殊的生成器函数对象,而不是普通的函数对象。调用生成器函数的时候,返回值就是一个生成器对象。它只能用于迭代操作,更简单点理解生成器就是一种迭代器。
    在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。

    实例:

    # 实现的斐波那契数列
    def fib_gen(n):
        f0, f1 = 0, 1
        for n in range(n):
            yield f0
            f0, f1 = f1, f0+f1
    
    print(fib_gen(5))   # <generator object fib_gen at 0x0000023A5BB78830>
    
    g = fib_gen(6)  # g就是一个生成器对象(也是一种迭代器)
    print(next(g))  # 0
    print(next(g))  # 1
    print(next(g))  # 1
    print(next(g))  # 2
    
    # 生成器是包含有__iter__()和__next__()方法的,所以可以直接使用for来迭代
    for x in fib_gen(5):
        print(x, end=', ')
    # 0, 1, 1, 2, 3, 
    

    2.1.yield 与 return

    在一个生成器中,如果没有return,则默认执行到函数完毕时返回StopIteration异常。

    >>> def gen():
    ...     for i in range(2)
    ...         yield 1
    ...
    >>> g=gen()
    >>> next(g)    #第一次调用next(g)时,会在执行完yield语句后挂起,此时程序并没有执行结束。
    0
    >>> next(g)    #第二次调用next(g),同样会在执行完yield语句后挂起,此时程序并没有执行结束。
    1
    >>> next(g)    #程序试图从yield语句的下一条语句开始执行,发现已经到了结尾,所以抛出StopIteration异常。
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    StopIteration
    >>>
    

    生成器函数有return,如果return语句没有返回值,则直接抛出StopIteration异常。如果return语句有返回值,那么这个返回值会成为抛出StopIteration异常的一个说明。

    >>> def ff():
    ...    for i in range(2):
    ...        yield i
    ...    return 'i finished.'
    ...
    >>> g = ff()
    >>> next(g)
    0
    >>> next(g)
    1
    >>> next(g)
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    StopIteration: i finished.
    

    2.2.yield from语法

    yield from 是在Python3.3才出现的语法。所以这个特性在Python2中是没有的。

    yield from 后面需要加的是可迭代对象,它可以是普通的可迭代对象,也可以是迭代器,甚至是生成器。

    yield from 主要用于生成器的嵌套,重点是帮我们自动处理内外层之间的异常问题。

    这种用法参考博客:深入理解yield from语法

    3.生成器支持的方法

    **① **generator.send(expr)

    启动新生成器或唤醒处于挂起状态的生成器,把参数expr的值传送给它,使之成为当时挂起的那个yield表达式的值。

    本操作导致generator继续执行到下一个yield表达式(或者语句),返回yield值。对新生成器调用send时参数只能是None,因为当时不存在等待值的yield表达式。

    def gen():
        value=0
        while True:
            receive=yield value
            if receive=='e':
                break
            value = 'i got: %s' % receive
    
    g=gen()
    print(g.send(None))   # 这里用next(g)也是一样
    print(g.send('aaa'))
    print(g.send(3))
    print(g.send('e'))
    

    执行流程:

    • 通过g.send(None)或者next(g)可以启动生成器函数,并执行到第一个yield语句结束的位置,yield value会输出初始值0。此时,执行完了yield语句,但是没有给receive赋值,因为执行完yield程序就处于挂起状态了,还没有来得急给receive赋值。

    • 通过g.send('aaa'),会传入值aaa作为yield表达式的值,然后继续执行程序,此时把yield表达式的值赋值给receive,然后计算出value的值,并回到while头部,执行yield value语句又暂停。此时yield value会输出"got: aaa",然后挂起。

    • 通过g.send(3),会重复第2步,最后输出结果为"got: 3"

    • 当我们g.send('e')时,程序会执行break然后推出循环,最后整个函数执行完毕,所以会得到StopIteration异常。

    最后的执行结果如下:

    0
    i got: aaa
      File "生成器.py", line 104, in <module>
    i got: 3
        print(g.send('e'))
    StopIteration
    

    ② :generator.close()

    手动关闭生成器函数,如果继续调用next()获取下一个值会直接抛出StopIteration异常。

    def gen():
        value=0
        while True:
            receive=yield value
            if receive=='e':
                break
            value = 'i got: %s' % receive
    
    g=gen()
    print(next(g))
    g.close()
    print(next(g))  # 继续调用抛出StopIteration异常
    

    ③ :generator.throw(type[,value[,traceback]])

    启动新生成器或唤醒处于挂起状态的生成器,在当时挂起的yield表达式(语句)处抛出type类型的异常,该异常可以附带value作为参数说明,还可以有相应的traceback对象。

    这个调用也返回generator生成器的下一个值,如果此时生成器退出或没有产生yield值,会抛出StopIteration异常。简单说,会抛出异常并结束程序,或者消耗掉一个yield值,或者在没有下一个yield的时候直接进行到程序的结尾。

    def gen():
        while True:
            try:
                yield 'normal value1'
                yield 'normal value 2'
                print('here')
            except ValueError:
                print('ValueError : ...... ')
            except TypeError as e:
                print('TypeError : ',e)
                break
    
    g=gen()
    print(next(g))
    print(g.throw(ValueError))
    print(next(g))
    print(g.throw(TypeError,'i raised a TypeError'))
    

    执行结果:

    normal value1
    Traceback (most recent call last):
    ValueError : ...... 
    normal value1
      File "生成器.py", line 121, in <module>
    normal value 2
        print(g.throw(TypeError,'i raised a TypeError'))
    TypeError :  i raised a TypeError
    StopIteration
  • 相关阅读:
    Mysql group_concat
    canvas toDataUrl 跨域问题
    Svg操作
    java 判断浏览器
    排序操作
    java 格式判断
    你真的了解 console 吗
    svg转换工具
    java图片缩放
    常见 银行贷款 名词
  • 原文地址:https://www.cnblogs.com/ChangAn223/p/10731104.html
Copyright © 2020-2023  润新知