• 【python】迭代器与生成器到底是什么?看完你就知道


    迭代器跟生成器,与上篇文章讲的装饰器一样,都是属于我的一个老大难问题。
    通常就是遇到的时候就去搜一下,结果在一大坨各种介绍博客中看了看,回头又忘记了。
    你是不是也是这样呢?

    俗话说:好记性不如烂笔头,虽然现在基本不咋用笔写字了,但是还是要好好整理下,起码以后我就不用搜了。

    如果现在给你一个列表list_a = [1, 2, 3, 4],让你去迭代它,相信大家都很熟悉,直接用for循环就完事儿,

    list_a = [1, 2, 3, 4]
    
    for i in list_a:
        print(i)
    

    运行

    1
    2
    3
    4
    [Finished in 0.1s]
    

    可以看到,for循环迭代了列表中的每一个元素,打印了出来。
    那么for循环背后都做了什么事情呢?

    一、 容器、可迭代对象、迭代器

    听起来陌生,但是你绝对熟悉的词儿。

    在python中,一切都是对象,对象的抽象是类,而对象的集合就是容器。

    使用python中常见的容器有很多,比如:列表list:[0, 1, 2]集合set:([0, 1, 2])字典dict:{0:0, 1:1, 2:2}以及元组tuple(0, 1, 2)
    这些都是多个元素集中在一起的单元,区别的是内部数据结构的实现方法。

    所有的容器都是可以迭代的,你可以用for循环去迭代上述的容器试试。

    那把一个个元素找出来,用到的就是迭代器。用iter()可以创建一个迭代器。

    迭代器提供一个next()方法,这个方法你每次调用的时候会给你返回下一个对象,或者StopIteration,也就是没有对象可以给你了。

    list_a = [1, 2, 3, 4]
    
    it = iter(list_a) # 创建迭代器
    
    print(next(it)) #调用next()
    print(next(it))
    print(next(it))
    print(next(it))
    print(next(it))
    

    运行结果,前4个print可以正常返回,第5个时候就出现StopIteration错误了,因为列表中4个元素已经返回完了。

    1
    2
    3
    4
    Traceback (most recent call last):
      File "D:练习demo_iterator.py", line 9, in <module>
        print(next(it))
    StopIteration
    [Finished in 0.1s with exit code 1]
    

    二、生成器

    什么是生成器?简单粗暴一点:生成器就是懒人版的迭代器。

    在上述的创建迭代器操作中,我们显然是做了一次性生成的操作,list_a = [1, 2, 3, 4],这4个元素一次性生成好,以供next()调用。

    但是生成出的这些元素都是会保存到内存中去,这只是4个元素,如果有上千万、上亿元素呢?
    我并不是第一时间要用到所有的元素,我只要在我调用next()的时候产生一个返回给我就好,那么这样一次性生成就会白白占用了大量的内存。

    生成器应运而生,当调用next()的时候,才会生成下一个变量。
    生成器的写法很简单,用小括号,比如把一个列表生成式括起来:(i for i in range(10000)),这样就初始化了一个生成器。

    print([i for i in range(10)])
    
    print(i for i in range(10))
    

    上面的时列表,下面的就是一个生成器了,区别就是[]()
    运行结果:

    [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
    <generator object <genexpr> at 0x033383A8>
    [Finished in 0.1s]
    

    yield关键字

    此外,函数也可以成为生成器,秘密就是yield关键字,比如:

    def gen():
        a = 0
        while a < 100:
            yield a
            a += 1
    
    test = gen()
    print(next(test))
    print(next(test))
    print(next(test))
    print(next(test))
    

    运行结果:

    0
    1
    2
    3
    [Finished in 0.1s]
    

    yield关键字,可以这样理解:当函数运行到这一行的时候,程序会从这里暂停,yield相当于return会返回,
    当下次迭代时候,则会从yield的下一行代码开始执行。

    所以,我调用了4次print,可以从0开始依次输出。

    从我工作中的使用场景出发的话,我在做一些自动化测试的时候,有些变量参数是不可以重复的,用迭代器来定义变量的生成规则,每次
    调用都会产生一个新的,就不会重复了。

  • 相关阅读:
    很难理解的三个设计模式
    设计模式思考(转)
    AOP
    CAP理论(摘)
    DDBS
    NoSql
    Enterprise Library 企业库
    padright padleft
    Process ProcessThread Thread
    053374
  • 原文地址:https://www.cnblogs.com/pingguo-softwaretesting/p/13522910.html
Copyright © 2020-2023  润新知