• Python进阶【第八篇】迭代器和生成器


    一、何谓迭代

    如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。迭代是一个重复的过程,每次重复即一次迭代,并且每次迭代的结果都是下一次迭代的初始值。

    l=[1,2,3]
    count=0
    while count < len(l): #迭代
        print(l[count])
        count+=1
    

    在Python中,迭代是通过for ... in来完成的,

    对于字典这种数据类型,默认情况下,dict迭代的是key。如果要迭代value,可以用for value in d.values(),如果要同时迭代key和value,可以用for k, v in d.items()。
    由于字符串也是可迭代对象,因此,也可以作用于for循环。

    即:任何可迭代对象都可以作用于for循环,包括我们自定义的数据类型,只要符合迭代条件,就可以使用for循环。

    二、迭代器及迭代器对象

    1.什么是迭代器

    对于序列类型:字符串、列表、元组,我们可以使用索引的方式迭代取出其包含的元素。但对于字典、集合、文件等类型是没有索引的,若还想取出其内部包含的元素,则必须找出一种不依赖于索引的迭代方式,这就是迭代器。

    而可迭代对象指的是内置有__iter__方法的对象,即obj.__iter__,

    open('a.txt').__iter__#文件也是一种可迭代对象 
    

    可迭代对象执行obj.__iter__()得到的结果就是迭代器对象,

    文件类型是迭代器对象 
    open('a.txt').__iter__()
    open('a.txt').__next__() 
    

     而迭代器对象指的是既内置有__iter__又内置有__next__方法的对象。简单说,实现了迭代器协议的对象就是可迭代对象。(有点绕,慢慢读就能明白)

    l=[]1,2,3]
    iter_l=l._iter_()#有iter方法,说明是可迭代对象
    print(iter_l._next_())#调用next()方法,得到迭代器对象
    

     2.迭代器对象的使用

    dic={'a':1,'b':2,'c':3}
    iter_dic=dic.__iter__() #得到迭代器对象,迭代器对象即有__iter__又有__next__,但是:迭代器.__iter__()得到的仍然是迭代器本身
    iter_dic.__iter__() is iter_dic #True
    
    print(iter_dic.__next__()) #等同于next(iter_dic)
    print(iter_dic.__next__()) #等同于next(iter_dic)
    print(iter_dic.__next__()) #等同于next(iter_dic)
    # print(iter_dic.__next__()) #抛出异常StopIteration,或者说结束标志
    
    #有了迭代器,我们就可以不依赖索引迭代取值了
    iter_dic=dic.__iter__()
    while 1:
        try:
            k=next(iter_dic)
            print(dic[k])
        except StopIteration:
            break
    

     next方法,执行该方法要么返回迭代中的下一项,要么引起一个stoplteration异常,以终止迭代,迭代只能往后走,不能往前退。

    3.for循环的工作原理

    #基于for循环,我们可以完全不再依赖索引去取值了
    dic={'a':1,'b':2,'c':3}
    for k in dic:
        print(dic[k])
    
    #for循环的工作原理
    #1:执行in后对象的dic.__iter__()方法,得到一个迭代器对象iter_dic
    #2: 执行next(iter_dic),将得到的值赋值给k,然后执行循环体代码
    #3: 重复过程2,直到捕捉到异常StopIteration,结束循环
    

     三、生成器

    生成器的特征:只要函数内部包含有yield关键字,那么函数名()的到的结果就是生成器,并且不会执行函数内部代码,生成器就是迭代器

    与return相比,yield在同一个函数中可以有多个,作为返回值,可以返回多次值,可以挂起/保存函数的运行状态。生成器就是一种数据类型,自动实现了迭代器协议。

    def func():
        print('====>first')
        yield 1
        print('====>second')
        yield 2
        print('====>third')
        yield 3
        print('====>end')
    
    g=func()
    print(g) #<generator object func at 0x0000000002184360>
    

    三元表达式

    name=input('姓名>>: ')
    res='SB' if name == 'alex' else 'NB'
    print(res)
    

     主体由三部分组成,主体是if语句,if语句前面是布尔值为真的返回情况,后面是else语句。这就是一个典型的三元表达式,在Python中没有四元表达式。

    列表解析式

    egg_list=[]
    for i in range(10):
        egg_list.append('鸡蛋%s' %i)
    
    egg_list=['鸡蛋%s' %i for i in range(10)]
    

     把一个三元表达式放到一个列表中,最终结果也得到一个列表,就成了列表解析式。

     生成器表达式

    #1、把列表推导式的[]换成()就是生成器表达式
    
    #2、示例:生一筐鸡蛋变成给你一只老母鸡,用的时候就下蛋,这也是生成器的特性
    >>> chicken=('鸡蛋%s' %i for i in range(5))
    >>> chicken
    <generator object <genexpr> at 0x10143f200>
    >>> next(chicken)
    '鸡蛋0'
    >>> list(chicken) #因chicken可迭代,因而可以转成列表
    ['鸡蛋1', '鸡蛋2', '鸡蛋3', '鸡蛋4',]
    
    #3、优点:省内存,一次只产生一个值在内存中
    

    列表生成式,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。在Python中,我们可以使用生成器函数,一边循环一边计算,这样就不必创建完整的list,从而节省大量的空间。

  • 相关阅读:
    linux系统调整磁盘分区
    Linux命令sort和uniq 的基本使用
    路由的执行优先级
    Linux命令xargs的使用
    wget命令的使用
    Linux环境下错误码及意义总结
    Linux下使用ip netns命令进行网口的隔离和配置ip地址
    MongoDB初始化创建管理员账户登录
    Python字符串的截取原理,下标的位置图示
    Python操作MongoDB查询时处理ObjectId
  • 原文地址:https://www.cnblogs.com/bep-feijin/p/8713636.html
Copyright © 2020-2023  润新知