• 生成器和各种推导式


    昨日回顾

    1. 函数名 -> 第一类对象
            函数名就是变量名.
            函数可以赋值
            函数可以作为集合类的元素
            函数可以作为参数传递
            函数可以作为返回值返回
        2. 闭包
            语法: 内层函数对外层函数的局部变量的使用
            def wrapper():
                name = ""
                def inner():
                    return name
                return inner
    
            如何查看一个函数是否是闭包
            函数名.__closure__  有值就是闭包. None就不是闭包
    
            优点:
                1. 保护变量不被侵害 (javascript)
                2. 可以让一个变量常驻内存
    
        3. 迭代器
            在数据中包含了__iter__是一个可迭代对象.
            for循环内部
    
            it = lst.__iter__()
            while 1:
                try:
                    it.__next__()
                except StopIteration:
                    break
    
            特点:
                1. 节省内存
                2. 惰性机制
                3. 只能向前, 不能反复
    
            意义: 统一数据类型的遍历工作
    
            官方查看xxx是迭代器, 可迭代对象
            from collections import Iterable, Iterator
    
            isinstance(对象, Iterable)
            isinstance(对象, Iterator)
    
            迭代器一定可迭代   ->   for循环
            可迭代的不一定是迭代器
    View Code

    今日内容

    1. 生成器
            本质就是迭代器.
            一个一个的创建对象
            创建生成器的方式:
                1. 生成器函数
                2. 通过生成器表达式来获取生成器
                3. 类型转换(看不到)
        2. 生成器函数 (重点)
            生成器函数中包含 yield , 返回数据和return差不多.
            return会立即结束这个函数的执行
            yield 可以分段的执行一个函数
    
            生成器函数在执行的时候返回生成器. 而不是直接执行此函数
    
            能向下执行的两个条件:
                __next__(), 执行到下一个yield
                send(), 执行到下一个yield, 给上一个yield位置传值
    
            所有的生成器都是迭代器都可以直接使用for循环
            都可以使用list()函数来获取到生成器内所有的数据
    
            生成器(##每次调用生成器函数就创建了一个生成器)中记录的是代码而不是函数的运行
            def func():
                print("我的天哪 ")
                yield "宝宝"
    
            △(理解记忆) gen = func() # 创建生成器.  此时运行会把生成器函数中的代码记录在内存,当执行到__next__(),
             运行此空间中的代码, 运行到yield结束.
    
            优点: 节省内存, 生成器本身就是代码. 几乎不占用内存
            特点: 惰性机制, 只能向前. 不能反复
    
        3. 各种推导式 (诡异)
            列表推导式  [结果 for循环 if]
            字典推导式 {结果(k:v) for循环 if}
            集合推导式 {结果(k) for循环 if}
    
    
    
        4. 生成器表达式 (重点)
            (结果 for循环 if)
            老师讲的所谓的与生成器函数相比  生成器表达式是一次性的.是指生成器函数通过gen = func()创建生成器 之后可以反复的调用生成器,
    而生成器表达式一次执行完之后,下次执行还要重新写一次.

    一.生成器

    什么是生成器.生成器实质就是迭代器.
    在python中有三种方式来获取生成器:
      1.通过生成器函数
      2.通过各种推导式来实现生成器
      3.通过数据的转换也可以获取生成器


    首先,我们先看一个很简单的函数:

    def func():
        print("111")
        return 222
    
    ret = func()
    print(ret)
    
    结果:
    111
    222

    将函数中的return换成yield就是生成器

    def func() :
        print("111")
        yield 222
    
    ret = func()
    print(ret)
    
    结果:
    <generator object func at 0x10567ff68>

    运行的结果和_上面不一样. 为什么呢.由于函数中存在了yield.那么这个函数就是一个生成器函数.这个时候.我们再执行这个函数的时候.就不再是函数的执行了.而是获取这个生成器.如何使用呢?想想迭代器.生成器的本质是迭代器.所以.我们可以直接执行__next__()来执行以下生成器.

    def func():
        printC111")
        yield 222
    
    gener = func() # 这个时候函数不会执行,而是获取到生成器
    ret = gener.__next___ () # 这个时候函数才会执行,yield的作用和return- 样,也是返回数据
    
    print(ret)
    结果:
    111
    222

    那么我们可以看到, yield和return的效果是-样的.有什么区别呢? yield是分段来执行一个函数. return呢?直接停止执行函数.

    def func():
        print("111")
        yield 222
        print("333")
        yield 444
    
    gener = func()
    ret = gener.__next__()
    print(ret)
    ret2 = gener.__next__()
    print(ret2)
    ret3 = gener.__next__() # 最后一个yield执行完毕,再次__next__()程序报错, 也就是说,和return无关了
    print(ret3)
    
    结果:
    111
    Traceback (most recent call last):
    222
    333
    File "/Users/sylar/PycharmProjects/oldboy/iterator.py", line 55, in <module>
    444
    ret3 = gener.__ .next__ .(0) # 最后一个yield执行完毕,再次__next__()程序报错, 也就是说,和return无关了
    StopIteration

    当程序运行完最后一个yield.那么后面继续进行__next__()程序会报错.
    好了生成器说完了.生成器有什么作用呢?我们来看这样一个需求. 老男孩向JACK JONES订购10000套学生服. JACK JONES就比较实在.直接造出来10000套衣服.

    def cloth():
        lst =[]
        for i in range(0, 10000):
            lst. append("衣服" +str(i))
        return lst
    
    cl = cloth()    

    但是呢,问题来了.老男孩现在没有这么多学生啊.一次性给我这么多.我往哪里放啊.很尴尬啊.最好的效果是什么样呢?我要1套.你给我1套.一共1000套.是不是最完美的

    def cloth():
        for i in range(0, 10000):
            yield “衣服"+str(i)
    
    cl = cloth()
    print(cl.__next__())
    print(cl.__next__())
    print(cl.__next__())
    print(cl.__next__())

    区别:第一种是直接一次性全部拿出来,会很占用内存.第二种使用生成器,-次就-个,用多少生成多少.生成器是一个一个的指向下一个.不会回去,__next__()到哪, 指针就指到哪儿.下一次继续获取指针指向的值

    接下来我们来看send方法, send和__next__()一样都可以让生成器执行到下一个yield.

    def eat():
        print("我吃什么啊")
        a = yield "馒头"
        print("a=",a)
        b = yield “大饼”
        print("b=",b)
        c = yield “韭菜盒子”
        print("c=",c)
        yield "GAME OVER"
    
    gen = eat()#获取生成器
    ret1 = gen.__next__()
    print(ret1)
    ret2 = gen. send("胡辣汤")
    print(ret2)
    ret3 = gen. send("狗粮")
    print(ret3)
    ret4 = gen. send("猫粮")
    print(ret4)

    send和__next__()区别:
      1. send和next()都是让生成器向下走-次
      2. send可 以给上一个yield的位置传递值,不能给最后-个yield发送值. 在第一次执行生成器代码的时候不能使用send()


    生成器可以使用for循环来循环获取内部的元素:

    def func():
        print(111)
        yield 222
        print(333)
        yield 444
        print(555)
        yield 666
    
    gen = func()
    for i in gen:
        print(i)
    
    
    结果:
    111
    222
    333
    444
    555
    666

    二.列表推导式,生成器表达式以及其他推导式

    列表推导式

    首先我们先看一下这样的代码,给出一个列表,通过循环,向列表中添加1-14 :

    lst=[]
    for i in range(1,15):
        lst . append(i)
    print(lst)

    替换成列表推导式:

    lst = [i for i in range(1, 15)]
    print(lst)

    列表推导式是通过-行来构建你要的列表,列表推导式看起来代码简单.但是出现错误之后很难排查.

    列表推导式的常用写法:
      [结果 for 变量 in 可迭代对象]


    例.从python1期到python14期写入列表Ist:

    lst = ['python%s' % i for i in range(1,15)]
    print(lst)

    我们还可以对列表中的数据进行筛选

    筛选模式:
      [结果 for 变量 in 可迭代对象 if条件]

    #获取1-100内所有的偶数
    lst = [i for i in range(1, 100)  if i % 2 == 0]
    print(lst)

    生成器表达式

    生成器表达式和列表推导式的语法基本上是一样的.只是把[]替换成()

    gen = (i for i in range(10))
    print(gen)
    
    结果:
    <generator object <genexpr> at 0x106768f10>

    打印的结果就是一个生成器.我们可以使用for循环来循环这个生成器:

    gen = ("麻花藤我第%s次爱你”% i for i in range(10))
    for i in gen:
        print(i)

    生成器表达式也可以进行筛选:

    #获取1-100内能被3整除的数
    gen = (i for i in range(1,100) if i % 3 == 0)
    for num in gen:
        print(num)
    
    # 100以内能被3整除的数的平方
    gen=(i*i for i in range(100) if i % 3 == 0)
    for num in gen:
        print(num)
    
    #寻找名字中带有两个e的人的名字
    names = [['Tom', 'Billy', 'Jefferson', 'Andrew', 'Wesley', 'Steven' ,'Joe'],
    ['Alice', 'Jill', 'Ana', 'Wendy', 'Jennifer', 'Sherry',‘Eva']]
    
    #不用推导式和表达式
    result =[]
    for first in names:
        for name in first:
            if name.count("e") >= 2:
                result.append( name)
    print(result)
    #推导式
    gen = (name for first in names for name in first if name.count("e") >= 2)
    for name in gen:
        print(name)

    生成器表达式和列表推导式的区别:
      1.列表推导式比较耗内存. -次性加载.生成器表达式几乎不占用内存.使用的时候才分配和使用内存
      2.得到的值不- -样.列表推导式得到的是一个列表.生成器表达式获取的是一个生成器.


    举个栗子.
      同样-篮子鸡蛋. 列表推导式:直接拿到-篮子鸡蛋.生成器表达式:拿到-个老母鸡.需要鸡蛋就给你下鸡蛋.

    生成器的惰性机制:生成器只有在访问的时候才取值.说白了,你找他要他才给你值,不找他要,他是不会执行的.

    def func():
        print(111)
        yield 222
    
    g = func() #生成器g,没人要值,所以没有执行
    g1 = (i for i in g) #生成器g1. 但是g1的数据来源于g.没人要值,所以没有执行
    g2=(i for i in g1) #生成器g2.来源g1.没人要值,所以没有执行
    
    print(list(g)) # 获取g中的数据,这时func()才会被执行,打印111 .获取到222. g完毕.
    print(list(g1)) # 获取g1中的数据. g1的数据来源是g.但是g已经取完了。g1也就没有数据了
    print(list(g2)) # 和g1同理

    深坑==>生成器.要值得时候才拿值

    字典推导式:

    根据名字应该也能猜到.推到出来的是字典

    #把字典中的key和value互换
    dic = {'a': 1, 'b': '2'}
    new_ dic = {dic[key]: key for key in dic}
    print(new_ dic)
    
    #在以下list中,从lst1中获取的数据和lst2中相对应的位置的数据组成一个新字典
    lst1 = ['jay', 'jj''sylar']
    lst2 = ['周杰伦",'林俊杰’, '邱彦涛']
    dic = {lst1[i]: lst2[订] for i in range(len(lst1))}
    print(dic)

    集合推导式:

    集合推导式可以帮我们直接生成一个集合. 集合的特点:无序,不重复.所以集合推导式自带去重功能

    lst = [1, -1, 8, -8,12]
    #绝对值去重
    s = {abs(i) for i in lst}
    print(s)

    总结:推导式有,列表推导式,字典推导式,集合推导式,没有元组推导式
      生成器表达式: (结果 for 变量 in 可迭代对象 if条件筛选)
      生成器表达式可以直接获取到生成器对象.生成器对象可以直接进行for循环.生成器具有惰性机制.

    经典面试题

    一个面试题.难度系数0000000颗星:

    def add(a, b): 
        return a + b
    
    def test():
        for i in range(4):
            yield i
    
    
    g = test()
    
    for n in [2, 10]:
        g=(add(n,i) for i in g)
    
    print(list(g))

    友情提示:惰性机制,不到最后不会拿值
    这个题要先读一下. 然后自己分析出结果.最后用机器跑一下

    # 生成器经典题
    def add(a, b): # 相加
        return a + b
    
    def test(): # 生成器函数 0  1   2  3
        for i in range(4):
            yield i
    
    g = test()  # 创建生成器
    
    for n in [2, 10]:
        g = (add(n, i) for i in g)
    
    print(list(g))
    # 结果:[20,21,22,23]
    # 解题思路:惰性机制(#有人要值才执行);生成器记录的是代码(#只有在执行的时候才会带入变量的值)
    # 1,拆分for循环
    n = 2
    g = (add(n, i) for i in g)
    n = 10
    g = (add(n, i) for i in g)
    # 2,将g = test()代入,并层层带入
    n = 2
    g = (add(n, i) for i in test())
    n = 10
    g = (add(n, i) for i in (add(n, i) for i in test()))
    # 3,拿值的时候带入变量的值去执行
    print(list(g))  # 拿值list==>for==>__next__()
    # 此时的
    g = (add(n, i) for i in (add(n, i) for i in test()))
    # 代入变量的值
    # n = 10
    # test()的取值范围是[0,1,2,3]
    # 所以
    # list(g) == [(add(10, i) for i in (add(10, i) for i in [0,1,2,3]))]==10*2+[0,1,2,3]
    #         == [(add(10, i) for i in [10,11,12,13]]
    #         == [20,21,22,23]
    
    
    # 小结规律:
    # test()的取值范围是初始范围
    # 要拿值时候的n的值是要带入的值
    # for循环决定循环的次数,循环几次就累加几次,也就是要加几个n的值
    
    
    # 改变1
    def add(a, b): # 相加
        return a + b
    
    def test(): # 生成器函数 0  1   2  3
        for i in range(4):
            yield i
    
    g = test()  # 创建生成器
    
    for n in [2, 10]:
        g = (add(n, i) for i in g)
    n = 5
    
    print(list(g))
    # 结果:[10,11,12,13]
    # 解题思路同上,最终拿到
    # g = (add(n, i) for i in (add(n, i) for i in test()))
    # 而此时n=5,带入得到 5*2+[0,1,2,3]=[10,11,12,13]
    
    
    
    # 改变2
    def add(a, b): # 相加
        return a + b
    
    def test(): # 生成器函数 0  1   2  3
        for i in range(4):
            yield i
    
    g = test()  # 创建生成器
    
    for n in [2, 10, 5]:
        g = (add(n, i) for i in g)
    
    
    print(list(g))
    
    # 解题思路同上,最终拿到
    n = 2
    g = (add(n, i) for i in g)
    n = 10
    g = (add(n, i) for i in g)
    n = 5
    g = (add(n, i) for i in g)
    
    
    # 层层代入得到:
    n = 2
    g = (add(n, i) for i in test())
    n = 10
    g = (add(n, i) for i in (add(n, i) for i in test()))
    n = 5
    g = (add(n, i) for i in (add(n, i) for i in (add(n, i) for i in test())))
    # 代入数据得到:
    list(g) =  (add(5, i) for i in (add(5, i) for i in (add(5, i) for i in [0,1,2,3])))=5*3+[0,1,2,3]=[15,16,17,18]

    区别生成器表达式和列表生成式:

    def add(a, b):
        return a + b
    
    
    def test():
        # print("123")
        for i in range(4):#[0,1,2,3]
            yield i
    
    g = test()
    
    for n in [2, 10, 5]:
        # 第一种:生成器表达式
        # g = (add(n, i) for i in g)  # [15, 16, 17, 18]在生成器表达式内部的生成器或者生成器表达式是不会执行的,直到外部的生成器有人找它要值
        # 第二种:列表生成式,是会直接带入执行的
        g = [add(n, i) for i in g]  # [17, 18, 19, 20]
    #第一种:
    # 对for循环进行等价替换,全部代入n=5
    # g1 = (add(5, i) for i in g)  #g = test()= [0,1,2,3]
    # g2 = (add(5, i) for i in g1)
    # g3 = (add(5, i) for i in g2)
    #第二种:
    # 对for循环进行等价替换,分别代入n=2,10,5
    # g1 = (add(2, i) for i in g)  #g = test()= [0,1,2,3]
    # g2 = (add(10, i) for i in g1)
    # g3 = (add(5, i) for i in g2)
    
    
    
    print(list(g))

     

    今日作业

     

  • 相关阅读:
    【BZOJ 1455】罗马游戏
    【UR #2】树上GCD
    1067: [SCOI2007]降雨量
    1068: [SCOI2007]压缩
    1066: [SCOI2007]蜥蜴
    1065: [NOI2008]奥运物流
    1064: [Noi2008]假面舞会
    1063: [Noi2008]道路设计
    2329: [HNOI2011]括号修复
    2734: [HNOI2012]集合选数
  • 原文地址:https://www.cnblogs.com/lyfstorm/p/11247940.html
Copyright © 2020-2023  润新知