• Python-各种结构解析以及生成器(列表解析,字典解析,集合解析,元组构成的生成器)


    1、列表解析:

      * 举例:生成一个列表,元素0-9,对每一个元素自增1后求平方返回新列表。

    1 test = [ (i + 1) ** 2 for i in range(10)]
    2 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
    3 
    4 
    5 test = []
    6 for i in range(10):
    7     test.append((i + 1) ** 2)
    8 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

      可以看出,是将一个for循环拉平,放到一个列表中。(不是简单的拉平!!)

      

      * 语法:  

      • [ 返回值 for 元素  in 可迭代带对象 if 条件 ]
      • 使用中括号 [] ,内部是for 循环 ,if条件语句可选
      • 返回一个列表

      * 列表解析式是一种语法糖

      • 编译器会优化,不会因为简写而影响效率,反而因优化提高了效率
      • 减少程序员工作量,减少出错
      • 简化了代码,但是可读性增强
     1 # newlist = [print(i,end='') for i in range(10)]
     2 print(newlist)
     3 # 0123456789[None, None, None, None, None, None, None, None, None, None]
     4 # print是打印,并不是解析式生成的值,只不过没循环一次,列表中追加一个None而已
     5 
     6 newlist = [] 
     7 for i in range(10):
     8     print(i, end='')
     9     newlist.append(None)
    10 print(newlist)
    11 
    12 #0123456789[None, None, None, None, None, None, None, None, None, None]
    13 
    14 
    15 # 获取10以内的偶数
    16 # lst = [ i for i in range(10) if not i % 2]
    17 # print(lst) # [0, 2, 4, 6, 8]
    18 # lst = [ i for i in range(10) if  i % 2 == 0]
    19 # print(lst) # [0, 2, 4, 6, 8]
     1 lst = [i for i in range(21) if not i % 2 if not i % 3]
     2 print(lst) # [0, 6, 12, 18]
     3 lst = [i for i in range(21) if  i % 2 == 0 if i % 3 == 0]
     4 print(lst) # [0, 6, 12, 18]
     5 
     6 lst = [i for i in range(21) if not i % 2 elif not i % 3]
     7 print(lst) # 这样是会抛SyntaxError异常
     8 
     9 
    10 lst = []
    11 for i in range(21):
    12     if i % 2 ==0:
    13         lst.append(i)
    14     elif i % 3 == 0:
    15         lst.append(i)
    16 print(lst)
    17 # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]
    18 首先,结果不满足,其次,如果有elif 同一层的语句,是不能写成如上的解析式的。
    19 
    20 lst = []
    21 for i in range(21):
    22     if i % 2 ==0 and i % 3 == 0:
    23         lst.append(i)
    24 print(lst) # [0, 6, 12, 18]
    25 
    26 #-------->
    27 
    28 lst = [ i for i in range(21) if not i % 2 and  i % 3 ==0]
    29 print(lst) # [0, 6, 12, 18]
    30 
    31 
    32 lst = [ i for i in range(21) if not i % 2 or  i % 3 ==0]
    33 print(lst) # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]
    举例
    1 lst = [i for i in range(21) if  i % 2 == 0 if i % 3 == 0] # 在第一个if下执行第二个if
    2 lst = [ i for i in range(21) if not i % 2 and  i % 3 ==0] # 直接将两个if 条件合并
    3 # 这两个是等价的

      注:循环条件都是一层一层的,第一层for下,执行第二层for,以此类推。

     1 t1 = [[x,y] for x in 'abced' for y in range(3)]
     2 print(t1)
     3 # [['a', 0], ['a', 1], ['a', 2], ['b', 0], ['b', 1], ['b', 2], ['c', 0], ['c', 1], ['c', 2], ['e', 0], ['e', 1], ['e', 2], ['d', 0], ['d', 1], ['d', 2]]
     4 
     5 t2 = [{x,y} for x in 'abced' for y in range(3)]
     6 print(t2) 
     7 # [{0, 'a'}, {1, 'a'}, {2, 'a'}, {0, 'b'}, {1, 'b'}, {2, 'b'}, {0, 'c'}, {1, 'c'}, {2, 'c'}, {0, 'e'}, {1, 'e'}, {2, 'e'}, {0, 'd'}, {1, 'd'}, {2, 'd'}]
     8 
     9 t2 = [{x:y} for x in 'abced' for y in range(3)]
    10 
    11 # [{'a': 0}, {'a': 1}, {'a': 2}, {'b': 0}, {'b': 1}, {'b': 2}, {'c': 0}, {'c': 1}, {'c': 2}, {'e': 0}, {'e': 1}, {'e': 2}, {'d': 0}, {'d': 1}, {'d': 2}]
    举例-陷阱
     1 t1 = [(i, j) for i in range(7) if i > 4 for j in range(20,25) if j > 23]
     2 print(t1) 
     3 # 相比下面的两种个,这个效率略有提高,先比较,在进入下一次循环,但是也没什么事
     4 
     5 t2 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 if j > 23]
     6 print(t2)
     7 
     8 t3 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 and j > 23]
     9 print(t3)
    10 
    11 # [(5, 24), (6, 24)]
    12 # [(5, 24), (6, 24)]
    13 # [(5, 24), (6, 24)]
    分析三种不同顺序的结果

      

      * 练习题:

         3、打印九九乘法表

         4、'0001.ababsdgcfe' 这样的id ,从0001 - 0100 

     1 lst = [i **2 for i in range(1, 11)]
     2 
     3 
     4 lst = [1,2,3,4,5]
     5 newlist = [lst[i] + lst[i + 1]  for i in range(len(lst) - 1)]
     6 print(newlist) # [3, 5, 7, 9]
     7 
     8 
     9 cf = [ print('{}*{}={:<2}'.format(j, i, i * j), end='
    ' if i == j else ' ') for i in range(1, 10) for j in range(1, i + 1)]
    10 
    11 print(cf)
    12 
    13 print('
    '.join([' '.join(['{}*{}={:<2}'.format(j, i, i * j)  for j in range(1, i + 1)] ) for i in range(1, 10) ]))
    14 
    15 import random
    16 alpha = bytes(range(97,122)).decode()
    17 
    18 # lst = ['{:04}.{}'.format(i,''.join([random.choice(alpha) for _ in range(10)])) for i in range(1, 101)]
    19 # print(lst)
    20 
    21 l = random.choices(alpha,k = 10) #  ['u', 't', 'h', 'x', 'v', 'g', 'c', 'p', 'l', 'n']
    22 s1 = ''.join(l)
    23 
    24 l = ''.join(random.sample(alpha,10)) # 如果用sample的话,就没有重复的字母,上面的choice 或choices是有重复字母的可能性的
    25 print(l)
    program
     1 1*1=1 
     2 1*2=2  2*2=4 
     3 1*3=3  2*3=6  3*3=9 
     4 1*4=4  2*4=8  3*4=12 4*4=16
     5 1*5=5  2*5=10 3*5=15 4*5=20 5*5=25
     6 1*6=6  2*6=12 3*6=18 4*6=24 5*6=30 6*6=36
     7 1*7=7  2*7=14 3*7=21 4*7=28 5*7=35 6*7=42 7*7=49
     8 1*8=8  2*8=16 3*8=24 4*8=32 5*8=40 6*8=48 7*8=56 8*8=64
     9 1*9=9  2*9=18 3*9=27 4*9=36 5*9=45 6*9=54 7*9=63 8*9=72 9*9=81
    10 
    11 
    12 ['0001.lkbjmbfcwj', '0002.ciebvklpie', '0003.sjwtcakjjk', '0004.kuiivvfoai', '0005.ymaetkbdrt', '0006.ayhlrgedoh', '0007.xdjnaysdct', '0008.qkakrtdebv', '0009.jytyhtnwkc', '0010.rbxkiuetev', '0011.plhdxcdyvq', '0012.ubkudcrisb', '0013.yoceaqjvna', '0014.aeirhriutw', '0015.yemotxgfin', '0016.tehmlunsgy', '0017.seobircuxq', '0018.nxofutxipl', '0019.lbtmvkrhnj', '0020.rowntjaqpp', '0021.oadngppkty', '0022.ftdeifipph', '0023.fwuxgxgovt', '0024.bjnaxoqsxd', '0025.jhkjanttrr', '0026.eoutbjinyq', '0027.agdidptkcu', '0028.ccofruyutd', '0029.suchksvbva', '0030.ucvrshekrf', '0031.qikrlpilqi', '0032.ffdfqosxnh', '0033.jtotgqsdgm', '0034.jxssbjnclg', '0035.qandynxfat', '0036.ygodstktip', '0037.qklhxypdba', '0038.vlghicldkp', '0039.jbpyieqxkc', '0040.dcybelgsew', '0041.bumewnipnp', '0042.koqdtxfain', '0043.wpjdhnduah', '0044.vledqpcnpd', '0045.bkjisgagaj', '0046.ymdthjiphw', '0047.avqxthoilm', '0048.wsxtulxfnl', '0049.tmvdcqovcf', '0050.jcfnuaqfob', '0051.tpptnvysyv', '0052.bsmfywydnw', '0053.ivqotuhhgp', '0054.nfryeqntta', '0055.eyoxwwtuhl', '0056.hgtnxluwqy', '0057.buabekigsu', '0058.dxbflmyknn', '0059.bibmwmoitm', '0060.mmbyibfeeg', '0061.ulythfirrd', '0062.rnamiseafs', '0063.abpbtceqpd', '0064.fawoscqiub', '0065.aunqntadxh', '0066.owavtvxdrq', '0067.ahnioayayy', '0068.ojbuyqvmxf', '0069.svbqsppkes', '0070.ncqojtdtlg', '0071.hmbtvsuwah', '0072.iwqykfsisp', '0073.fymolgcbnh', '0074.txhnidqufy', '0075.icmhrnifjx', '0076.dvctqrjyhe', '0077.nqncmelbys', '0078.gbaqnpaxyy', '0079.gfirdjcrao', '0080.qcguhuqdwk', '0081.kuqellfomi', '0082.kpltlguvcc', '0083.lfeserogau', '0084.imgwnglrob', '0085.dvtcjupmmk', '0086.evswireebh', '0087.tlbordvirb', '0088.eleixowhur', '0089.mvpwqiottn', '0090.iokdlfvipt', '0091.tqeuiulywc', '0092.twrfdissos', '0093.ylbtevnroy', '0094.uvtifqqdny', '0095.kxrhorowny', '0096.qcygokxvys', '0097.gvlufbmctq', '0098.jmqgjidgxv', '0099.gxvbreoimr', '0100.ljjjoelvna']
    answer

    2、生成器表达式:

      定义:

        生成器就是迭代器,可以理解为一种数据类型,这种数据类型实现了迭代器协议,其他的数据类型需要调用自己内置的__iter_方法,所以生成器就是可迭代对象。

      生成器分类以及在Python中的表现形式:(Python有两种不同的方式提供生成器)

        ①生成器函数:常规函数定义,但是,使用yield 语句代替return语句,但是,yield在同一层函数中,可以多次使用,一次返回一个结果,返回一个结果后,将函数设置为挂起状态,以便下次从他离开的地方继续执行。

        ②生成器表达式:类似于列表的推导,但是生成器返回按需产生结果的一个对象,而不是一次性构建一个结果列表。

      语法:

      • (返回值 for 元素 in 可迭代对象 if 条件)
      • 列表解析式的中括号换成小括号
      • 返回一个生成器 

      和列表解析式的区别:

      • 生成器表达式是按需计算(或惰性求值,延迟计算)需要的时候才算值。
      • 列表解析式是立即返回值

      生成器:

      • 可迭代对象
      • 迭代器

      举例:    

     1 g = ('{:04}'.format(i) for i in range(1,11))
     2 print(g)
     3 
     4 a = next(g)
     5 
     6 for i in g:
     7     print('i',i)
     8 print('------------------')
     9 for j in g:
    10     print('j',j)
    11 
    12 结果:
    13 # 可以看出g 是一个生成器对象 generator
    14 # next(g) 表示地址指针向下走一步
    15 # 第一个for循环就将g 迭代完了
    16 # 所以第二个for就没法往下进行迭代
    17 # 因为生成器是无法向列表那样,一致迭代,当地址指针到了最后一个后,用next() 再迭代会报错
    18 <generator object <genexpr> at 0x0000000001D9D318>
    19 i 0002
    20 i 0003
    21 i 0004
    22 i 0005
    23 i 0006
    24 i 0007
    25 i 0008
    26 i 0009
    27 i 0010
    28 ------------------
     1 对比:列表解析式:
     2 
     3 g = ['{:04}'.format(i) for i in range(1,11)]
     4 print(g)
     5 
     6 
     7 
     8 for i in g:
     9     print('i',i)
    10 print('------------------')
    11 for j in g:
    12     print('j',j)
    13 
    14 
    15 ['0001', '0002', '0003', '0004', '0005', '0006', '0007', '0008', '0009', '0010']
    16 i 0001
    17 i 0002
    18 i 0003
    19 i 0004
    20 i 0005
    21 i 0006
    22 i 0007
    23 i 0008
    24 i 0009
    25 i 0010
    26 ------------------
    27 j 0001
    28 j 0002
    29 j 0003
    30 j 0004
    31 j 0005
    32 j 0006
    33 j 0007
    34 j 0008
    35 j 0009
    36 j 0010

          总结:

            生成器,延迟计算(惰性求值),返回迭代器,可以迭代,从前往后走一遍,不能回头。

            列表解析式:立即求值,返回的不是迭代器,是可迭代对象,从前往后走一遍后,可以回头

       注:

     1 it = (print('{}'.format(i + 1)) for i in range(2))
     2 
     3 first = next(it)
     4 
     5 second = next(it)
     6 
     7 val = first + second
     8 
     9 1
    10 2
    11 --------------------------------------------------------------------------
    12 TypeError                                Traceback (most recent call last)
    13 <ipython-input-10-8a69cb4a56e0> in <module>()
    14       5 second = next(it)
    15       6 
    16 ----> 7 val = first + second
    17 
    18 TypeError: unsupported operand type(s) for +: 'NoneType' and 'NoneType'
    19 
    20 
    21 # 事实上,it 生成器(generator)里边是None,print 是打印,
    22 # 所以每次next(it) 的时候,要执行一次print(...),同时将None 赋值给变量
    1 it = (x for x in range(10) if x %2)
    2 first = next(it)
    3 second = next(it)
    4 val = first + second
    5 print(val) # 4
    例子

        生成器和列表解析式的对比:

        • 计算方式:
          • 生成器表达式延迟计算,列表解析式立即计算
        •  内存占用:
          • 单从返回值本身来说,生成器表达式省内存,列表解析式能返回新的列表
          • 生成器没有数据,内存占用极少,但是使用的时候,虽然一个个返回数据,但是合起来占用的内存也差不多
          • 列表解析式构造新的列表需要占用内存
        • 计算速度:
          • 单看计算时间看,生成器表达式好事非常短,列表解析式耗时长
          • 但是生成器本身并没有返回任何值,只返回一个生成器对象
          • 列表解析式构造并返回一个新的列表

        注:

          使用内建函数 iter() 可以将一个可迭代对象转换为一个生成器。iter([1,2,3])       

    1 b = iter(range(4))
    2 next(b) # 一直是0 ,因为每next一次,从新建一个生成器,所以一直在0的位置
    3 
    4 a = iter(range(4))
    5 for i in a :
    6     print(i) # 0,1,2,3,

          迭代器没有 len() 这个attribution 

    3、集合解析式 Python3.x新增

        语法:

        • { 返回值 for 元素 in 可迭代对象 if 条件}
        • 列表解析式的中括号,换位大括号
        • 立即返回一个集合              

        用法:

        • { (x, x + 1) for i in range(10) }
        • { [x] for x in range(10)} # 这个会报错,[x ] ,集合中 不能有不可hash的 

    4、字典解析:Python3 新增

        语法:

        • { 返回值 for 元素 in 可迭代对象 if 条件}
        • 使用 k-v 形式
        • 立即返回一个字典

        用法:       

     1 a = {x:(x, x + 1) for x in range(4)}
     2 print(a) # {0: (0, 1), 1: (1, 2), 2: (2, 3), 3: (3, 4)}
     3 b = {x:[x, x + 1] for x in range(4)}
     4 print(b) # {0: [0, 1], 1: [1, 2], 2: [2, 3], 3: [3, 4]}
     5 c = {(x,):[x, x + 1] for x in range(4)}
     6 print(c) # {(0,): [0, 1], (1,): [1, 2], (2,): [2, 3], (3,): [3, 4]}
     7 d = {[x]:[x, x + 1] for x in range(4)}
     8 print(d) # TypeError
     9 e = {chr(0x41 + x):x ** 2 for x in range(4)}
    10 print(e) # {'A': 0, 'B': 1, 'C': 4, 'D': 9}
    11 f = {str(x):y  for x in range(4) for y in range(3)}
    12 print(f) # {'0': 2, '1': 2, '2': 2, '3': 2}  覆盖
    13  
    test

    5、总结:

      ——生成器相对解析式而言,生成器主要节省了内存,事实上,效率上并没有明显的提高,所以一般只考虑内存问题就可以。

      ——Python2 映入列表解析式

      ——Python2.4 引入生成器表达式

      ——Python3 引入集合,字典解析式,并迁移到2.7

      ——一般来说,应该多用解析式,简短,高效,如果一个解析式非常复杂,要考虑拆解用for循环

      ——生成器和迭代器是不同的对象,但是都可迭代对象,迭代器可以用next()

        ——生成器是迭代器,迭代器不一定是生成器,  iter(range(4)) 不是生成器生成的

    为什么要坚持,想一想当初!
  • 相关阅读:
    无监督学习
    监督学习
    cmd
    oj1026
    oj1025
    使用虚函数的不同模式
    hdu1166:敌兵布阵(树状数组或线段树)
    传纸条(动态规划)
    SDUT 1266 出栈序列统计(卡特兰数)
    HDU 5063 Operation the Sequence
  • 原文地址:https://www.cnblogs.com/JerryZao/p/9490623.html
Copyright © 2020-2023  润新知