1、列表解析:
* 举例:生成一个列表,元素0-9,对每一个元素自增1后求平方返回新列表。
1 test = [ (i + 1) ** 2 for i in range(10)] 2 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] 3 4 5 test = [] 6 for i in range(10): 7 test.append((i + 1) ** 2) 8 print(test) # [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
可以看出,是将一个for循环拉平,放到一个列表中。(不是简单的拉平!!)
* 语法:
-
- [ 返回值 for 元素 in 可迭代带对象 if 条件 ]
-
- 使用中括号 [] ,内部是for 循环 ,if条件语句可选
- 返回一个列表
* 列表解析式是一种语法糖:
-
- 编译器会优化,不会因为简写而影响效率,反而因优化提高了效率
- 减少程序员工作量,减少出错
- 简化了代码,但是可读性增强
1 # newlist = [print(i,end='') for i in range(10)] 2 print(newlist) 3 # 0123456789[None, None, None, None, None, None, None, None, None, None] 4 # print是打印,并不是解析式生成的值,只不过没循环一次,列表中追加一个None而已 5 6 newlist = [] 7 for i in range(10): 8 print(i, end='') 9 newlist.append(None) 10 print(newlist) 11 12 #0123456789[None, None, None, None, None, None, None, None, None, None] 13 14 15 # 获取10以内的偶数 16 # lst = [ i for i in range(10) if not i % 2] 17 # print(lst) # [0, 2, 4, 6, 8] 18 # lst = [ i for i in range(10) if i % 2 == 0] 19 # print(lst) # [0, 2, 4, 6, 8]
1 lst = [i for i in range(21) if not i % 2 if not i % 3] 2 print(lst) # [0, 6, 12, 18] 3 lst = [i for i in range(21) if i % 2 == 0 if i % 3 == 0] 4 print(lst) # [0, 6, 12, 18] 5 6 lst = [i for i in range(21) if not i % 2 elif not i % 3] 7 print(lst) # 这样是会抛SyntaxError异常 8 9 10 lst = [] 11 for i in range(21): 12 if i % 2 ==0: 13 lst.append(i) 14 elif i % 3 == 0: 15 lst.append(i) 16 print(lst) 17 # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20] 18 首先,结果不满足,其次,如果有elif 同一层的语句,是不能写成如上的解析式的。 19 20 lst = [] 21 for i in range(21): 22 if i % 2 ==0 and i % 3 == 0: 23 lst.append(i) 24 print(lst) # [0, 6, 12, 18] 25 26 #--------> 27 28 lst = [ i for i in range(21) if not i % 2 and i % 3 ==0] 29 print(lst) # [0, 6, 12, 18] 30 31 32 lst = [ i for i in range(21) if not i % 2 or i % 3 ==0] 33 print(lst) # [0, 2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 18, 20]
1 lst = [i for i in range(21) if i % 2 == 0 if i % 3 == 0] # 在第一个if下执行第二个if 2 lst = [ i for i in range(21) if not i % 2 and i % 3 ==0] # 直接将两个if 条件合并 3 # 这两个是等价的
注:循环条件都是一层一层的,第一层for下,执行第二层for,以此类推。
1 t1 = [[x,y] for x in 'abced' for y in range(3)] 2 print(t1) 3 # [['a', 0], ['a', 1], ['a', 2], ['b', 0], ['b', 1], ['b', 2], ['c', 0], ['c', 1], ['c', 2], ['e', 0], ['e', 1], ['e', 2], ['d', 0], ['d', 1], ['d', 2]] 4 5 t2 = [{x,y} for x in 'abced' for y in range(3)] 6 print(t2) 7 # [{0, 'a'}, {1, 'a'}, {2, 'a'}, {0, 'b'}, {1, 'b'}, {2, 'b'}, {0, 'c'}, {1, 'c'}, {2, 'c'}, {0, 'e'}, {1, 'e'}, {2, 'e'}, {0, 'd'}, {1, 'd'}, {2, 'd'}] 8 9 t2 = [{x:y} for x in 'abced' for y in range(3)] 10 11 # [{'a': 0}, {'a': 1}, {'a': 2}, {'b': 0}, {'b': 1}, {'b': 2}, {'c': 0}, {'c': 1}, {'c': 2}, {'e': 0}, {'e': 1}, {'e': 2}, {'d': 0}, {'d': 1}, {'d': 2}]
1 t1 = [(i, j) for i in range(7) if i > 4 for j in range(20,25) if j > 23] 2 print(t1) 3 # 相比下面的两种个,这个效率略有提高,先比较,在进入下一次循环,但是也没什么事 4 5 t2 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 if j > 23] 6 print(t2) 7 8 t3 = [(i, j) for i in range(7) for j in range(20,25)if i > 4 and j > 23] 9 print(t3) 10 11 # [(5, 24), (6, 24)] 12 # [(5, 24), (6, 24)] 13 # [(5, 24), (6, 24)]
* 练习题:
3、打印九九乘法表
4、'0001.ababsdgcfe' 这样的id ,从0001 - 0100
1 lst = [i **2 for i in range(1, 11)] 2 3 4 lst = [1,2,3,4,5] 5 newlist = [lst[i] + lst[i + 1] for i in range(len(lst) - 1)] 6 print(newlist) # [3, 5, 7, 9] 7 8 9 cf = [ print('{}*{}={:<2}'.format(j, i, i * j), end=' ' if i == j else ' ') for i in range(1, 10) for j in range(1, i + 1)] 10 11 print(cf) 12 13 print(' '.join([' '.join(['{}*{}={:<2}'.format(j, i, i * j) for j in range(1, i + 1)] ) for i in range(1, 10) ])) 14 15 import random 16 alpha = bytes(range(97,122)).decode() 17 18 # lst = ['{:04}.{}'.format(i,''.join([random.choice(alpha) for _ in range(10)])) for i in range(1, 101)] 19 # print(lst) 20 21 l = random.choices(alpha,k = 10) # ['u', 't', 'h', 'x', 'v', 'g', 'c', 'p', 'l', 'n'] 22 s1 = ''.join(l) 23 24 l = ''.join(random.sample(alpha,10)) # 如果用sample的话,就没有重复的字母,上面的choice 或choices是有重复字母的可能性的 25 print(l)
1 1*1=1 2 1*2=2 2*2=4 3 1*3=3 2*3=6 3*3=9 4 1*4=4 2*4=8 3*4=12 4*4=16 5 1*5=5 2*5=10 3*5=15 4*5=20 5*5=25 6 1*6=6 2*6=12 3*6=18 4*6=24 5*6=30 6*6=36 7 1*7=7 2*7=14 3*7=21 4*7=28 5*7=35 6*7=42 7*7=49 8 1*8=8 2*8=16 3*8=24 4*8=32 5*8=40 6*8=48 7*8=56 8*8=64 9 1*9=9 2*9=18 3*9=27 4*9=36 5*9=45 6*9=54 7*9=63 8*9=72 9*9=81 10 11 12 ['0001.lkbjmbfcwj', '0002.ciebvklpie', '0003.sjwtcakjjk', '0004.kuiivvfoai', '0005.ymaetkbdrt', '0006.ayhlrgedoh', '0007.xdjnaysdct', '0008.qkakrtdebv', '0009.jytyhtnwkc', '0010.rbxkiuetev', '0011.plhdxcdyvq', '0012.ubkudcrisb', '0013.yoceaqjvna', '0014.aeirhriutw', '0015.yemotxgfin', '0016.tehmlunsgy', '0017.seobircuxq', '0018.nxofutxipl', '0019.lbtmvkrhnj', '0020.rowntjaqpp', '0021.oadngppkty', '0022.ftdeifipph', '0023.fwuxgxgovt', '0024.bjnaxoqsxd', '0025.jhkjanttrr', '0026.eoutbjinyq', '0027.agdidptkcu', '0028.ccofruyutd', '0029.suchksvbva', '0030.ucvrshekrf', '0031.qikrlpilqi', '0032.ffdfqosxnh', '0033.jtotgqsdgm', '0034.jxssbjnclg', '0035.qandynxfat', '0036.ygodstktip', '0037.qklhxypdba', '0038.vlghicldkp', '0039.jbpyieqxkc', '0040.dcybelgsew', '0041.bumewnipnp', '0042.koqdtxfain', '0043.wpjdhnduah', '0044.vledqpcnpd', '0045.bkjisgagaj', '0046.ymdthjiphw', '0047.avqxthoilm', '0048.wsxtulxfnl', '0049.tmvdcqovcf', '0050.jcfnuaqfob', '0051.tpptnvysyv', '0052.bsmfywydnw', '0053.ivqotuhhgp', '0054.nfryeqntta', '0055.eyoxwwtuhl', '0056.hgtnxluwqy', '0057.buabekigsu', '0058.dxbflmyknn', '0059.bibmwmoitm', '0060.mmbyibfeeg', '0061.ulythfirrd', '0062.rnamiseafs', '0063.abpbtceqpd', '0064.fawoscqiub', '0065.aunqntadxh', '0066.owavtvxdrq', '0067.ahnioayayy', '0068.ojbuyqvmxf', '0069.svbqsppkes', '0070.ncqojtdtlg', '0071.hmbtvsuwah', '0072.iwqykfsisp', '0073.fymolgcbnh', '0074.txhnidqufy', '0075.icmhrnifjx', '0076.dvctqrjyhe', '0077.nqncmelbys', '0078.gbaqnpaxyy', '0079.gfirdjcrao', '0080.qcguhuqdwk', '0081.kuqellfomi', '0082.kpltlguvcc', '0083.lfeserogau', '0084.imgwnglrob', '0085.dvtcjupmmk', '0086.evswireebh', '0087.tlbordvirb', '0088.eleixowhur', '0089.mvpwqiottn', '0090.iokdlfvipt', '0091.tqeuiulywc', '0092.twrfdissos', '0093.ylbtevnroy', '0094.uvtifqqdny', '0095.kxrhorowny', '0096.qcygokxvys', '0097.gvlufbmctq', '0098.jmqgjidgxv', '0099.gxvbreoimr', '0100.ljjjoelvna']
2、生成器表达式:
定义:
生成器就是迭代器,可以理解为一种数据类型,这种数据类型实现了迭代器协议,其他的数据类型需要调用自己内置的__iter_方法,所以生成器就是可迭代对象。
生成器分类以及在Python中的表现形式:(Python有两种不同的方式提供生成器)
①生成器函数:常规函数定义,但是,使用yield 语句代替return语句,但是,yield在同一层函数中,可以多次使用,一次返回一个结果,返回一个结果后,将函数设置为挂起状态,以便下次从他离开的地方继续执行。
②生成器表达式:类似于列表的推导,但是生成器返回按需产生结果的一个对象,而不是一次性构建一个结果列表。
语法:
-
- (返回值 for 元素 in 可迭代对象 if 条件)
- 列表解析式的中括号换成小括号
- 返回一个生成器
和列表解析式的区别:
-
- 生成器表达式是按需计算(或惰性求值,延迟计算)需要的时候才算值。
- 列表解析式是立即返回值
生成器:
-
- 可迭代对象
- 迭代器
举例:
1 g = ('{:04}'.format(i) for i in range(1,11)) 2 print(g) 3 4 a = next(g) 5 6 for i in g: 7 print('i',i) 8 print('------------------') 9 for j in g: 10 print('j',j) 11 12 结果: 13 # 可以看出g 是一个生成器对象 generator 14 # next(g) 表示地址指针向下走一步 15 # 第一个for循环就将g 迭代完了 16 # 所以第二个for就没法往下进行迭代 17 # 因为生成器是无法向列表那样,一致迭代,当地址指针到了最后一个后,用next() 再迭代会报错 18 <generator object <genexpr> at 0x0000000001D9D318> 19 i 0002 20 i 0003 21 i 0004 22 i 0005 23 i 0006 24 i 0007 25 i 0008 26 i 0009 27 i 0010 28 ------------------
1 对比:列表解析式: 2 3 g = ['{:04}'.format(i) for i in range(1,11)] 4 print(g) 5 6 7 8 for i in g: 9 print('i',i) 10 print('------------------') 11 for j in g: 12 print('j',j) 13 14 15 ['0001', '0002', '0003', '0004', '0005', '0006', '0007', '0008', '0009', '0010'] 16 i 0001 17 i 0002 18 i 0003 19 i 0004 20 i 0005 21 i 0006 22 i 0007 23 i 0008 24 i 0009 25 i 0010 26 ------------------ 27 j 0001 28 j 0002 29 j 0003 30 j 0004 31 j 0005 32 j 0006 33 j 0007 34 j 0008 35 j 0009 36 j 0010
总结:
生成器,延迟计算(惰性求值),返回迭代器,可以迭代,从前往后走一遍,不能回头。
列表解析式:立即求值,返回的不是迭代器,是可迭代对象,从前往后走一遍后,可以回头
注:
1 it = (print('{}'.format(i + 1)) for i in range(2)) 2 3 first = next(it) 4 5 second = next(it) 6 7 val = first + second 8 9 1 10 2 11 -------------------------------------------------------------------------- 12 TypeError Traceback (most recent call last) 13 <ipython-input-10-8a69cb4a56e0> in <module>() 14 5 second = next(it) 15 6 16 ----> 7 val = first + second 17 18 TypeError: unsupported operand type(s) for +: 'NoneType' and 'NoneType' 19 20 21 # 事实上,it 生成器(generator)里边是None,print 是打印, 22 # 所以每次next(it) 的时候,要执行一次print(...),同时将None 赋值给变量
1 it = (x for x in range(10) if x %2) 2 first = next(it) 3 second = next(it) 4 val = first + second 5 print(val) # 4
生成器和列表解析式的对比:
-
- 计算方式:
- 生成器表达式延迟计算,列表解析式立即计算
- 内存占用:
- 单从返回值本身来说,生成器表达式省内存,列表解析式能返回新的列表
- 生成器没有数据,内存占用极少,但是使用的时候,虽然一个个返回数据,但是合起来占用的内存也差不多
- 列表解析式构造新的列表需要占用内存
-
- 计算速度:
- 单看计算时间看,生成器表达式好事非常短,列表解析式耗时长
- 但是生成器本身并没有返回任何值,只返回一个生成器对象
- 列表解析式构造并返回一个新的列表
- 计算速度:
- 计算方式:
注:
使用内建函数 iter() 可以将一个可迭代对象转换为一个生成器。iter([1,2,3])
1 b = iter(range(4)) 2 next(b) # 一直是0 ,因为每next一次,从新建一个生成器,所以一直在0的位置 3 4 a = iter(range(4)) 5 for i in a : 6 print(i) # 0,1,2,3,
迭代器没有 len() 这个attribution
3、集合解析式 Python3.x新增
语法:
-
-
- { 返回值 for 元素 in 可迭代对象 if 条件}
- 列表解析式的中括号,换位大括号
- 立即返回一个集合
-
用法:
-
-
- { (x, x + 1) for i in range(10) }
- { [x] for x in range(10)} # 这个会报错,[x ] ,集合中 不能有不可hash的
-
4、字典解析:Python3 新增
语法:
-
-
- { 返回值 for 元素 in 可迭代对象 if 条件}
- 使用 k-v 形式
- 立即返回一个字典
-
用法:
1 a = {x:(x, x + 1) for x in range(4)} 2 print(a) # {0: (0, 1), 1: (1, 2), 2: (2, 3), 3: (3, 4)} 3 b = {x:[x, x + 1] for x in range(4)} 4 print(b) # {0: [0, 1], 1: [1, 2], 2: [2, 3], 3: [3, 4]} 5 c = {(x,):[x, x + 1] for x in range(4)} 6 print(c) # {(0,): [0, 1], (1,): [1, 2], (2,): [2, 3], (3,): [3, 4]} 7 d = {[x]:[x, x + 1] for x in range(4)} 8 print(d) # TypeError 9 e = {chr(0x41 + x):x ** 2 for x in range(4)} 10 print(e) # {'A': 0, 'B': 1, 'C': 4, 'D': 9} 11 f = {str(x):y for x in range(4) for y in range(3)} 12 print(f) # {'0': 2, '1': 2, '2': 2, '3': 2} 覆盖 13
5、总结:
——生成器相对解析式而言,生成器主要节省了内存,事实上,效率上并没有明显的提高,所以一般只考虑内存问题就可以。
——Python2 映入列表解析式
——Python2.4 引入生成器表达式
——Python3 引入集合,字典解析式,并迁移到2.7
——一般来说,应该多用解析式,简短,高效,如果一个解析式非常复杂,要考虑拆解用for循环
——生成器和迭代器是不同的对象,但是都可迭代对象,迭代器可以用next()
——生成器是迭代器,迭代器不一定是生成器, iter(range(4)) 不是生成器生成的