一、迭代器(iterator)
迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。另外,迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件
特点:
- 访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
- 不能随机访问集合中的某个值 ,只能从头到尾依次访问
- 访问到一半时不能往回退
- 便于循环比较大的数据集合,节省内存
#iter()
s = '民主在哪里' #s是一个iterable对象,它有__getitem__()方法
it = iter(s) #it是一个iterator对象,它有 __next__()和__iter__()方法
print(s)
print(it.__next__())
print(it.__next__())
print(it.__next__())
print(it.__next__())
输出结果:
民主在哪里
民
主
在
哪
生成器(generator)
定义:一个函数调用时返回一个迭代器,那这个函数就叫做生成器(generator),如果函数中包含yield语法,那这个函数就会变成生成器
def cash_money(a):
while a >0:
a -= 100
yield '取走100'
print('又来拿钱了!')
atm = cash_money(500)
print(atm.__next__())
print('我是败家子,全部花掉')
print(atm.__next__())
print('花掉一分不剩')
print(atm.__next__())
- 作用:
这个yield的主要效果呢,就是可以使函数中断,并保存中断状态,中断后,代码可以继续往下执行,过一段时间还可以再重新调用这个函数,从上次yield的下一句开始执行。
另外,还可通过yield实现在单线程的情况下实现并发运算的效果
import time
def consumer(name):
print("%s 准备吃包子啦!" %name)
while True:
baozi = yield
print("包子[%s]来了,被[%s]吃了!" %(baozi,name))
def producer(name):
c = consumer('A')
c2 = consumer('B')
c.__next__()
c2.__next__()
print("老子开始准备做包子啦!")
for i in range(3):
time.sleep(1)
print("做了2个包子!")
c.send(i) #send方法是传送yield值
c2.send(i)
producer('xigang')
二、装饰器
def login(func):
def inner(arg):
print('验证')
return func(arg)
return inner
@login #相当于: tv = login(tv)
def tv(arg1):
print('welcom to tv page')
def movie():
print('movie')
movie()
tv(1)
结果:
结果:
movie
验证
welcom to tv page
带参数装饰器
#!/usr/bin/env/ python
def Before(request,kargs):
print('before')
def After(request,kargs):
print('after')
def Filter(before_func,after_func):
def outer(main_func):
def wrapper(request,kargs):
before_result = before_func(request,kargs)
if(before_result != None):
return before_result
main_result = main_func(request,kargs)
if(main_result != None):
return main_result
after_result = after_func(request,kargs)
if(after_result != None):
return after_result
return wrapper
return outer
@Filter(Before, After)
def Index(request,kargs):
print('index')
Index(1,2)
三、递归
特点
递归算法是一种直接或者间接地调用自身算法的过程。在计算机编写程序中,递归算法对解决一大类问题是十分有效的,它往往使算法的描述简洁而且易于理解。
递归算法解决问题的特点:
-
递归就是在过程或函数里调用自身。
-
在使用递归策略时,必须有一个明确的递归结束条件,称为递归出口。
-
递归算法解题通常显得很简洁,但递归算法解题的运行效率较低。所以一般不提倡用递归算法设计程序。
-
在递归调用的过程当中系统为每一层的返回点、局部量等开辟了栈来存储。递归次数过多容易造成栈溢出等。所以一般不提倡用递归算法设计程序。
要求
递归算法所体现的“重复”一般有三个要求:
-
一是每次调用在规模上都有所缩小(通常是减半);
-
二是相邻两次重复之间有紧密的联系,前一次要为后一次做准备(通常前一次的输出就作为后一次的输入);
-
三是在问题的规模极小时必须用直接给出解答而不再进行递归调用,因而每次递归调用都是有条件的(以规模未达到直接解答的大小为条件),无条件递归调用将会成为死循环而不能正常结束。
当在上千万元素列表中查找一个元素,遍历列表会非常慢,一个一个遍历寻找,用递归方法可以迅速找到,如下:
def binary_search(data_source,find_n):
mid = int(len(data_source)/2)
if len(data_source)>1:
if data_source[mid] >find_n:
print('data in left of %s' % data_source[mid])
binary_search(data_source[:mid],find_n)
elif data_source[mid] <find_n:
print('data in right of %s' % data_source[mid])
binary_search(data_source[mid:],find_n)
else:
print('found find_s,',data_source[mid])
else:
print('cannot find ........')
if __name__ == '__main__':
data = list(range(1,7000000))
binary_search(data,655350)
四、算法
要求:生成一个4*4的2维数组并将其顺时针旋转90度
array=[[col for col in range(5)] for row in range(5)] #初始化一个4*4数组
#array=[[col for col in 'abcde'] for row in range(5)]
for row in array: #旋转前先看看数组长啥样
print(row)
print('-------------')
for i,row in enumerate(array):
for index in range(i,len(row)):
tmp = array[index][i] #get each rows' data by column's index
array[index][i] = array[i][index] #
print tmp,array[i][index] #= tmp
array[i][index] = tmp
for r in array:print r
print('--one big loop --')
五、正则表达式
匹配格式
模式 描述
^ 匹配字符串的开头
$ 匹配字符串的末尾。
. 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
[...] 用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
[^...] 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
re* 匹配0个或多个的表达式。
re+ 匹配1个或多个的表达式。
re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re{ n}
re{ n,} 精确匹配n个前面表达式。
re{ n, m} 匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a| b 匹配a或b
(re) G匹配括号内的表达式,也表示一个组
(?imx) 正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。
(?-imx) 正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re) 类似 (...), 但是不表示一个组
(?imx: re) 在括号中使用i, m, 或 x 可选标志
(?-imx: re) 在括号中不使用i, m, 或 x 可选标志
(?#...) 注释.
(?= re) 前向肯定界定符。如果所含正则表达式,以 ... 表示,在当前位置成功匹配时成功,否则失败。但一旦所含表达式已经尝试,匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。
(?! re) 前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功
(?> re) 匹配的独立模式,省去回溯。
w 匹配字母数字
W 匹配非字母数字
s 匹配任意空白字符,等价于 [
f].
S 匹配任意非空字符
d 匹配任意数字,等价于 [0-9].
D 匹配任意非数字
A 匹配字符串开始
匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串。c
z 匹配字符串结束
G 匹配最后匹配完成的位置。
匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
B 匹配非单词边界。'erB' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
, , 等. 匹配一个换行符。匹配一个制表符。等
1...9 匹配第n个分组的子表达式。
10 匹配第n个分组的子表达式,如果它经匹配。否则指的是八进制字符码的表达式。
正则表达式常用5种操作
-
1、re.match(pattern, string) # 从头匹配
-
2、re.search(pattern, string) # 匹配整个字符串,直到找到一个匹配
-
3、re.split() # 将匹配到的格式当做分割点对字符串分割成列表
>>>m = re.split("[0-9]", "alex1rain2jack3helen rachel8")
>>>print(m)
输出: ['alex', 'rain', 'jack', 'helen rachel', '']
- 4、re.findall() # 找到所有要匹配的字符并返回列表格式
>>>m = re.findall("[0-9]", "alex1rain2jack3helen rachel8")
>>>print(m)<br>
输出:['1', '2', '3', '8']
- 5、re.sub(pattern, repl, string, count,flag) # 替换匹配到的字符
m=re.sub("[0-9]","|", "alex1rain2jack3helen rachel8",count=2 )
print(m)
输出:alex|rain|jack3helen rachel8
- re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。