本节内容
- 集合
- 字符编码与转码
- 函数语法及基本特性
- 函数参数与局部变量
- 返回值和嵌套函数
- 递归
- 匿名函数
- 高阶函数
1.集合
集合是一个无序的,不重复的数据组合,它的主要作用如下:
- 去重,把一个列表变成集合,就自动去重了
- 关系测试,测试两组数据之前的交集、差集、并集等关系
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ a = {2,3,4,5,6} b = {1,3,5,8,9} print(a) print(b) print(a & b) #交集 print(a.intersection(b)) #print(a.intersection_update(b)) #a= a.a.intersection(b) print(a | b) #并集 print(a.union(b)) print(a - b) #差集a有b没有 print(a.difference(b)) print(b - a) #b有a没有 print(b.difference(a)) print(a ^ b) #对称差集,就是除了ab的交接 print(a.symmetric_difference(b)) c = {3} print(c) print(b) print(c.issubset(b)) #测试是否 c 中的每一个元素都在 b 中 c是不是b的子集 print(b.issuperset(c)) #b是不是c的父集
2.字符编码与转码
【python2环境下演示:】
1.先用python2写个代码(utf-8),然后在windows运行(GBK),发现无法正常显示。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/
msg = "中国"
decode:解码
encode:编码
2.utf-8转换成gbk,需要先解码,然后在编码。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ msg = "中国" print msg print msg.decode(encoding="utf-8").encode(encoding="gbk") #第一个是告诉原来是什么编码,第二个是告诉要编码成什么
3.编码之间的转换
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ msg = "中国" print msg gbk_str = msg.decode(encoding="utf-8").encode(encoding="gbk") #第一个是告诉原来是什么编码,第二个是告诉要编码成什么 print gbk_str print gbk_str.decode(encoding="gbk").encode(encoding="utf-8") #在从GBK编码成uft-8 print gbk_str.decode(encoding="gbk").encode(encoding="gb2312") #在从GBK编码成gb2312
4.看一下uncode是什么模样,为什么也能显示出来?原因很简单,命令行默认将uncode解码成gbk显示的屏幕上,在内存中还是uncode
print gbk_str.decode(encoding="gbk") #看下uncode是什么样的,只有解码,没有编码,还能正常显示中国的原因是:windows默认GBK,默认支持unicode和GBK print [gbk_str,] #在内存中对比下两种编码,不变成列表看不出区别来。 print [gbk_str.decode(encoding="gbk"),]
【python3.5下演示】
注:python3的代码在内存中是unicode,在硬盘存储是(文件编码)utf-8,因为python3的解释器就是unicode,也就是说不用解码decode,只需要编码encode。
1.所以python3只需要编码encode,为啥还是不能正常显示?
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ msg = "中国" print (msg.encode(encoding="utf-8")) #在编码就变成的bytes格式。
2.试一下不用转的,是直接可以打印显示。因为刚才已经说过,windows命令行默认支持gbk和uncode,所以不需要转码就可以显示。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ msg = "中国" print (msg.encode(encoding="utf-8")) print(msg)
【总结知识点】
1.windows默认是gbk,默认支持unicode和gbk。
2.python3默认文件编码是utf-8,解释器编码是unicode,文件加载到内存会自动解码成unicode,同时把字符转换成bytes格式,bytes=8bits(位)。
3.python2默认是assic,python是1989年诞生,unicode是1991年诞生,所以不支持中文,#-*-coding:utf-8 -*- 表示告诉后面的代码,我用uft-8来解释。
4.python3解决了所以国家通用的编码,因为python的解释器用的是unicode,window支持unicode,所以不需要转码。
5.python2的str就是python3的bytes,python3的str就是unicode,python3多出来的bytes格式是一个单独的数据类型。
6.python2在windows上解码decode动作是必须的,编码成gbk这个动作不是必须的,在linux上gbk>uft-8,解码必须,编码成utf-8不是必须。
7.所有的程序在内存里默认都是unicode,编码encode动作不是必须的,当存储到硬盘才需要编码。
8.python3不需要解码和编码。
3.函数基本语法及特性
背景提要
现在老板让你写一个监控程序,监控服务器的系统状况,当cpu\memory\disk等指标的使用量超过阀值时即发邮件报警,你掏空了所有的知识量,写出了以下代码
while True: if cpu利用率 > 90%: #发送邮件提醒 连接邮箱服务器 发送邮件 关闭连接 if 硬盘使用空间 > 90%: #发送邮件提醒 连接邮箱服务器 发送邮件 关闭连接 if 内存占用 > 80%: #发送邮件提醒 连接邮箱服务器 发送邮件 关闭连接
上面的代码实现了功能,但即使是邻居老王也看出了端倪,老王亲切的摸了下你家儿子的脸蛋,说,你这个重复代码太多了,每次报警都要重写一段发邮件的代码,太low了,这样干存在2个问题:
- 代码重复过多,一个劲的copy and paste不符合高端程序员的气质
- 如果日后需要修改发邮件的这段代码,比如加入群发功能,那你就需要在所有用到这段代码的地方都修改一遍
你觉得老王说的对,你也不想写重复代码,但又不知道怎么搞,老王好像看出了你的心思,此时他抱起你儿子,笑着说,其实很简单,只需要把重复的代码提取出来,放在一个公共的地方,起个名字,以后谁想用这段代码,就通过这个名字调用就行了,如下
def 发送邮件(内容) #发送邮件提醒 连接邮箱服务器 发送邮件 关闭连接 while True: if cpu利用率 > 90%: 发送邮件('CPU报警') if 硬盘使用空间 > 90%: 发送邮件('硬盘报警') if 内存占用 > 80%: 发送邮件('内存报警')
你看着老王写的代码,气势恢宏、磅礴大气,代码里透露着一股内敛的傲气,心想,老王这个人真是不一般,突然对他的背景更感兴趣了,问老王,这些花式玩法你都是怎么知道的? 老王亲了一口你儿子,捋了捋不存在的胡子,淡淡的讲,“老夫,年少时,师从京西沙河淫魔银角大王 ”, 你一听“银角大王”这几个字,不由的娇躯一震,心想,真nb,怪不得代码写的这么6, 这“银角大王”当年在江湖上可是数得着的响当当的名字,只可惜后期纵欲过度,卒于公元2016年, 真是可惜了,只留下其哥哥孤守当年兄弟俩一起打下来的江山。 此时你看着的老王离开的身影,感觉你儿子跟他越来越像了。。。
函数是什么?
函数一词来源于数学,但编程中的「函数」概念,与数学中的函数是有很大不同的,具体区别,我们后面会讲,编程中的函数在英文中也有很多不同的叫法。在BASIC中叫做subroutine(子过程或子程序),在Pascal中叫做procedure(过程)和function,在C中只有function,在Java里面叫做method。
定义: 函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可
特性:
- 减少重复代码
- 使程序变的可扩展
- 使程序变得易维护
语法定义
def sayhi():#函数名 print("Hello, I'm nobody!") sayhi() #调用函数
可以带参数
#下面这段代码 a,b = 5,8 c = a**b print(c) #改成用函数写 def calc(x,y): res = x**y return res #返回函数执行结果 c = calc(a,b) #结果赋值给c变量 print(c)
案例1:函数内部是可以修改列表,字典,集合,实例,类。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ # def sayhi(name): #函数名 # print("my name is %s" % name) # # sayhi("lijun") # sayhi("licai") # sayhi("yongsan") #函数内部是可以修改列表,字典,集合,实例,类
#print(id(names),id(names[0])) //内存中的单元格是不一样
#5380696 5386592
#为什么以上可以改?因为names是又在内存中指向的chenlijun,panglicai,重新在内存中指向别的内存空间是可以的,原来的指向并没有改变,就是元素可以改。
names = ["chenlijun","panglicai"] info = {"names":"星驰"} def change(): print(names) names.append("liyongsan") info["age"] = 22 change() print(names,info)
4.函数参数与局部变量
形参变量只有在被调用时才分配内存单元,在调用结束时,即刻释放所分配的内存单元。因此,形参只在函数内部有效。函数调用结束返回主调用函数后则不能再使用该形参变量
实参可以是常量、变量、表达式、函数等,无论实参是何种类型的量,在进行函数调用时,它们都必须有确定的值,以便把这些值传送给形参。因此应预先用赋值,输入等办法使参数获得确定值
【默认参数】
def stu_register(name,age,country,course): print("----注册学生信息------") print("姓名:",name) print("age:",age) print("国籍:",country) print("课程:",course) stu_register("王山炮",22,"CN","python_devops") stu_register("张叫春",21,"CN","linux") stu_register("刘老根",25,"CN","linux")
发现 country 这个参数 基本都 是"CN", 就像我们在网站上注册用户,像国籍这种信息,你不填写,默认就会是 中国, 这就是通过默认参数实现的,把country变成默认参数非常简单
def stu_register(name,age,course,country="CN"):
这样,这个参数在调用时不指定,那默认就是CN,指定了的话,就用你指定的值。
另外,你可能注意到了,在把country变成默认参数后,我同时把它的位置移到了最后面,为什么呢?
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #函数 #默认参数 #增加两个默认参数,不填写,会自动打印 def stu_register(name, age,course,country="CN",hobbie="girl"): print("----注册学生信息------") print("姓名:", name) print("age:", age) print("国籍:", country) print("课程:", course) print("爱好:", hobbie) stu_register("王山炮", 22, "python_devops")
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #函数 #位置参数 #若要传参数进去,会自动更改默认参数 def stu_register(name, age,course,country="CN",hobbie="girl"): print("----注册学生信息------") print("姓名:", name) print("age:", age) print("国籍:", country) print("课程:", course) print("爱好:", hobbie) stu_register("王山炮", 22, "python_devops","JP","boy")
【关键参数】
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #函数 #关键参数 #正常情况下,给函数传参数要按顺序,不想按顺序就可以用关键参数,只需指定参数名即可,但记住一个要求就是,关键参数必须放在位置参数之后。 def stu_register(name, age,course,country="CN",hobbie="girl"): print("----注册学生信息------") print("姓名:", name) print("age:", age) print("国籍:", country) print("课程:", course) print("爱好:", hobbie) stu_register("王山炮", 22, "python_devops",hobbie="boy",country="JP")
【非固定参数】
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #函数 #非固定参数:*args,**kwargs #*args 会把多传入的参数变成一个元组形式,不指定值 #*kwargs 会把多传入的参数变成一个dict形式,指定值 def stu_register(name, age,course,country="CN",hobbie="girl",*args,**kwargs): print("----注册学生信息------") print("姓名:", name) print("age:", age) print("国籍:", country) print("课程:", course) print("爱好:", hobbie) print(args,kwargs) stu_register("王山炮", 22, "python","jp","boy","test1","test2",id="1234567")
总结:
实参:所有的数据类型都可以被当做参数传给函数
形参:只有在被调用时才分配内存,调用结束后立即释放内存,值仅在函数内有效(局部变量,形参的作用域只在当前函数内部)。
位置参数:按顺序
默认参数:必须放到位置参数后面
关键参数:必须放到位置参数后面
非固定参数:*args=() 以位置的形式传人,**kwargs = {}以关键字的形式传人
【局部变量】
name = "Alex Li" def change_name(name): print("before change:",name) name = "金角大王,一个有Tesla的男人" print("after change", name) change_name(name) print("在外面看看name改了么?",name)
输出:
before change: Alex Li
after change 金角大王,一个有Tesla的男人
在外面看看name改了么? Alex Li
全局与局部变量
5.返回值和嵌套函数
要想获取函数的执行结果,就可以用return语句把结果返回
注意:
- 函数在执行过程中只要遇到return语句,就会停止执行并返回结果,so 也可以理解为 return 语句代表着函数的结束
- 如果未在函数中指定return,那这个函数的返回值为None
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #函数 #非固定参数:*args,**kwargs #*args 会把多传入的参数变成一个元组形式,不指定值 #*kwargs 会把多传入的参数变成一个dict形式,指定值 def stu_register(name, age,course,country="CN",hobbie="girl",*args,**kwargs): print("----注册学生信息------") print("姓名:", name) print("age:", age) print("国籍:", country) print("课程:", course) print("爱好:", hobbie) print(args,kwargs) print(kwargs['addr']) #如何调用字典里的元素 return True,name rest = stu_register("王山炮", 22, "python","jp","boy","test1","test2",id="1234567",addr="回龙观") print(rest)
【嵌套函数】
函数可以嵌套函数,但是change_name2就不能被调用了,局部变量只能用在当前作用域。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ name = "lijun" def change_name(): name = "lijun2" def change_name2(): name = "lijun3" print("第三层name",name) change_name2() #调用内层函数 print("第二层name", name) change_name() print("最外层名字",name)
6.递归
在函数内部,可以调用其他函数。如果一个函数在内部调用自身本身,这个函数就是递归函数。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ def calc(n): print(n) if int(n/2) > 0: calc(int(n/2)) print(n) calc(10)
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/
#如果想要显示最小的那个除2大于0的那个数,就给赋个值
def calc(n): print(n) if int(n/2) > 0: n = calc(int(n/2) print(n) return n print("res",calc(10))
递归特性:
1. 必须有一个明确的结束条件
2. 每次进入更深一层递归时,问题规模相比上次递归都应有所减少
3. 递归效率不高,递归层次过多会导致栈溢出(在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈帧。由于栈的大小不是无限的,所以,递归调用的次数过多,会导致栈溢出)
堆栈扫盲http://www.cnblogs.com/lln7777/archive/2012/03/14/2396164.html
【利用递归实现个算法,二分查找】
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/
#输入一个值在列表里查找出来 dat = [1,2,3,4,5,6,7,8,9,23,34,54,66,77,89,666] def binary_search(find_str,det_set): mid = int(len(det_set)/2) if mid == 0: #如果列表长度就只有一个 if det_set[mid] == find_str: #等于查找的值就显示 print("find it",find_str) else: #不等于就说明不存在 print("not find,not list",find_str) return #结束 if det_set[mid] == find_str: print("find it",find_str,mid) #拆分一半的值正好等于要查找的值,就说明找到了 elif det_set[mid] > find_str: print("going to search in left",det_set[mid],det_set[0:mid]) binary_search(find_str,det_set[0:mid]) #如果拆分一半的值比查找的值大,就打印拆分一半的值左边的内容 else: print("going to search in right",det_set[mid],det_set[mid+1:]) binary_search(find_str,det_set[mid+1:]) #如果拆分一半的值比查找的值小,就打印拆分一半的值右边的内容 binary_search(23,dat)
7.匿名函数
匿名函数就是不需要显式的指定函数
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #匿名函数 def calc(n): return n**n # print(calc(2)) # # calc2 = lambda n:n**n # print(calc2(2)) # # calc3 = lambda n,y:n**y # print(calc3(4,2)) #匿名函数的用法。好处:普通的函数一般是先定义好,重复被调用,而匿名函数应用场景为,我只调用一次函数,用完就不在调用了。 #map(函数,[1,2,3]) //前面是函数,后面的参数是可调用的,可循环的 for i in map(calc,[4,5,6]): print(i) for k in map(lambda x:x*x,[1,2,3]): print(k)
lambda复杂的用法:
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #匿名函数,复杂的语法,最复杂的运算只支持三元运算。 # # def calc(n): # if n>5: # return n*2 # else: # return n-1 # # for i in map(calc,[1,2,3,4,5,6,7,8,9]): # print(i) for i in map(lambda x:x*2 if x>5 else x-1,[1,2,3,4,5,6,7,8,9]): print(i)
8.高阶函数
变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。
# -*- coding: UTF-8 -*- #blog:http://www.cnblogs.com/linux-chenyang/ #高阶函数 #1.把一个函数的内存地址当做参数传给另外一个函数。 #2.一个函数把另外一个函数当做返回值返回。 def add(x, y, f): return f(x) + f(y) res = add(3, -6, abs) #abs() 返回绝对值,永远得正 print(res)