Python_oldboy_自动化运维之路（四）

本节内容

集合
字符编码与转码
函数语法及基本特性
函数参数与局部变量
返回值和嵌套函数
递归
匿名函数
高阶函数

1.集合

集合是一个无序的，不重复的数据组合，它的主要作用如下：

去重，把一个列表变成集合，就自动去重了
关系测试，测试两组数据之前的交集、差集、并集等关系

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

a = {2,3,4,5,6}
b = {1,3,5,8,9}

print(a)
print(b)
print(a & b)        #交集
print(a.intersection(b))
#print(a.intersection_update(b))     #a= a.a.intersection(b)

print(a | b)        #并集
print(a.union(b))

print(a - b)        #差集a有b没有
print(a.difference(b))
print(b - a)        #b有a没有
print(b.difference(a))

print(a ^ b)        #对称差集，就是除了ab的交接
print(a.symmetric_difference(b))

c = {3}
print(c)
print(b)

print(c.issubset(b))        #测试是否 c 中的每一个元素都在 b 中      c是不是b的子集
print(b.issuperset(c))      #b是不是c的父集

2.字符编码与转码

【python2环境下演示：】

1.先用python2写个代码（utf-8），然后在windows运行（GBK），发现无法正常显示。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

msg = "中国"

decode：解码

encode：编码

2.utf-8转换成gbk，需要先解码，然后在编码。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

msg = "中国"
print msg
print msg.decode(encoding="utf-8").encode(encoding="gbk") #第一个是告诉原来是什么编码，第二个是告诉要编码成什么

3.编码之间的转换

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
msg = "中国"
print msg

gbk_str = msg.decode(encoding="utf-8").encode(encoding="gbk") #第一个是告诉原来是什么编码，第二个是告诉要编码成什么
print gbk_str

print gbk_str.decode(encoding="gbk").encode(encoding="utf-8") #在从GBK编码成uft-8
print gbk_str.decode(encoding="gbk").encode(encoding="gb2312") #在从GBK编码成gb2312

4.看一下uncode是什么模样，为什么也能显示出来？原因很简单，命令行默认将uncode解码成gbk显示的屏幕上，在内存中还是uncode

print gbk_str.decode(encoding="gbk")            #看下uncode是什么样的，只有解码，没有编码，还能正常显示中国的原因是：windows默认GBK，默认支持unicode和GBK

print [gbk_str,]                                #在内存中对比下两种编码,不变成列表看不出区别来。
print [gbk_str.decode(encoding="gbk"),]

【python3.5下演示】

注：python3的代码在内存中是unicode,在硬盘存储是（文件编码）utf-8，因为python3的解释器就是unicode，也就是说不用解码decode，只需要编码encode。

1.所以python3只需要编码encode,为啥还是不能正常显示？

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

msg = "中国"
print (msg.encode(encoding="utf-8"))　　　　#在编码就变成的bytes格式。

2.试一下不用转的，是直接可以打印显示。因为刚才已经说过，windows命令行默认支持gbk和uncode，所以不需要转码就可以显示。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

msg = "中国"
print (msg.encode(encoding="utf-8"))

print(msg)

【总结知识点】

1.windows默认是gbk，默认支持unicode和gbk。

2.python3默认文件编码是utf-8，解释器编码是unicode，文件加载到内存会自动解码成unicode，同时把字符转换成bytes格式，bytes=8bits（位）。

3.python2默认是assic，python是1989年诞生，unicode是1991年诞生，所以不支持中文，#-*-coding:utf-8 -*- 表示告诉后面的代码，我用uft-8来解释。

4.python3解决了所以国家通用的编码，因为python的解释器用的是unicode，window支持unicode，所以不需要转码。

5.python2的str就是python3的bytes，python3的str就是unicode，python3多出来的bytes格式是一个单独的数据类型。

6.python2在windows上解码decode动作是必须的，编码成gbk这个动作不是必须的，在linux上gbk>uft-8,解码必须，编码成utf-8不是必须。

7.所有的程序在内存里默认都是unicode，编码encode动作不是必须的，当存储到硬盘才需要编码。

8.python3不需要解码和编码。

3.函数基本语法及特性

背景提要

现在老板让你写一个监控程序，监控服务器的系统状况，当cpu＼memory＼disk等指标的使用量超过阀值时即发邮件报警，你掏空了所有的知识量，写出了以下代码

while True：
    if cpu利用率 > 90%:
        #发送邮件提醒
        连接邮箱服务器
        发送邮件
        关闭连接
     
    if 硬盘使用空间 > 90%:
        #发送邮件提醒
        连接邮箱服务器
        发送邮件
        关闭连接
     
    if 内存占用 > 80%:
        #发送邮件提醒
        连接邮箱服务器
        发送邮件
        关闭连接

上面的代码实现了功能，但即使是邻居老王也看出了端倪，老王亲切的摸了下你家儿子的脸蛋，说，你这个重复代码太多了，每次报警都要重写一段发邮件的代码，太low了，这样干存在2个问题：

代码重复过多，一个劲的copy and paste不符合高端程序员的气质
如果日后需要修改发邮件的这段代码，比如加入群发功能，那你就需要在所有用到这段代码的地方都修改一遍

你觉得老王说的对，你也不想写重复代码，但又不知道怎么搞，老王好像看出了你的心思，此时他抱起你儿子，笑着说，其实很简单，只需要把重复的代码提取出来，放在一个公共的地方，起个名字，以后谁想用这段代码，就通过这个名字调用就行了，如下

def 发送邮件(内容)
    #发送邮件提醒
    连接邮箱服务器
    发送邮件
    关闭连接
     
while True：
     
    if cpu利用率 > 90%:
        发送邮件('CPU报警')
     
    if 硬盘使用空间 > 90%:
        发送邮件('硬盘报警')
     
    if 内存占用 > 80%:
        发送邮件('内存报警')

你看着老王写的代码，气势恢宏、磅礴大气，代码里透露着一股内敛的傲气，心想，老王这个人真是不一般，突然对他的背景更感兴趣了，问老王，这些花式玩法你都是怎么知道的？老王亲了一口你儿子，捋了捋不存在的胡子，淡淡的讲，“老夫，年少时，师从京西沙河淫魔银角大王 ”，你一听“银角大王”这几个字，不由的娇躯一震，心想，真nb,怪不得代码写的这么6, 这“银角大王”当年在江湖上可是数得着的响当当的名字，只可惜后期纵欲过度，卒于公元2016年，真是可惜了，只留下其哥哥孤守当年兄弟俩一起打下来的江山。此时你看着的老王离开的身影，感觉你儿子跟他越来越像了。。。

函数是什么?

函数一词来源于数学，但编程中的「函数」概念，与数学中的函数是有很大不同的，具体区别，我们后面会讲，编程中的函数在英文中也有很多不同的叫法。在BASIC中叫做subroutine(子过程或子程序)，在Pascal中叫做procedure(过程)和function，在C中只有function，在Java里面叫做method。

定义: 函数是指将一组语句的集合通过一个名字(函数名)封装起来，要想执行这个函数，只需调用其函数名即可

特性:

减少重复代码
使程序变的可扩展
使程序变得易维护

语法定义

def sayhi():#函数名
    print("Hello, I'm nobody!")
 
sayhi() #调用函数

可以带参数

#下面这段代码
a,b = 5,8
c = a**b
print(c)
 
 
#改成用函数写
def calc(x,y):
    res = x**y
    return res #返回函数执行结果
 
c = calc(a,b) ＃结果赋值给c变量
print(c)

案例1：函数内部是可以修改列表，字典，集合，实例，类。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

# def sayhi(name):                       #函数名
#     print("my name is %s" % name)
#
# sayhi("lijun")
# sayhi("licai")
# sayhi("yongsan")


#函数内部是可以修改列表，字典，集合，实例，类
#print（id（names），id（names[0]））　　　　　　　　　　　　//内存中的单元格是不一样
#5380696 5386592
#为什么以上可以改？因为names是又在内存中指向的chenlijun，panglicai，重新在内存中指向别的内存空间是可以的，原来的指向并没有改变，就是元素可以改。


names = ["chenlijun","panglicai"]
info = {"names":"星驰"}

def change():
    print(names)
    names.append("liyongsan")
    info["age"] = 22


change()
print(names,info)

4.函数参数与局部变量

形参变量只有在被调用时才分配内存单元，在调用结束时，即刻释放所分配的内存单元。因此，形参只在函数内部有效。函数调用结束返回主调用函数后则不能再使用该形参变量

实参可以是常量、变量、表达式、函数等，无论实参是何种类型的量，在进行函数调用时，它们都必须有确定的值，以便把这些值传送给形参。因此应预先用赋值，输入等办法使参数获得确定值

【默认参数】

def stu_register(name,age,country,course):
    print("----注册学生信息------")
    print("姓名:",name)
    print("age:",age)
    print("国籍:",country)
    print("课程:",course)
 
stu_register("王山炮",22,"CN","python_devops")
stu_register("张叫春",21,"CN","linux")
stu_register("刘老根",25,"CN","linux")

View Code

发现 country 这个参数基本都是"CN", 就像我们在网站上注册用户，像国籍这种信息，你不填写，默认就会是中国，这就是通过默认参数实现的，把country变成默认参数非常简单

def stu_register(name,age,course,country="CN"):

这样，这个参数在调用时不指定，那默认就是CN，指定了的话，就用你指定的值。

另外，你可能注意到了，在把country变成默认参数后，我同时把它的位置移到了最后面，为什么呢？

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#函数
#默认参数
#增加两个默认参数，不填写，会自动打印

def stu_register(name, age,course,country="CN",hobbie="girl"):
    print("----注册学生信息------")
    print("姓名:", name)
    print("age:", age)
    print("国籍:", country)
    print("课程:", course)
    print("爱好:", hobbie)

stu_register("王山炮", 22, "python_devops")

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#函数
#位置参数
#若要传参数进去，会自动更改默认参数

def stu_register(name, age,course,country="CN",hobbie="girl"):
    print("----注册学生信息------")
    print("姓名:", name)
    print("age:", age)
    print("国籍:", country)
    print("课程:", course)
    print("爱好:", hobbie)

stu_register("王山炮", 22, "python_devops","JP","boy")

【关键参数】

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#函数
#关键参数
#正常情况下，给函数传参数要按顺序，不想按顺序就可以用关键参数，只需指定参数名即可，但记住一个要求就是，关键参数必须放在位置参数之后。

def stu_register(name, age,course,country="CN",hobbie="girl"):
    print("----注册学生信息------")
    print("姓名:", name)
    print("age:", age)
    print("国籍:", country)
    print("课程:", course)
    print("爱好:", hobbie)

stu_register("王山炮", 22, "python_devops",hobbie="boy",country="JP")

【非固定参数】

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#函数
#非固定参数：*args，**kwargs
#*args 会把多传入的参数变成一个元组形式，不指定值
#*kwargs 会把多传入的参数变成一个dict形式，指定值

def stu_register(name, age,course,country="CN",hobbie="girl",*args,**kwargs):
    print("----注册学生信息------")
    print("姓名:", name)
    print("age:", age)
    print("国籍:", country)
    print("课程:", course)
    print("爱好:", hobbie)
    print(args,kwargs)

stu_register("王山炮", 22, "python","jp","boy","test1","test2",id="1234567")

总结：

实参：所有的数据类型都可以被当做参数传给函数
形参：只有在被调用时才分配内存，调用结束后立即释放内存，值仅在函数内有效（局部变量，形参的作用域只在当前函数内部）。

位置参数:按顺序
默认参数：必须放到位置参数后面
关键参数：必须放到位置参数后面
非固定参数：*args=() 以位置的形式传人，**kwargs = {}以关键字的形式传人

【局部变量】

name = "Alex Li"
 
def change_name(name):
    print("before change:",name)
    name = "金角大王,一个有Tesla的男人"
    print("after change", name)
 
 
change_name(name)
 
print("在外面看看name改了么?",name)

输出：

before change: Alex Li
after change 金角大王,一个有Tesla的男人
在外面看看name改了么? Alex Li

全局与局部变量

在子程序中定义的变量称为局部变量，在程序的一开始定义的变量称为全局变量。

全局变量作用域是整个程序，局部变量作用域是定义该变量的子程序。

当全局变量与局部变量同名时：

在定义局部变量的子程序内，局部变量起作用；在其它地方全局变量起作用。

5.返回值和嵌套函数

要想获取函数的执行结果，就可以用return语句把结果返回

注意:

函数在执行过程中只要遇到return语句，就会停止执行并返回结果，so 也可以理解为 return 语句代表着函数的结束
如果未在函数中指定return,那这个函数的返回值为None

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#函数
#非固定参数：*args，**kwargs
#*args 会把多传入的参数变成一个元组形式，不指定值
#*kwargs 会把多传入的参数变成一个dict形式，指定值

def stu_register(name, age,course,country="CN",hobbie="girl",*args,**kwargs):
    print("----注册学生信息------")
    print("姓名:", name)
    print("age:", age)
    print("国籍:", country)
    print("课程:", course)
    print("爱好:", hobbie)
    print(args,kwargs)
    print(kwargs['addr'])                           #如何调用字典里的元素
    return True,name

rest = stu_register("王山炮", 22, "python","jp","boy","test1","test2",id="1234567",addr="回龙观")

print(rest)

【嵌套函数】

函数可以嵌套函数，但是change_name2就不能被调用了，局部变量只能用在当前作用域。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/

name = "lijun"

def change_name():
    name = "lijun2"

    def change_name2():
        name = "lijun3"
        print("第三层name",name)

    change_name2()          #调用内层函数
    print("第二层name", name)

change_name()
print("最外层名字",name)

6.递归

在函数内部，可以调用其他函数。如果一个函数在内部调用自身本身，这个函数就是递归函数。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
def calc(n):
    print(n)
    if int(n/2) > 0:
        calc(int(n/2))

    print(n)

calc(10)

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#如果想要显示最小的那个除2大于0的那个数，就给赋个值

def calc(n):
    print(n)
    if int(n/2) > 0:
        n = calc(int(n/2)
    print(n)
    return n

print("res",calc(10))

递归特性:

1. 必须有一个明确的结束条件

2. 每次进入更深一层递归时，问题规模相比上次递归都应有所减少

3. 递归效率不高，递归层次过多会导致栈溢出（在计算机中，函数调用是通过栈（stack）这种数据结构实现的，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就会减一层栈帧。由于栈的大小不是无限的，所以，递归调用的次数过多，会导致栈溢出）

堆栈扫盲http://www.cnblogs.com/lln7777/archive/2012/03/14/2396164.html

【利用递归实现个算法，二分查找】

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#输入一个值在列表里查找出来
dat = [1,2,3,4,5,6,7,8,9,23,34,54,66,77,89,666]

def binary_search(find_str,det_set):
    mid = int(len(det_set)/2)
    if mid == 0:                                          #如果列表长度就只有一个
        if det_set[mid] == find_str:                      #等于查找的值就显示
            print("find it",find_str)
        else:                                             #不等于就说明不存在
            print("not find,not list",find_str)

        return                                            #结束

    if det_set[mid] == find_str:
        print("find it",find_str,mid)                     #拆分一半的值正好等于要查找的值，就说明找到了

    elif det_set[mid] > find_str:
        print("going to  search in left",det_set[mid],det_set[0:mid])
        binary_search(find_str,det_set[0:mid])            #如果拆分一半的值比查找的值大，就打印拆分一半的值左边的内容

    else:
        print("going to  search in right",det_set[mid],det_set[mid+1:])
        binary_search(find_str,det_set[mid+1:])           #如果拆分一半的值比查找的值小，就打印拆分一半的值右边的内容

binary_search(23,dat)

7.匿名函数

匿名函数就是不需要显式的指定函数

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#匿名函数

def calc(n):
    return n**n

# print(calc(2))
#
# calc2 = lambda  n:n**n
# print(calc2(2))
#
# calc3 = lambda n,y:n**y
# print(calc3(4,2))

#匿名函数的用法。好处：普通的函数一般是先定义好，重复被调用，而匿名函数应用场景为，我只调用一次函数，用完就不在调用了。
#map(函数，[1,2,3])  //前面是函数，后面的参数是可调用的，可循环的
for i in map(calc,[4,5,6]):
    print(i)

for k in map(lambda x:x*x,[1,2,3]):
    print(k)

lambda复杂的用法：

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#匿名函数，复杂的语法，最复杂的运算只支持三元运算。
#
# def calc(n):
#     if n>5:
#         return n*2
#     else:
#         return n-1
#
# for i in map(calc,[1,2,3,4,5,6,7,8,9]):
#     print(i)

for i in map(lambda x:x*2 if x>5 else x-1,[1,2,3,4,5,6,7,8,9]):
    print(i)

8.高阶函数

变量可以指向函数，函数的参数能接收变量，那么一个函数就可以接收另一个函数作为参数，这种函数就称之为高阶函数。

# -*- coding: UTF-8 -*-
#blog:http://www.cnblogs.com/linux-chenyang/
#高阶函数
#1.把一个函数的内存地址当做参数传给另外一个函数。
#2.一个函数把另外一个函数当做返回值返回。

def add(x, y, f):
    return f(x) + f(y)

res = add(3, -6, abs)               #abs()  返回绝对值，永远得正
print(res)

相关阅读:
hdu_2224_The shortest path(dp)
hdu_4824_Disk Schedule(dp)
hdu_5680_zxa and set(想法题)
hdu_5683_zxa and xor(非正解的暴力)
hdu_1429_胜利大逃亡(续)(BFS状压)
hdu_1254_推箱子（双BFS）
hdu_1969_pie(二分)
hdu_2446_Shell Pyramid(数学，二分)
hdu_2141_Can you find it?(二分)
5.2 nc + JMX查看分布式程序数据
原文地址：https://www.cnblogs.com/linux-chenyang/p/6366130.html