• Python之模块,迭代器与生成器


    本节涉及内容:

        1. 迭代器和生成器

        2. 递归

        3. 字符串格式化

        4. 模块

          内置模块

          自定义模块

          第三方模块

        5. 序列化的模块

            json

            pickle

    (一). 迭代器和生成器:

         迭代器:        

          迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退。另外,迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件

      特点:

    1. 访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
    2. 不能随机访问集合中的某个值 ,只能从头到尾依次访问
    3. 访问到一半时不能往回退
    4. 便于循环比较大的数据集合,节省内存
     1 >>> mylist = iter([1, 2, 3, 4, 5])
     2 >>> print(mylist.__next__()) 
     3 1
     4 >>> print(mylist.__next__())
     5 2
     6 >>> print(mylist.__next__())
     7 3
     8 >>> print(mylist.__next__())
     9 4
    10 >>> print(mylist.__next__())
    11 5
    12 >>> print(mylist.__next__())       
    13 Traceback (most recent call last):
    14   File "<input>", line 1, in <module>
    15 StopIteration             
    View Code

    调用迭代器的__next__()方法循环执行每一条条目,条目全部取出后引发StopIteration异常(非错误),表示迭代完成。

        

        生成器:

          一个函数调用时返回一个迭代器,那这个函数就叫做生成器(generator);如果函数中包含yield语法,那这个函数就会变成生成器;

     1 def func():   #func为一个函数称为生成器,
     2     print(1111)
     3     yield 1
     4     print(2222)
     5     yield 2
     6     print(3333)
     7     yield 3 
     8 ret = func()   #执行func()函数时得到一个迭代器
     9 r1= ret.__next__()#进入函数找到yield,获取yield后边的数据
    10 print(r1)
    11 r2 = ret.__next__()
    12 print(r2)
    13 r3 = ret.__next__()
    14 print(r3)
    15 #输出:
    16 1111
    17 1
    18 2222
    19 2
    20 3333
    21 3
     1 def func():
     2     print(1111)
     3     yield 1
     4     print(2222)
     5     yield 2
     6     print(3333)
     7     yield 3
     8 ret = func()
     9 
    10 for i in ret:  #使用一个for循环可以简化手动的迭代
    11      print(i)
    12 #输出
    13 1111
    14 1
    15 2222
    16 2
    17 3333
    18 3

    利用生成器自定义range

     1 def myrange(arg):
     2     start = 0
     3     while True:
     4         if start > arg:
     5             return
     6         yield start
     7         start += 1
     8 ret = myrange(3)
     9 r = ret.__next__()
    10 print(r)
    11 r = ret.__next__()
    12 print(r)
    13 r = ret.__next__()
    14 print(r)
    15 r = ret.__next__()
    16 print(r)
    17 #输出:
    18 0
    19 1
    20 2
    21 3

      加强的生成器特性:

          send(): 传入一个新的值。

          close(): 抛出异常或者退出

     1 def counter(start = 0):
     2     count = start
     3     while True:
     4         val = (yield count)
     5         if val is not None:
     6             count = val
     7         else:
     8             count += 1
     9 count = counter(5)            #将函数传入值5
    10 print(count.__next__())             #通过next迭代每一个值
    11 print(count.__next__())
    12 count.send(8)               #通过send可以传入一个新的值来迭代
    13 print(count.__next__())
    14 print(count.__next__())
    15 count.close()               #close()函数则可以退出迭代
    16 print(count.__next__())     #再次调用就会出现StopIteration异常
    17 
    18 #输出:
    19 5
    20 6
    21 9
    22 10
    23 StopIteration

      (二) 递归

          如果一个新的调用能在相同过程中较早的调用结束之前开始,这个过程即为递归

     1 def func(n):
     2     n += 1
     3     if n >= 5:
     4         return 'end'
     5     return func(n)
     6 r = func(1)
     7 print(r)
     8 #输出:
     9 
    10 end

    递归实现  1*2*3*4*5*6*7  的结果:

     1 def num(n):
     2     if n == 1:
     3         return 1
     4     else:
     5         return (n * num(n - 1))
     6 print(num(7))
     7 
     8 #输出:
     9 
    10 5040

      (三)字符串格式化(引用)

          两种方式:

            1. 百分号(%)

            2. format

          百分号的方式相对来说比较老,而format方式则是比较先进的方式,企图替换古老的方式,目前两者并存。[PEP-3101]

        1. 百分号(%)方式

    %[(name)][flags][width].[precision]typecode

    • (name)      可选,用于选择指定的key

    • flags          可选,可供选择的值有:
      • +       右对齐;正数前加正好,负数前加负号;
      • -        左对齐;正数前无符号,负数前加负号;
      • 空格    右对齐;正数前加空格,负数前加负号;
      • 0        右对齐;正数前无符号,负数前加负号;用0填充空白
    • width         可选,占有宽度
    • .precision   可选,小数点后保留的位数
    • typecode    必选
      • s,获取传入对象的__str__方法的返回值,并将其格式化到指定位置
      • r,获取传入对象的__repr__方法的返回值,并将其格式化到指定位置
      • c,整数:将数字转换成其unicode对应的值,10进制范围为 0 <= i <= 1114111(py27则只支持0-255);字符:将字符添加到指定位置
      • o,将整数转换成 八  进制表示,并将其格式化到指定位置
      • x,将整数转换成十六进制表示,并将其格式化到指定位置
      • d,将整数、浮点数转换成 十 进制表示,并将其格式化到指定位置
      • e,将整数、浮点数转换成科学计数法,并将其格式化到指定位置(小写e)
      • E,将整数、浮点数转换成科学计数法,并将其格式化到指定位置(大写E)
      • f, 将整数、浮点数转换成浮点数表示,并将其格式化到指定位置(默认保留小数点后6位)
      • F,同上
      • g,自动调整将整数、浮点数转换成 浮点型或科学计数法表示(超过6位数用科学计数法),并将其格式化到指定位置(如果是科学计数则是e;)
      • G,自动调整将整数、浮点数转换成 浮点型或科学计数法表示(超过6位数用科学计数法),并将其格式化到指定位置(如果是科学计数则是E;)
      • %,当字符串中存在格式化标志时,需要用 %%表示一个百分号

      注:Python中百分号格式化是不存在自动将整数转换成二进制表示的方式

      常用格式化:

     1 tpl = "i am %s" % "alex"
     2  
     3 tpl = "i am %s age %d" % ("alex", 18)
     4  
     5 tpl = "i am %(name)s age %(age)d" % {"name": "alex", "age": 18}
     6  
     7 tpl = "percent %.2f" % 99.97623
     8  
     9 tpl = "i am %(pp).2f" % {"pp": 123.425556, }
    10  
    11 tpl = "i am %.2f %%" % {"pp": 123.425556, }

      

      2. format方式

    [[fill]align][sign][#][0][width][,][.precision][type]

      • fill           【可选】空白处填充的字符
      • align        【可选】对齐方式(需配合width使用)
        • <,内容左对齐
        • >,内容右对齐(默认)
        • =,内容右对齐,将符号放置在填充字符的左侧,且只对数字类型有效。 即使:符号+填充物+数字
        • ^,内容居中
      • sign         【可选】有无符号数字
        • +,正号加正,负号加负;
        •  -,正号不变,负号加负;
        • 空格 ,正号空格,负号加负;
      • #            【可选】对于二进制、八进制、十六进制,如果加上#,会显示 0b/0o/0x,否则不显示
      • ,            【可选】为数字添加分隔符,如:1,000,000
      • width       【可选】格式化位所占宽度
      • .precision 【可选】小数位保留精度
      • type         【可选】格式化类型
        • 传入” 字符串类型 “的参数
          • s,格式化字符串类型数据
          • 空白,未指定类型,则默认是None,同s
        • 传入“ 整数类型 ”的参数
          • b,将10进制整数自动转换成2进制表示然后格式化
          • c,将10进制整数自动转换为其对应的unicode字符
          • d,十进制整数
          • o,将10进制整数自动转换成8进制表示然后格式化;
          • x,将10进制整数自动转换成16进制表示然后格式化(小写x)
          • X,将10进制整数自动转换成16进制表示然后格式化(大写X)
        • 传入“ 浮点型或小数类型 ”的参数
          • e, 转换为科学计数法(小写e)表示,然后格式化;
          • E, 转换为科学计数法(大写E)表示,然后格式化;
          • f , 转换为浮点型(默认小数点后保留6位)表示,然后格式化;
          • F, 转换为浮点型(默认小数点后保留6位)表示,然后格式化;
          • g, 自动在e和f中切换
          • G, 自动在E和F中切换
          • %,显示百分比(默认显示小数点后6位)

      常用格式化:

     1 tpl = "i am {}, age {}, {}".format("seven", 18, 'alex')
     2   
     3 tpl = "i am {}, age {}, {}".format(*["seven", 18, 'alex'])
     4   
     5 tpl = "i am {0}, age {1}, really {0}".format("seven", 18)
     6   
     7 tpl = "i am {0}, age {1}, really {0}".format(*["seven", 18])
     8   
     9 tpl = "i am {name}, age {age}, really {name}".format(name="seven", age=18)
    10   
    11 tpl = "i am {name}, age {age}, really {name}".format(**{"name": "seven", "age": 18})
    12   
    13 tpl = "i am {0[0]}, age {0[1]}, really {0[2]}".format([1, 2, 3], [11, 22, 33])
    14   
    15 tpl = "i am {:s}, age {:d}, money {:f}".format("seven", 18, 88888.1)
    16   
    17 tpl = "i am {:s}, age {:d}".format(*["seven", 18])
    18   
    19 tpl = "i am {name:s}, age {age:d}".format(name="seven", age=18)
    20   
    21 tpl = "i am {name:s}, age {age:d}".format(**{"name": "seven", "age": 18})
    22  
    23 tpl = "numbers: {:b},{:o},{:d},{:x},{:X}, {:%}".format(15, 15, 15, 15, 15, 15.87623, 2)
    24  
    25 tpl = "numbers: {:b},{:o},{:d},{:x},{:X}, {:%}".format(15, 15, 15, 15, 15, 15.87623, 2)
    26  
    27 tpl = "numbers: {0:b},{0:o},{0:d},{0:x},{0:X}, {0:%}".format(15)
    28  
    29 tpl = "numbers: {num:b},{num:o},{num:d},{num:x},{num:X}, {num:%}".format(num=15)
    View Code

    更多格式化操作:https://docs.python.org/3/library/string.html

      (四)模块

         使大量的代码分成有组织的代码段,代码段可以彼此交互引用,增加了代码的重用性。

        模块分为三种:

          1. 内置模块

          2. 自定义模块

          3. 第三方模块

    ***导入模块***

      1>使用import语句:

    格式如下:

    1 import module1   #分行导入
    2 import  module2
    3         .....               
    4 import module1,module2 #也可以在一行中导入多个模块,用逗号分隔            
    1 import sys
    2 improt os
    3 
    4 or 
    5 
    6 import sys,os

    注意: import导入模块的顺序:

       1)内置模块 

       2)第三方模块

       3)自定义模块

    使用一个空行分割这三类模块的导入语句。模块在顶层导入时为全局作用域,在函数中导入时为局部作用域。

      2> 使用from-import语句:

        导入模块中的指定属性,将指定名称导入当前作用域

    格式:

    from module import name1[, name2[, nameN]]
    from lib import commons
    from Tkinter import (Tk, Frame, Button, Text)#按照规范多模块导入时加小括号
    
    from Tkinter import *  #导入Tkinter下的所有模块

       3> 扩展的import语句(as)

     1 from lib import commons
     2 from var import commons  #两个模块名相同
     3 
     4 #针对这种情况可以使用:
     5 
     6 from lib import commons as  lib.commons
     7 from var import commons as  var.commons
     8 
     9 #之后直接导入模块:
    10  
    11 import lib.commons,var.commons

      内置模块(引用):

        内置模块是Python自带的功能,在使用内置模块相应的功能时,需要【先导入】再【使用】

      1. sys

    用于提供对Python解释器相关的操作:

    1 sys.argv           命令行参数List,第一个元素是程序本身路径
    2 sys.exit(n)        退出程序,正常退出时exit(0)
    3 sys.version        获取Python解释程序的版本信息
    4 sys.maxint         最大的Int值
    5 sys.path           返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值
    6 sys.platform       返回操作系统平台名称
    7 sys.stdin          输入相关
    8 sys.stdout         输出相关
    9 sys.stderror       错误相关
     1 import sys
     2 import time
     3 
     4 
     5 def view_bar(num, total):
     6     rate = float(num) / float(total)
     7     rate_num = int(rate * 100)
     8     r = '
    %d%%' % (rate_num, )
     9     sys.stdout.write(r)
    10     sys.stdout.flush()
    11 
    12 
    13 if __name__ == '__main__':
    14     for i in range(0, 100):
    15         time.sleep(0.1)
    16         view_bar(i, 100)
    17 
    18 进度百分比

      2. os

    用于提供系统级别的操作:

     1 os.getcwd()                 获取当前工作目录,即当前python脚本工作的目录路径
     2 os.chdir("dirname")         改变当前脚本工作目录;相当于shell下cd
     3 os.curdir                   返回当前目录: ('.')
     4 os.pardir                   获取当前目录的父目录字符串名:('..')
     5 os.makedirs('dir1/dir2')    可生成多层递归目录
     6 os.removedirs('dirname1')   若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推
     7 os.mkdir('dirname')         生成单级目录;相当于shell中mkdir dirname
     8 os.rmdir('dirname')         删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname
     9 os.listdir('dirname')       列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印
    10 os.remove()                 删除一个文件
    11 os.rename("oldname","new")  重命名文件/目录
    12 os.stat('path/filename')    获取文件/目录信息
    13 os.sep                      操作系统特定的路径分隔符,win下为"\",Linux下为"/"
    14 os.linesep                  当前平台使用的行终止符,win下为"	
    ",Linux下为"
    "
    15 os.pathsep                  用于分割文件路径的字符串
    16 os.name                     字符串指示当前使用平台。win->'nt'; Linux->'posix'
    17 os.system("bash command")   运行shell命令,直接显示
    18 os.environ                  获取系统环境变量
    19 os.path.abspath(path)       返回path规范化的绝对路径
    20 os.path.split(path)         将path分割成目录和文件名二元组返回
    21 os.path.dirname(path)       返回path的目录。其实就是os.path.split(path)的第一个元素
    22 os.path.basename(path)      返回path最后的文件名。如何path以/或结尾,那么就会返回空值。即os.path.split(path)的第二个元素
    23 os.path.exists(path)        如果path存在,返回True;如果path不存在,返回False
    24 os.path.isabs(path)         如果path是绝对路径,返回True
    25 os.path.isfile(path)        如果path是一个存在的文件,返回True。否则返回False
    26 os.path.isdir(path)         如果path是一个存在的目录,则返回True。否则返回False
    27 os.path.join(path1[, path2[, ...]])  将多个路径组合后返回,第一个绝对路径之前的参数将被忽略
    28 os.path.getatime(path)      返回path所指向的文件或者目录的最后存取时间
    29 os.path.getmtime(path)      返回path所指向的文件或者目录的最后修改时间
    View Code

      第三方模块:

        在Python中,安装第三方模块,是通过setuptools这个工具完成的。Python有两个封装了setuptools的包管理工具:easy_installpip。目前官方推荐使用pip

    pip3 install requests   #这里使用pip3的版本   
     1 import requests,json
     2 
     3 response = requests.get('http://wthrcdn.etouch.cn/weather_mini?city=北京')  #调取北京天气的借口
     4 response.encoding = 'utf-8' #设置字符编码
     5 dic = json.loads(response.text) #通过json序列化成一个字典
     6 print(dic,type(dic))
     7 
     8 print(response.status_code) #查看响应状态码
     9 
    10 #输出内容:
    11 
    12 {'status': 1000, 'data': {'ganmao': '相对于今天将会出现大幅度降温,易发生感冒,请注意适当增加衣服,加强自我防护避免感冒。', 'yesterday': {'fx': '无持续风向', 'high': '高温 30℃', 'fl': '微风', 'date': '5日星期日', 'type': '多云', 'low': '低温 18℃'}, 'wendu': '29', 'forecast': [{'high': '高温 31℃', 'fengli': '微风级', 'fengxiang': '无持续风向', 'date': '6日星期一', 'type': '多云', 'low': '低温 19℃'}, {'high': '高温 24℃', 'fengli': '微风级', 'fengxiang': '无持续风向', 'date': '7日星期二', 'type': '雷阵雨', 'low': '低温 16℃'}, {'high': '高温 31℃', 'fengli': '微风级', 'fengxiang': '无持续风向', 'date': '8日星期三', 'type': '多云', 'low': '低温 20℃'}, {'high': '高温 32℃', 'fengli': '3-4级', 'fengxiang': '南风', 'date': '9日星期四', 'type': '', 'low': '低温 22℃'}, {'high': '高温 30℃', 'fengli': '微风级', 'fengxiang': '无持续风向', 'date': '10日星期五', 'type': '雷阵雨', 'low': '低温 20℃'}], 'aqi': '154', 'city': '北京'}, 'desc': 'OK'} <class 'dict'>
    13 200   #状态码
    View Code

      自定义模块:    

    1 #s1.py
    2 
    3 def login():
    4     print("login")
    5 
    6 def logout():
    7     print("logout")
     1 #s2.py
     2 
     3 import s1
     4 
     5 s1.login()
     6 s1.logout()
     7 
     8 #输出:
     9 login     
    10 logout

      (五) 序列化模块:

           json

             pickle

       json:

         dumps: 将Python的基本数据类型转换成字符串形式

         loads: 将Python字符串形式转换成可用数据类型

     1 import json
     2 
     3 # dumps
     4 # loads
     5 
     6 dic = {"k1":"v1"}
     7 print(dic,type(dic))
     8 result = json.dumps(dic)
     9 print(result,type(result))
    10 
    11 s1 = '{"k1": 123}'
    12 dic = json.loads(s1)  #通过loads反序列化时,一定要使用双引号“”
    13 print(dic,type(dic))
    14 
    15 #输出:
    16 {'k1': 'v1'} <class 'dict'>
    17 {"k1": "v1"} <class 'str'>
    18 {'k1': 123} <class 'dict'>

       dump #将json数据写入json文件里

       load   #将json文件里的数据读出来显示

     1 dump #将json数据写入json文件里
     2 load #将 json文件里的数据读出来显示
     3 
     4 import json
     5 #li = [11,22,33]   
     6 li = {"hong":123,"fei":345} #定义字典
     7 print(type(li))
     8 json.dump(li,open('db','w')) #写入字典到json文件db
     9 li = json.load(open('db','r')) #读出db里内容
    10 print(type(li),li)
    11 
    12 #输出:
    13 <class 'dict'>
    14 <class 'dict'> {'hong': 123, 'fei': 345}
    15 #db内容:
    16
    {"hong": 123, "fei": 345}

      pickle模块:

        与json类似,但只能用于Python,json则可以跨平台。

        dumps

        loads

    import pickle
    li = [11,22,33]
    r = pickle.dumps(li)
    print(r)
    
    result = pickle.loads(r)
    print(result)
    #输出:
    
    b'x80x03]qx00(Kx0bKx16K!e.' 
    [11, 22, 33]

      dump

      load

     1 import pickle
     2 
     3 li = [11,22,33]
     4 pickle.dump(li,open('db','wb'))
     5 result = pickle.load(open('db','rb'))
     6 print(result)
     7 
     8 #输出:
     9 [11, 22, 33]  #通过load读出来原格式
    10 #db文件内容:
    11 �]q (KKK!e.  无法识别的编码

      

        json与pickle的对比:

           json:更加适合跨语言,字符串,基本数据类型

           pickle:仅适用于Python ,Python的所有类型的序列化

      

      本节内容先总结到这里,新内容后续补充,谢谢查看! 

  • 相关阅读:
    leetcode 334. Increasing Triplet Subsequence
    leetcode 235. Lowest Common Ancestor of a Binary Search Tree
    leetcode 459. Repeated Substring Pattern
    python爬虫之Xpath
    python爬虫之bs4 美丽汤
    python3爬虫的模拟浏览器
    python爬虫之requests库
    ModelForm:表单中的 Field 和模型中的 Field重复解决
    django中关于表单自定义验证器和常用验证器
    关于http连接的本质 已经cookies和session
  • 原文地址:https://www.cnblogs.com/python-nameless/p/5564785.html
Copyright © 2020-2023  润新知