• 3.31课堂


    今日内容:
    六 json&pickle模块
    七 shelve模块(了解)
    八 xml模块(了解)

    九 configparser模块

    十 hashlib模块

    subprocess模块.py

    课外知识:用pycharm装模块的步骤

    六 json&pickle模块
    # 1、什么是序列化&反序列化
    # 内存中的数据类型---->序列化---->特定的格式(json格式或者pickle格式)
    # 内存中的数据类型<----反序列化<----特定的格式(json格式或者pickle格式)

    # 土办法:
    # {'aaa':111}--->序列化str({'aaa':111})----->"{'aaa':111}"
    # {'aaa':111}<---反序列化eval("{'aaa':111}")<-----"{'aaa':111}"

    # 2、为何要序列化
    # 序列化得到结果=>特定的格式的内容有两种用途
    # 1、可用于存储=》用于存档
    # 2、传输给其他平台使用=》跨平台数据交互
    # python java
    # 列表 特定的格式 数组

    # 强调:
    # 针对用途1的特定一格式:可是一种专用的格式=》pickle只有python可以识别
    # 针对用途2的特定一格式:应该是一种通用、能够被所有语言识别的格式=》json


    # 3、如何序列化与反序列化
    # 示范1
    # import json
    # # 序列化
    # json_res=json.dumps([1,'aaa',True,False])
    # # print(json_res,type(json_res)) # "[1, "aaa", true, false]"

    # # 反序列化
    # l=json.loads(json_res)
    # print(l,type(l))


    # 示范2:
    import json

    # 序列化的结果写入文件的复杂方法
    # json_res=json.dumps([1,'aaa',True,False])
    # # print(json_res,type(json_res)) # "[1, "aaa", true, false]"
    # with open('test.json',mode='wt',encoding='utf-8') as f:
    # f.write(json_res)

    # 将序列化的结果写入文件的简单方法
    # with open('test.json',mode='wt',encoding='utf-8') as f:
    # json.dump([1,'aaa',True,False],f)


    # 从文件读取json格式的字符串进行反序列化操作的复杂方法
    # with open('test.json',mode='rt',encoding='utf-8') as f:
    # json_res=f.read()
    # l=json.loads(json_res)
    # print(l,type(l))

    # 从文件读取json格式的字符串进行反序列化操作的简单方法
    # with open('test.json',mode='rt',encoding='utf-8') as f:
    # l=json.load(f)
    # print(l,type(l))

    pickle下也有load和dump方法

    json 格式是字符串类型,必须是用双引号,没有单引号的形式


    # json验证: json格式兼容的是所有语言通用的数据类型,不能识别某一语言的所独有的类型
    # json.dumps({1,2,3,4,5})

    # json强调:一定要搞清楚json格式,不要与python混淆
    # l=json.loads('[1, "aaa", true, false]')
    # l=json.loads("[1,1.3,true,'aaa', true, false]")
    # print(l[0])

    # 了解
    # l = json.loads(b'[1, "aaa", true, false]')
    # print(l, type(l))

    # with open('test.json',mode='rb') as f:
    # l=json.load(f)


    # res=json.dumps({'name':'哈哈哈'})
    # print(res,type(res))

    # res=json.loads('{"name": "u54c8u54c8u54c8"}')
    # print(res,type(res))

    # 在python解释器2.7与3.6之后都可以json.loads(bytes类型),但唯独3.5不可以
    >>> import json
    >>> json.loads(b'{"a":111}')
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    File "/Users/linhaifeng/anaconda3/lib/python3.5/json/__init__.py", line 312, in loads
    s.__class__.__name__))
    TypeError: the JSON object must be str, not 'bytes'


    # 4、猴子补丁
    # 比如用别人的模块,但是模块中的一些功能想要换成自己的,这个时候就需要打个补丁上去,也就是猴子补丁
    # 在入口处打猴子补丁(bin下的start.py 文件)
    # import json
    # import ujson

    # def monkey_patch_json():
    # json.__name__ = 'ujson' # 这步做不做无关紧要
    # 答补丁就是在给这两行内容打,ujson 比dumps运行快
    # json.dumps = ujson.dumps
    # json.loads = ujson.loads
    #
    # monkey_patch_json() # 在入口文件出运行


    # import ujson as json # 这个操作不行

    # 后续代码中的应用
    # json.dumps()
    # json.dumps()
    # json.dumps()
    # json.dumps()


    # 5.pickle模块
    import pickle
    # 序列化
    # res=pickle.dumps({1,2,3,4,5})
    # print(res,type(res))

    # 反序列化
    # s=pickle.loads(res)
    # print(s,type(s))

    # coding:utf-8
    import pickle

    with open('a.pkl',mode='wb') as f:
    # 一:在python3中执行的序列化操作如何兼容python2
    # python2不支持protocol>2,默认python3中protocol=4
    # 所以在python3中dump操作应该指定protocol=2
    pickle.dump('你好啊',f,protocol=2)

    with open('a.pkl', mode='rb') as f:
    # 二:python2中反序列化才能正常使用
    res=pickle.load(f)
    print(res)


    xml模块(了解)

    xml的格式如下,就是通过<>节点来区别数据结构的:


    <?xml version="1.0"?>
    <data>
    <country name="Liechtenstein">
    <rank updated="yes">2</rank>
    <year>2008</year>
    <gdppc>141100</gdppc>
    <neighbor name="Austria" direction="E"/>
    <neighbor name="Switzerland" direction="W"/>
    </country>
    <country name="Singapore">
    <rank updated="yes">5</rank>
    <year>2011</year>
    <gdppc>59900</gdppc>
    <neighbor name="Malaysia" direction="N"/>
    </country>
    <country name="Panama">
    <rank updated="yes">69</rank>
    <year>2011</year>
    <gdppc>13600</gdppc>
    <neighbor name="Costa Rica" direction="W"/>
    <neighbor name="Colombia" direction="E"/>
    </country>
    </data>

    xml协议在各个语言里的都 是支持的,在python中可以用以下模块操作xml:
    # print(root.iter('year')) #全文搜索
    # print(root.find('country')) #在root的子节点找,只找一个
    # print(root.findall('country')) #在root的子节点找,找所有

    import xml.etree.ElementTree as ET

    tree = ET.parse("xmltest.xml")
    root = tree.getroot()
    print(root.tag)

    #遍历xml文档
    for child in root:
    print('========>',child.tag,child.attrib,child.attrib['name'])
    for i in child:
    print(i.tag,i.attrib,i.text)

    #只遍历year 节点
    for node in root.iter('year'):
    print(node.tag,node.text)
    #---------------------------------------

    import xml.etree.ElementTree as ET

    tree = ET.parse("xmltest.xml")
    root = tree.getroot()

    #修改
    for node in root.iter('year'):
    new_year=int(node.text)+1
    node.text=str(new_year)
    node.set('updated','yes')
    node.set('version','1.0')
    tree.write('test.xml')


    #删除node
    for country in root.findall('country'):
    rank = int(country.find('rank').text)
    if rank > 50:
    root.remove(country)

    tree.write('output.xml')

    shelve模块(了解)
    shelve模块比pickle模块简单,只有一个open函数,返回类似字典的对象,可读可写;key必须为字符串,而值可以是python所支持的数据类型

    import shelve

    f=shelve.open(r'sheve.txt')
    # f['stu1_info']={'name':'egon','age':18,'hobby':['piao','smoking','drinking']}
    # f['stu2_info']={'name':'gangdan','age':53}
    # f['school_info']={'website':'http://www.pypy.org','city':'beijing'}

    print(f['stu1_info']['hobby'])
    f.close()


    configparser模块
    该模块用来加载某种格式配置文件的配置项,比settings用着方便

    import configparser

    config=configparser.ConfigParser()
    config.read('test.ini')

    # 1、获取sections
    # print(config.sections())

    # 2、获取某一section下的所有options
    # print(config.options('section1'))

    # 3、获取items
    # print(config.items('section1'))

    # 4、
    # res=config.get('section1','user')
    # print(res,type(res))

    # res=config.getint('section1','age')
    # print(res,type(res))


    # res=config.getboolean('section1','is_admin')
    # print(res,type(res))


    # res=config.getfloat('section1','salary')
    # print(res,type(res))


    配置文件如下:

    # 注释1
    ; 注释2

    [section1]
    k1 = v1
    k2:v2
    user=egon
    age=18
    is_admin=true
    salary=31

    [section2]
    k1 = v1

    读取

    import configparser

    config=configparser.ConfigParser()
    config.read('a.cfg')

    #查看所有的标题
    res=config.sections() #['section1', 'section2']
    print(res)

    #查看标题section1下所有key=value的key
    options=config.options('section1')
    print(options) #['k1', 'k2', 'user', 'age', 'is_admin', 'salary']

    #查看标题section1下所有key=value的(key,value)格式
    item_list=config.items('section1')
    print(item_list) #[('k1', 'v1'), ('k2', 'v2'), ('user', 'egon'), ('age', '18'), ('is_admin', 'true'), ('salary', '31')]

    #查看标题section1下user的值=>字符串格式
    val=config.get('section1','user')
    print(val) #egon

    #查看标题section1下age的值=>整数格式
    val1=config.getint('section1','age')
    print(val1) #18

    #查看标题section1下is_admin的值=>布尔值格式
    val2=config.getboolean('section1','is_admin')
    print(val2) #True

    #查看标题section1下salary的值=>浮点型格式
    val3=config.getfloat('section1','salary')
    print(val3) #31.0

    改写

    import configparser

    config=configparser.ConfigParser()
    config.read('a.cfg',encoding='utf-8')


    #删除整个标题section2
    config.remove_section('section2')

    #删除标题section1下的某个k1和k2
    config.remove_option('section1','k1')
    config.remove_option('section1','k2')

    #判断是否存在某个标题
    print(config.has_section('section1'))

    #判断标题section1下是否有user
    print(config.has_option('section1',''))


    #添加一个标题
    config.add_section('egon')

    #在标题egon下添加name=egon,age=18的配置
    config.set('egon','name','egon')
    config.set('egon','age',18) #报错,必须是字符串


    #最后将修改的内容写入文件,完成最终的修改
    config.write(open('a.cfg','w'))

    基于上述方法添加一个ini文档
    import configparser

    config = configparser.ConfigParser()
    config["DEFAULT"] = {'ServerAliveInterval': '45',
    'Compression': 'yes',
    'CompressionLevel': '9'}

    config['bitbucket.org'] = {}
    config['bitbucket.org']['User'] = 'hg'
    config['topsecret.server.com'] = {}
    topsecret = config['topsecret.server.com']
    topsecret['Host Port'] = '50022' # mutates the parser
    topsecret['ForwardX11'] = 'no' # same here
    config['DEFAULT']['ForwardX11'] = 'yes'
    with open('example.ini', 'w') as configfile:
    config.write(configfile)


    hashlib模块
    # 1、什么是哈希hash
    # hash一类算法,该算法接受传入的内容,经过运算得到一串hash值
    # hash值的特点:
    #I 只要传入的内容一样,得到的hash值必然一样
    #II 不能由hash值返解成内容
    #III 不管传入的内容有多大,只要使用的hash算法不变,得到的hash值长度是一定

    # 2、hash的用途
    # 用途1:特点II用于密码密文传输与验证
    # 用途2:特点I、III用于文件完整性校验

    # 3、如何用
    # import hashlib
    #
    # m=hashlib.md5()
    # m.update('hello'.encode('utf-8'))
    # m.update('world'.encode('utf-8'))
    # res=m.hexdigest() # 'helloworld'
    # print(res)
    #
    # m1=hashlib.md5('he'.encode('utf-8'))
    # m1.update('llo'.encode('utf-8'))
    # m1.update('w'.encode('utf-8'))
    # m1.update('orld'.encode('utf-8'))
    # res=m1.hexdigest()# 'helloworld'
    # print(res)

    # 模拟撞库
    # cryptograph='aee949757a2e698417463d47acac93df'
    # import hashlib
    #
    # # 制作密码字段
    # passwds=[
    # 'alex3714',
    # 'alex1313',
    # 'alex94139413',
    # 'alex123456',
    # '123456alex',
    # 'a123lex',
    # ]
    #
    # dic={}
    # for p in passwds:
    # res=hashlib.md5(p.encode('utf-8'))
    # dic[p]=res.hexdigest()
    #
    # # 模拟撞库得到密码
    # for k,v in dic.items():
    # if v == cryptograph:
    # print('撞库成功,明文密码是:%s' %k)
    # break


    # 提升撞库的成本=>密码加盐
    import hashlib

    m=hashlib.md5()

    m.update('天王'.encode('utf-8'))
    m.update('alex3714'.encode('utf-8'))
    m.update('盖地虎'.encode('utf-8'))
    print(m.hexdigest())


    # m.update(文件所有的内容)
    # m.hexdigest()
    #
    # f=open('a.txt',mode='rb')
    # f.seek()
    # f.read(2000) # 巨琳
    # m1.update(文见的一行)
    #
    # m1.hexdigest()


    subprocess模块:用来执行系统命令

    import subprocess

    obj=subprocess.Popen('echo 123 ; ls / ; ls /root',shell=True,
    stdout=subprocess.PIPE,
    stderr=subprocess.PIPE,
    )

    # print(obj)
    # res=obj.stdout.read()
    # print(res.decode('utf-8'))

    err_res=obj.stderr.read()
    print(err_res.decode('utf-8'))


    1 import subprocess
    2
    3 '''
    4 sh-3.2# ls /Users/egon/Desktop |grep txt$
    5 mysql.txt
    6 tt.txt
    7 事物.txt
    8 '''
    9
    10 res1=subprocess.Popen('ls /Users/jieli/Desktop',shell=True,stdout=subprocess.PIPE)
    11 res=subprocess.Popen('grep txt$',shell=True,stdin=res1.stdout,
    12 stdout=subprocess.PIPE)
    13
    14 print(res.stdout.read().decode('utf-8'))
    15
    16
    17 #等同于上面,但是上面的优势在于,一个数据流可以和另外一个数据流交互,可以通过爬虫得到结果然后交给grep
    18 res1=subprocess.Popen('ls /Users/jieli/Desktop |grep txt$',shell=True,stdout=subprocess.PIPE)
    19 print(res1.stdout.read().decode('utf-8'))
    20
    21
    22 #windows下:
    23 # dir | findstr 'test*'
    24 # dir | findstr 'txt$'
    25 import subprocess
    26 res1=subprocess.Popen(r'dir C:UsersAdministratorPycharmProjects est函数备课',shell=True,stdout=subprocess.PIPE)
    27 res=subprocess.Popen('findstr test*',shell=True,stdin=res1.stdout,
    28 stdout=subprocess.PIPE)

  • 相关阅读:
    Mac下Selenium无法最大化Chrome解决方案
    Mac环境配置好ant后提示Permission denied
    禁止Chrome浏览器自动升级
    Selenium滚动条window.scrollTo和window.scrollBy
    Windows和Linux如何使用Java代码实现关闭进程
    自动化测试框架Selenium工作原理
    Mac下用SSH连接远程Linux或Mac服务器
    mac显示隐藏文件
    Selenium自动化测试脚本中三种等待时间简介
    Java虚拟机之栈
  • 原文地址:https://www.cnblogs.com/haliluyafeng/p/12609589.html
Copyright © 2020-2023  润新知