• 序列化模块


    序列化:从数据类型---->字符串的过程

    反序列化:从字符串----->数据类型的过程

    使用场景:

    1.数据存储和提取

    2.网络传输的时候

    序列化模块:

    1.json  重要指数:五星  

    特点:

    ①通用的序列化格式

    ②只有很少的一部分数据类型能够通过jason转化成字符串

    2.pickle   重要指数:四星  

    特点:

    ①所有的python中的数据类型都可以转化成字符串形式

    ②pickle序列化的内容只有python能理解

    ③部分反序列化依赖python代码

    3.shelve  重要指数:三星

    特点:

    ①序列化句柄

    ②使用句柄直接操作,非常方便

    方法:

    json  适用的数据类型:数字、字符串、列表、字典、元组(元组是转换成列表进行序列化)

    dumps  序列化方法      loads  反序列化方法

    这是在内存中将数据进行序列化和反序列化操作,数据还在内存中。

    import json
    dic = {'k1':'v1','k2':'v2','k3':'v3'}
    str_dic = json.dumps(dic)  #序列化:将一个字典转换成一个字符串
    print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
    #注意,json转换完的字符串类型的字典中的字符串是由""表示的
    
    dic2 = json.loads(str_dic)  #反序列化:将一个字符串格式的字典转换成一个字典
    #注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
    print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
    
    
    list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
    str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型 
    print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
    list_dic2 = json.loads(str_dic)
    print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]
    
    loads和dumps

    dump 和 load  对文件进行操纵,直接把数据类型序列化后存储,和反序列化的提取数据类型

    import json
    f = open('json_file','w')
    dic = {'k1':'v1','k2':'v2','k3':'v3'}
    json.dump(dic,f)  #dump方法接收一个文件句柄,直接将字典转换成json字符串写入文件
    f.close()
    
    f = open('json_file')
    dic2 = json.load(f)  #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
    f.close()
    print(type(dic2),dic2)
    
    load和dump

    编码中文的问题 ,在dumps和dump  ensure_ascii 加上就能在文件中显示中文,否则是bytes类型显示在文件中,但是并不影响存储和提取

    import json
    f = open('file','w')
    json.dump({'国籍':'中国'},f)
    ret = json.dumps({'国籍':'中国'})
    f.write(ret+'
    ')
    json.dump({'国籍':'美国'},f,ensure_ascii=False)
    ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
    f.write(ret+'
    ')
    f.close()
    
    ensure_ascii关键字参数  

    dump和load在文件中的操作只能是一次性的,多次写就不能load,报错,利用dumps和loads解决多行存取的问题

    import json
    l = [{'k': '111'},{'k2': '111'}, {'k3': '111'}]
    f = open('file', 'w')
    
    for dic in l:
        str_dic = json.dumps(dic)
        f.write(str_dic+'
    ')
    f.close()
    
    f = open('file')
    
    l = []
    for line in f:
        dic = json.loads(line.strip())
        l.append(dic)
    f.close()
    print(l)

    pickle

    pickle模块提供了四个功能:dumps、dump(序列化,存)、loads(反序列化,读)、load  (不仅可以序列化字典,列表...可以把python中任意的数据类型序列化

    dumps和loads是针对内存当中的数据类型进行序列化

    dump和load是针对文件当中的存取

    dumps 和 loads
    >>> import pickle
    >>> dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
    >>> pickle.dumps(dic)  # bytes类型
    b'x80x03}qx00(Xx02x00x00x00k1qx01Xx02x00x00x00v1qx02Xx02x00x00x00k2qx03Xx02x00x00x00v2qx04Xx02x00x00x00k3qx05Xx02x00.'
    
    >>> dic1 = pickle.dumps(dic)
    >>> pickle.loads(dic1)  # 转成字典类型
    {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
    
    dump 和 load
    import pickle
    dic = {'k1': '中国', 'k2': 'v2', 'k3': 'v3'}
    
    
    f = open('fff', 'wb')  # 写的时候需要用b模式
    pickle.dump(dic, f)   # 多次写
    pickle.dump(dic, f)
    f.close()
    
    f = open('fff', 'rb')  # load的时候需要用b模式  同时可以多次写,同等次数的读,次数不同会漏
    data = pickle.load(f)
    data1 = pickle.load(f)
    f.close()
    print(data, data1)

    json & pickle

    相同的地方:都有dumps、loads、dump、load四个方法

    不同的地方:

    json:跨语言,通用型,只支持数字、字符串、列表、元组、字典数据类型的序列化操作,体积小

    pickle:支持python所有数据类型的序列化操作,占内存,dump和load的时候必须是在b的模式下。

    使用:如果你序列化的内容是列表或者字典,我们非常推荐你使用json模块;但如果出于某种原因你不得不序列化其他的数据类型,而未来你还会用python对这个数据进行反序列化的话,那么就可以使用pickle

    shelve

    shelve模块是一个简单的k,v将内存数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据格式

    shelve只提供给我们一个open方法,是用key来访问的,使用起来和字典类似。

    shelve.open(filename, flag='c', protocol=None, writeback=False) # 4个参数
    import shelve
    
    f = shelve.open('shelve_test')  # 打开一个文件
    
    names = ["alex", "rain", "test"]
    info = {'name':'alex','age':22}
    
    f["names"] = names  # 持久化列表
    f['info_dic'] = info
    
    f.close()

    import shelve
    f1 = shelve.open('shelve_file')
    existing = f1['names']  #取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错
    f1.close()
    print(existing)
     

    这个模块有个限制,它不支持多个应用同一时间往同一个DB进行写操作。所以当我们知道我们的应用如果只进行读操作,我们可以让shelve通过只读方式打开DB

    import shelve
    f = shelve.open('shelve_file', flag='r')
    existing = f['key']
    f.close()
    print(existing)

    由于shelve在默认情况下是不会记录待持久化对象的任何修改的,所以我们在shelve.open()时候需要修改默认参数,否则对象的修改不会保存。

    import shelve
    f1 = shelve.open('shelve_file')  # 此时修改不能保存
    print(f1['key'])
    f1['key']['new_value'] = 'this was not here before'
    f1.close()
    
    f2 = shelve.open('shelve_file', writeback=True)  # 修改保存
    print(f2['key'])
    f2['key']['new_value'] = 'this was not here before'
    f2.close()

    writeback方式有优点也有缺点。优点是减少了我们出错的概率,并且让对象的持久化对用户更加的透明了;但这种方式并不是所有的情况下都需要,首先,使用writeback以后,shelf在open()的时候会增加额外的内存消耗,并且当DB在close()的时候会将缓存中的每一个对象都写入到DB,这也会带来额外的等待时间。因为shelve没有办法知道缓存中哪些对象修改了,哪些对象没有修改,因此所有的对象都会被写入。

  • 相关阅读:
    java.lang.ExceptionInInitializerError异常分析
    项目中碰到的ExceptionInInitializerError异常
    获取全局上下文(getApplicationContext)_创建Shared Preference工具类_实现自动登录
    IntelliJ Idea 常用快捷键列表
    Qt 创建圆角、无边框、有阴影、可拖动的窗口 good
    去掉 Windows 中控件的虚线框(当当 element == QStyle::PE_FrameFocusRect 时,直接返回,不绘制虚线框)
    Qt 显示 GIF
    C++ 查看预处理后的源文件(查看真实代码)
    数据库访问工具 DBUtl(公孙二狗)
    Tornado
  • 原文地址:https://www.cnblogs.com/james201133002/p/9207817.html
Copyright © 2020-2023  润新知