本节主要内容
1. 什么是序列化
2. pickle(重点)
3. shelve
4. json(重点)
5. configparser模块
⼀. 什么是序列化
在我们存储数据或者⽹络传输数据的时候. 需要对我们的对象进⾏处理. 把对象处理成
⽅便存储和传输的数据格式. 这个过程叫序列化. 不同的序列化, 结果也不同. 但是⽬的是⼀
样的. 都是为了存储和传输.
在python中存在三种序列化的方案。
1.pickle. 可以将我们python中的任意数据类型转化成bytes并写入到⽂件中. 同样也
可以把⽂件中写好的bytes转换回我们python的数据. 这个过程被称为反序列化。
2. shelve. 简单另类的⼀种序列化的⽅案. 有点⼉类似后⾯我们学到的redis. 可以作为
⼀种⼩型的数据库来使⽤。
3. json. 将python中常⻅的字典, 列表转化成字符串. 是⽬前前后端数据交互使⽤频率
最⾼的⼀种数据格式.
⼆. pickle(重点)
pickle⽤起来很简单. 说⽩了. 就是把我们的python对象写入到⽂件中的⼀种解决⽅案.
但是写入到⽂件的是bytes. 所以这东⻄不是给⼈看的. 是给机器看的.
import pickle class Cat: def __init__(self, name, age): self.name = name self.age = age def catchMouse(self): print(self.name, "抓⽼⿏") c = Cat("jerry", 18) bs = pickle.dumps(c) # 序列化⼀个对象. print(bs) # ⼀堆⼆进制. 看不懂 cc = pickle.loads(bs) # 把⼆进制反序列化成我们的对象 cc.catchMouse() # 猫依然是猫. 还可以抓⽼⿏
pickle中的dumps可以序列化⼀个对象. loads可以反序列化⼀个对象. 我们使⽤dump
还可以直接 把⼀个对象写入到⽂件中
# f = open("cat", mode="wb") # pickle.dump(c, f) # 写⼊到⽂件中 # f.close() f = open("cat", mode="rb") cc = pickle.load(f) # 从⽂件中读取对象 cc.catchMouse()
pickle还支持多个对象的写出。
lst = [Cat("jerry", 19), Cat("tommy", 20), Cat("alpha", 21)] f = open("cat", mode="wb") for el in lst: pickle.dump(el, f) # 写⼊到⽂件中 f.close() f = open("cat", mode="rb") for i in range(len(lst)): cc = pickle.load(f) # 从⽂件中读取对象 cc.catchMouse()
但是这样写并不够好,因为读的时候。并不能知道有多少对象要读。这里记住不能一行一行的读
那要写入或者读取多个内容怎么办?很简单。装list里,然后读取和写入都用list
lst = [Cat("jerry", 19), Cat("tommy", 20), Cat("alpha", 21)] f = open("cat", mode="wb") pickle.dump(lst, f) f = open("cat", mode="rb") ll = pickle.load(f) for el in ll: el.catchMouse()
记住⼀点, pickle序列化的内容是⼆进制的内容(bytes) 不是给⼈看的.
三. shelve
shelve提供python的持久化操作. 什么叫持久化操作呢? 说⽩话,就是把数据写到硬盘上.
在操作shelve的时候非常的像操作⼀个字典. 这个东⻄到后期. 就像redis差不多.
import shelve shelf = shelve.open("sylar") # shelf["jay"] = "周杰伦" print(shelf['jay']) shelf.close()
这鬼东西和字典差不多。只不过你的字典是一个文件。下面储存一些复杂的数据。
s = shelve.open("sylar") # s["jay"] = {"name":"周杰伦", "age":18, "hobby":"哄⼩孩"} print(s['jay']) s.close()
但是这里有坑
s = shelve.open("sylar") s['jay']['name'] = "胡辣汤" # 尝试改变字典中的数据 s.close() s = shelve.open("sylar") print(s['jay']) # 并没有改变 s.close()
解决方案
s = shelve.open("sylar", writeback=True) s['jay']['name'] = "胡辣汤" # 尝试改变字典中的数据 s.close() s = shelve.open("sylar") print(s['jay']) # 改变了. s.close()
writeback = True 可以动态的把我们修改的信息写入到文件中,而且这个鬼东西还可以删除数据
就像字典一样。上一波操作
s = shelve.open("sylar", writeback=True) del s['jay'] s.close() s = shelve.open("sylar") print(s['jay']) # 报错了, 没有了 s.close() s = shelve.open("sylar", writeback=True) s['jay'] = "周杰伦" s['wlj'] = "王⼒宏" s.close() s = shelve.open("sylar") for k in s: # 像字典⼀样遍历 print(k) print(s.keys()) # 拿到所有key的集合 for k in s.keys(): print(k) for k, v in s.items(): # 像字典⼀样操作 print(k, v) s.close()
综上shelve就当字典来用就行了,它比redis还简单。。。。
四. json(重点)
终于到json了. json是我们前后端交互的枢纽. 相当于编程界的普通话. ⼤家沟通都⽤
json. 为什么这样呢? 因为json的语法格式可以完美的表⽰出⼀个对象. 那什么是json: json全
称javascript object notation. 翻译过来叫js对象简谱. 很复杂是吧? 来上⼀段我们认识的代
码:
wf = { "name":"汪峰", "age":18, "hobby":"上头条", "wife":{ "name":'⼦怡', "age":19, "hobby":["唱歌", "跳舞", "演戏"] } }
你会发现这玩意儿不就是字典嘛,对的!在python中这东西就叫字典。但在JavaScript中这东西
叫json,我们发现用这样的数据结构可以完美的表示出任何对象。并且可以完整的把对象表示出
来。只要代码格式比较好。那可读性也很强的。所以大家公认用这样一种数据结构作为数据交互
的格式。那这玩意儿之前是什么呢?是xml。。来看这个:
<?xml version="1.0" encoding="utf-8" ?> <wf> <name>汪峰</name> <age>18</age> <hobby>上头条</hobby> <wife> <name>⼦怡</name> <age>18</age> <hobbies> <hobby>唱歌</hobby> <hobby>跳舞</hobby> <hobby>演戏</hobby> </hobbies> </wife> </wf>
远古程序员都是用这样的数据进行传输的,其他的不说。主要这玩意需要解析,那酸爽简直了,相死的心都有!太难解析以前的项目几乎没有用ajax的。
那好既然json这么的牛逼。那怎么用呢?我们的程序是在python中写的。但是前端是在js那边来解析
的。所以,我们需要把我们的程序产生的字典转化成json格式的json串(字符串)。然后网络传输
那我们如何把字典转成我们的json格式的字符串呢?很简单,上代码:
import json dic = {"a": "⼥王", "b": "萝莉", "c": "⼩清新"} s = json.dumps(dic) # 把字典转化成json字符串 print(s) # {"a": "u5973u738b", "b": "u841du8389", "c": "u5c0fu6e05u65b0"}
但是结果很不友好啊。中文该如何处理呢?在dumps的时候给出另外一个参数就可以了
ensure_ascii = False就可以了
import json dic = {"a": "⼥王", "b": "萝莉", "c": "⼩清新"} s = json.dumps(dic, ensure_ascii=False) # 把字典转化成json字符串 print(s) # {"a": "⼥王", "b": "萝莉", "c": "⼩清新"}
前端给你传递信息了。你要把前端传递过来的json字符串转化成字典。
import json s = '{"a": "⼥王", "b": "萝莉", "c": "⼩清新"}' dic = json.loads(s) print(type(dic), dic)
json也可以像pickle一样把序列化的结果写入到文件中。
dic = {"a": "⼥王", "b": "萝莉", "c": "⼩清新"} f = open("test.json", mode="w", encoding="utf-8") json.dump(dic, f, ensure_ascii=False) # 把对象打散成json写⼊到⽂件中 f.close()
同样也可以从文件中读取一个json
f = open("test.json", mode="r", encoding="utf-8") dic = json.load(f) f.close() print(dic)
我们可以向同一个文件中写入多个json串。但是读不行。
import json lst = [{"a": 1}, {"b": 2}, {"c": 3}] f = open("test.json", mode="w", encoding="utf-8") for el in lst: json.dump(el, f) f.close()
注意!此时文件中的内容是一行内容。
那么要如何解决呢?有两种方案:
方案一:
把所有的内容准备好统一进行写入和读取。但是这样的话数据量小还好如果数据量很大
就很不友好了。
方案二:
不用dump,改用dumps和loads。对每一行进行处理。
import json lst = [{"a": 1}, {"b": 2}, {"c": 3}] # 写⼊ f = open("test.json", mode="w", encoding="utf-8") for el in lst: s = json.dumps(el, ensure_ascii=True) + " " f.write(s) f.close() # 读取 f = open("test.json", mode="r", encoding="utf-8") for line in f: dic = json.loads(line.strip()) print(dic) f.close()