os 即操作系统
在 os 中提供了很多关于文件,文件夹,路径处理的函数
这是我们学习的重点
os.path 是os模块下专门用于处理路径相关的
python是一门跨平台语言,由于每个平台路径规则不同
需要一个模块来使得路径可以自动根据平台进行变化
path模块仅仅是对路径(字符串)进行操作 不会直接操作文件
os.path.abspath #返回一个绝对路径
把路径和最后的文件名/文件夹名单独切出来
os.path.split
os.path.exists #判断路径是否存在
isabs#是否是绝对路径 原理是看第一个是不是路径分隔符
os.path.join #当前操作系统的分隔符来拼接
# import os
# print(os.getcwd())
#修改当前全部工作目录
# os.chdir('test')
# print(os.getcwd())
#.代表当前
# print(os.curdir)
#..代表上一级
# print(os.pardir)
#创建多级目录 不同平台 路径分隔符不同
# os.makedirs('a\b\c\')
#获取当前平台的路径分隔符
# print(os.sep)
#使用join拼接路径
# os.makedirs(os.sep.join(['a','b','c']))
#会先尝试查找a 这个路径 找到以后在里面创建c
# os.mkdir('a/b/c')
#目录部位空时 无法删除 需要递归删除
# os.removedirs('a/b/c')
#获取目录下的所有文件包括文件夹
# os.listdir(r'.....')
# dir=r'......'
# # li= os.listdir(dir)
# def show_file(path):
# li = os.listdir(path)
# for i in li:
# print(path+'\'+i)
# #拼接完成路径
# # os.path.isfile(dir+'\'+i) #判断是否是文件
# # os.path.isdir(dir+'\'+i)#判断是否是路径
# #如果是文件夹就继续递归
# if os.path.isdir(path+'\'+i)
# show_file(path+'\'+i)
# show_file(dir)
# os.rmdir 删除单级空目录
# os.path.getsize #获取文件大小
#直接把执行结果控制到控制台
# os.system('tasklist')
#查找文件*****
# BASE_PATH=os.path.dirname(os.path.dirname(__file__))
# LOG_PATH=os.path.join(BASE_PATH)
# print(LOG_PATH)
# os.path.gettime 查找文件最后修改时间
在python中json是一个模块
JSON :JavaScript Object Nation js 对象表示法
当年的HTML独领风骚
上网大多数情况下指的是打开网页
浏览器中运行的js语言
做后台服务器 必须保证你的数据是浏览器(JS)能够看懂的
js能看懂什么?就是json
json数据类型与python数据类型的对应关系
python中的格式 json格式
字符 字符 必须是双引号
数字 数字
字典 字典
列表 数组
元组 没有
集合 没有
使用jsom格式时要注意,最外层只能是一个数据 类型不限
如果你要一次性存储多个数据,需要使用容器 字典或数组
序列化
服务器端 需要根据前段的请求 从数据库获取数据 组织成前台可以识别的格式发给前台
反序列化
客户端 接受服务器返回的数据 并显示在屏幕上
主要函数:
序列化
dump
dumps
反序列化
load
loads
json数据本质就是字符串
json 最大的优势在于 其实跨平台的数据交换格式,并且非常的轻量级
并且对比xml 非常轻量级
# import json
# li=['a','b','c']
# with open('DB.json','wt',encoding='utf-8')as f:
# json.dump(li,f)
# li=[{'name':'wdj','sex':'male'},{'name':'lx','sex':'male'}]
# with open('DB.json', 'wt', encoding='utf-8')as f:
# json.dump(li, f)
# with open('DB.json', 'rt', encoding='utf-8')as f:
# res=json.load(f)
# print(res)
shelve模块
也是一个序列化模块
可以把它看做是一个自带序列化的字典
# import shelve
# s= shelve.open('new.sve')
# print(s)
# # 存入数据
# s["name"] = "常委"
# s["age"] = 20
#
# print(s)
# 取出数据
# s = shelve.open("new.sve")
# print(s["name"],s["age"],s["sex"])
xml模块
是什么?
可扩展标记语言
xml也是一种文档结构 也是一种序列化方式
与json不同的地方在于 xml可以定义文档的结构 例如在页面中 有页头页尾等..
语法格式:
使用标签来描述数据
<tag></tag>
通常由一堆标签组成 开始标签和结束标签
<tag/> 单标签 直接再名字后面加上斜杠结束
一个标签由三个部分组成
1.标签名
2.属性
<tag name='刘xx' age='20'></tag>
属性名称为name 值为刘xx 注意值必须放在双引号中
3.文本内容
<tag>这是文本内容</tag>
标签可以嵌套
<persons>
<p name='a'></p>
<p name='a'></p>
</persons>
标签嵌套时 关闭的顺序与打开的顺序 相反
注意:最外层必须只有一个跟标签
<info name="self" age="18" sex="woman"/>
xml模块的使用
xml模块的主要功能是 解析xml 即序列化和反序列化
对于xml格式的数据 一般不会使用代码来生成 更多的是读取xml的文件内容
主要函数:
iter
find
findall
import xml.etree.ElementTree as ET
# ElementTree 文档树 用于读写文件
# Element 一个标签
# 解析某个文件
# tree = ET.parse("test.xml")
# 获取根标签
# root = tree.getroot()
# name为新加坡的country改成shanghai
# res = root.iter("country")
# for i in res:
# if i.attrib.get("name") == "Singapore":
# i.set("name","shanghai")
# 创建一个新标签
# new_tag = ET.Element("我是新标签",attrib={"name":"abc"})
# new_tag.text = "这是文本内容"
# 将新标签添加到根标签中
# root.append(new_tag)
# 写入文件
# tree.write("test2.xml",encoding="utf-8")
# print(root)
# # tag 获取标签名字
# print(root.tag)
# 获取文本
# print(root.text)
# 获取属性 返回一个字典
# print(root.attrib)
# 获取子标签(元素,节点)
# iter 在全文范围查找所有名字匹配的
# res = root.iter("country")
#
# print(list(res))
# res = root.iter("year")
# for i in res:
# print(i.text)
# find 当前标签的子标签 并且只返回第一个
# res = root.find("country")
# print(res)
#
# # 可以一级一级往里找
# res = root.find("country").find("year")
# print(res)
# # print(res.attrib["name"])
# findall 当前标签的子标签 并且只返回所有匹配的
# res = root.findall("country")
# print(res[1].tag)
<?xml version="1.0"?>
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year>2008</year>
<gdppc>141100</gdppc>
<neighbor name="Austria" direction="E"/>
<neighbor name="Switzerland" direction="W"/>
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year>2011</year>
<gdppc>59900</gdppc>
</country>
</data>
test.xml