xml 可扩展的标记语言
<> </>
也是一种通用的数据格式
之所以用它也是因为跨平台 (但是在json出现之前就已经存在,所以海有一些公司还在用)
学习的重点还是语法格式
1.任何的起始标签都必须有一个结束标签。 <> </>
2.可以采用另一种简化语法,可以在一个标签中同时表示起始和结束标签。这种语法是在大于符号之前紧跟一个斜线(/),解释器会将其翻译成<百度百科词条></百度百科词条>。
<百度百科词条/>
3.标签必须按合适的顺序进行行行嵌套,所以结束标签必须按镜像顺序匹配起始标签。 这好比是将起始和结束标签看作是数学中的左右括号: 在没有关闭所有的内部括号之前,是不能关闭外面的括号的
4.所有的特性都必须有值
5.所有的特性都必须在值的周围加上双引号。
一个标签的组成部分
<tagename 属性名称=“属性值”>文本内容</tagename>
当标签的写法
<tagename 属性名称 = “属性值”>
镜像关闭顺序实例
<a>
<b>
<c>
</c>
</b>
</a>
把您的左右同学信息写成xml
<studentinfo>
<张三>
<age>20</age>
<gender>man</gender>
</张三>
<李四>
<age>20</age>
<gender>man</gender>
</李四>
</studentinfo>
总结 xml 也是一种中间格式也属于序列化方式之一
与json相比较
同样的数据 json会比xml更小 效率更高
xml需要根据文档结构手动解析 而 json 直接转对象
import xml.etree.ElementTree as ElementTree
# 解析d.xml
tree = ElementTree.parse("d.xml")
print(tree)
# 获取根标签
rootTree = tree.getroot()
# 三种获取标签的方式
# 获取所有人的年龄 iter是用于在全文范围获取标签
# for item in rootTree.iter("age"):
# # 一个标签三个组成部分
# print(item.tag) # 标签名称
# print(item.attrib) # 标签的属性
# print(item.text) # 文本内容
# 第二种 从当前标签的子标签中找到一个名称为age的标签 如果有多个 找到的是第一个
# print(rootTree.find("age").attrib)
# 第三种 从当前标签的子标签中找到所有名称为age的标签
# print(rootTree.findall("age"))
# 获取单个属性
stu = rootTree.find("stu")
print(stu.get("age"))
print(stu.get("name"))
# 删除子标签
rootTree.remove(stu)
# 添加子标签
# 要先创建一个子标签
newTag = ElementTree.Element("这是新标签",{"一个属性":"值"})
rootTree.append(newTag)
# 写入文件
tree.write("f.xml",encoding="utf-8")