一个xml文档只能有一个根元素
XML文档声明:
<?xml version="1.0" encode="utf-8" standalone="no"?>
- version代表xml版本,是必须声明的属性
- encode声明当前文档的字符编码集,xml解析器会使用这个编码来解析xml文档,默认为utf-8
- standalone代表文件是否独立(有没有约束),no代表依赖外部的约束文件,默认值是yes
最简单的xml文档声明:<?xml version="1.0"?>
元素标签命名规范:
xml元素可以包含字母、数字和可见字符,但要遵循以下规范:
- 区分大小写
- 不能以数字开头
- 最好不要以xml开头
- 不能包含空格
元素属性:
- 属性由属性名和属性值构成,中间用等号连接
- 属性值必须用单或双引号括起来
- 属性与元素标签的命名规范相同
- 属性必须定义在元素的开始标签中
- 不能包含相同的属性名
xml注释格式:<!-- -->
转义字符
转义字符以&开头 ;结尾,这个特点与实体相同
& &
< <
> >
" "
' ' [/size]
PCDATA
PCDATA 指的是被解析的字符数据(Parsed Character Data)。
XML 解析器通常会解析 XML 文档中所有的文本。
当某个 XML 元素被解析时,其标签之间的文本也会被解析:
<message>此文本也会被解析</message>
解析器之所以这么做是因为 XML 元素可包含其他元素
CDATA
所有 XML 文档中的文本均会被解析器解析。
只有 CDATA 区段(CDATA section)中的文本会被解析器忽略。
CDATA 格式: <![CDATA[ 内容部分 "]]>"