XML 特殊字符处理和 CDATA

XML 特殊字符处理和 CDATA
在处理XML数据时，特殊字符要特殊处理，不能和节点字符混淆。

所有 XML 文档中的文本均会被解析器解析。

只有 CDATA 区段（CDATA section）中的文本会被解析器忽略。

PCDATA

PCDATA 指的是被解析的字符数据（Parsed Character Data）。

XML 解析器通常会解析 XML 文档中所有的文本。

当某个 XML 元素被解析时，其标签之间的文本也会被解析：

<message>此文本也会被解析</message>

解析器之所以这么做是因为 XML 元素可包含其他元素，就像这个例子中，其中的 <name> 元素包含着另外的两个元素(first 和 last)：

<name><first>Bill</first><last>Gates</last></name>

而解析器会把它分解为像这样的子元素：

<name>

<first>Bill</first>

<last>Gates</last>

</name>

转义字符

非法的 XML 字符必须被替换为实体引用（entity reference）。

假如您在 XML 文档中放置了一个类似 "<" 字符，那么这个文档会产生一个错误，这是因为解析器会把它解释为新元素的开始。因此你不能这样写：

<message>if salary < 1000 then</message>

为了避免此类错误，需要把字符 "<" 替换为实体引用，就像这样：

<message>if salary < 1000 then</message>

在 XML 中有 5 个预定义的实体引用：

< < 小于

> > 大于

& & 和号

' ' 单引号

" " 双引号

注释：严格地讲，在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的，但是把它们替换为实体引用是个好的习惯。

CDATA

术语 CDATA 指的是不应由 XML 解析器进行解析的文本数据（Unparsed Character Data）。

在 XML 元素中，"<" 和 "&" 是非法的。

"<" 会产生错误，因为解析器会把该字符解释为新元素的开始。

"&" 也会产生错误，因为解析器会把该字符解释为字符实体的开始。

某些文本，比如 JavaScript 代码，包含大量 "<" 或 "&" 字符。为了避免错误，可以将脚本代码定义为 CDATA。

CDATA 部分中的所有内容都会被解析器忽略。

CDATA 部分由 "<![CDATA[" 开始，由 "]]>" 结束：
```
<script>
<![CDATA[
    function matchwo(a,b){
        if (a < b && a < 0) then {
            return 1;
        }
        else
        {
            return 0;
        }
    }
]]>
</script>
```
在上面的例子中，解析器会忽略 CDATA 部分中的所有内容。

关于 CDATA 部分的注释：

CDATA 部分不能包含字符串 "]]>"。也不允许嵌套的 CDATA 部分。

标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。
相关阅读:
实验四代码评审
 UML 建模工具的安装与使用
 结对编程(阶段二)
结对编程第一阶段
 实验一 GIT 代码版本管理
 【Alpha冲刺阶段】Scrum Meeting Daily5
【Alpha冲刺阶段】Scrum Meeting Daily2
个人项目作业
 个人介绍+软工5问
 SpringMVC拦截html页面访问
原文地址：https://www.cnblogs.com/qingsong/p/5351258.html

<	<	小于
>	>	大于
&	&	和号
'	'	单引号
"	"	双引号