xml文件中特殊字符的处理
在XML中,起始和结束标记之间出现的所有合法字符都被忠实地传给XML处理程序。为了避免把字符数据和标记中需要用到的一些特殊符号相混淆,XML还提供了一些有用的实体引用。实体引用的作用是,当在字符数据中需要使用这些特殊符号时,我们采用它的实体引用来代替。这些特殊的XML实体引用包括:
> >
< <
& &
" "
’'
这样,如果我们需要在"示例"这个标记中出现文本
"<姓名>张三</姓名>"
正确的写法应该是:
示例〉<姓名>张三</姓名>〈/示例〉
容易理解,字符"〈"的实体引用是必不可少的,为"〉"设立实体引用同样是为了避免与标记混淆,而字符"&"的实体引用则防止它与实体引用中开头所用的"&"相混淆。那么,我们什么时候需要用到剩下两个字符的实体引用呢?在标记中可以为标记设立属性,而XML规定属性值必须用"""括起来。因此,当属性值中出现字符"""时,需要将它用实体引用代替。请看下面的例子:
<STATEMENT VALUE = "She said, "Don t go there!"">
正确的写法应该是:
<STATEMENT VALUE = "She said, "Don't go there!"">