• 区分XML中CDATA和#PCDATA


    在XML文档中, 能看到“CDATA"的地方有三处: 

    1)在DTD中,指定标签中某个属性的类型为字符型时,使用CDATA。因为XML解析器回去分析这段字符内容,因而里面如果需要使用>, <, &, ', "这5个特殊字符,应当用对应的替代替代字符来表示(必须以&开始,以;结束)。具体如下: 
    < - &lt;  (less than) 
    > - &gt;  (greater than) 
    & - &amp;  (ampersand) 
    ' - &apos;  (apostrophe) 
    " - &quot;  (straight double quotation mark) 

    例如在DTD中声明: 
        <!ATTLIST author period CDATA> 它表示在author这个标签中,period属性应该是字符类型。 


    2) 在XML中,指定某段内容不必被XML解析器解析时,使用<![CDATA[...]]>。也就是说中括号中的内容解析器不会去分析。所以其中可以包含>, <, &, ', "这5个特殊字符。经常把一段程序代码嵌入到<![DATA[...]]>中。 因为代码中可能包含大量的 >, <, &, "这样的特殊字符。 

    例如在XML中声明: 
        <![CDATA[ 
            if(i<10){ 
              System.out.println("i<10"); 
            } 
        ]]> 

    3) 在DTD中,指定某个标签中的内容是字符数据时,使用(#PCDATA)。由于它的内容也是需要解析器来解析的,所有仍然需要转换>, <, &, ', "这5个特殊字符。 

    例如在DTD中声明: 
        <!ELEMENT name (#PCDATA)> 它表示在<name>和</name>标签之间可以插入字符或者子标签。
     
    #PCDATA是要给XML解析的数据,如 > 要写成 &gt;才不会出错。 
    CDATA区域表示里面是什么数据XML不会解析。
     
    【XML中CDATA与#PCDATA与PACATA的区别】
     

    1. CDATA: Character Data, PCDATA: Parsable

    CDATA,是可以分析的字符序列,CDATA就是指字符串,而PCDATA可以是字符串、子元素、字符串和子元素。  

    2. CDATA是属性声明中的类型,就是字符串,&、<、“”和‘’ 等都具有特殊含义被解析,例如:"解析为双引号;#PCDATA是元素声明中的类型,指的是混合类型,即可以包子元素也可包含字符串, &和<也是具有特殊含义被解析。 

    ANY 并不局限于“#PCDATA”,只是说明该元素可以包含任何内容,一般来讲,解析器无法验证其有效性(一般也不会验证),#PCDATA源于“可解析的字符”,对于有特殊含于的< 会按照子元素开始进行解析。

    #PCDATA    该内容模型说明元素中可以同时出现文本和元素.
    ANY           ANY关键子表明DTD中声明的任何元素都可以使用作该元素的子元素
    CDATA       属性值是字符数据

    #PCDATA和ANY用于元素声明
    CDATA用于属性声明

  • 相关阅读:
    python之socket编程
    python之异常处理
    面向对象进阶
    openstack的网络配置
    VLAN,GRE,VXLAN
    三节点搭建openstack-Mitaka版本
    矩阵转换
    判断区域相交的方法
    Centos 6.5 Multipath 初始配置
    CentOS开机自动运行程序的脚本
  • 原文地址:https://www.cnblogs.com/efforts-will-be-lucky/p/7594341.html
Copyright © 2020-2023  润新知