• XML DTD验证


    一、什么是DTD  

      文档类型定义(DTD:Document Type Definition)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。
      DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。

      

    二、DTD的作用

      1、有了DTD,每个XML可以携带一个自身格式的描述。

      2、有了DTD,不同组织可以使用一个通用的DTD来交换数据。

      3、应用程序中使用DTD校检从外部接受的XML数据是否有效。

      

    三、DTD中包含的内容

      1、元素的定义规则:在DTD中需要验证XML中能包含哪些元素。

      2、元素之间的关系规则:指元素的父元素是谁,元素和元素之间到底是上下层关系还是平行关系。

      3、属性的定义:可以规定在XML中属性名是什么,属性值是什么类型。

    四、DTD的分类:

      1、内部DTD文档:DTD文档和XML文档在同一个文件中。

        <!DOCTYPE 根元素 [定义内容]>

      2、外部DTD文档:DTD文档和XML文档保存在不同文件中。

        <!DOCTYPE 根元素 SYSTEM "DTD文件路径">

      3、内外结合的DTD文档:两种相结合的写法。

        <!DOCTYPE 根元素 SYSTEM "DTD文件路径" [定义内容]>

    五、DTD元素定义

      语法:

      <!ELEMENT NAME CONTENT>

      ELEMENT:关键字,表示声明一个DTD文档。

      NAME:元素名称,XML中元素的名称。

      CONTENT:元素类型,

      元素类型包括:EMPTY、#PCDATA、纯元素类型、ANY。

      1、Empty:

      该元素不能包含子元素和文本,但可以有属性(空元素)。

      语法: 

      <!ELEMENT 元素名称 EMPTY>

      例:声明一个空的student元素

      <!ELEMENT student empty>

      XML示例:

      <student />

      

      2、#PCDATA:

      可以包含任何字符数据,但不能包含其他子元素。只有 PCDATA 的元素通过圆括号中的 #PCDATA 进行声明:

      语法:

      <!ELEMENT 元素名称 (#PCDATA)>

      例:声明一个name的元素

      <!ELEMENT name (#PCDATA)>

      XML示例:

      <name>张三</name>  

      3、纯元素类型:

      只能包含子元素,不能包含文本。元素出现的顺序必须和定义一致。

      语法:

      <!ELEMENT 元素名称 (子元素名称 1,子元素名称 2,.....)>

      例:声明学生标记

      <!ELEMENT student(name,age)>

      XML示例:

      <student>

        <name>张三</name>

        <age>18</age>

      </student>


     符号的用途:
    符号 用途 示例 说明
    () 用来给元素分组 (古龙|金庸|梁羽生),(王朔|余杰),毛毛 分为三组
    | 在列出的对象中必须选择一个 (男人|女人) 表示男人或者女人必须出现,两者至少出现其一。
    , 对象必须按照指定的顺序出现 (西瓜,苹果,香蕉) 表示西瓜、苹果、香蕉必须出现,并且是按照指定顺序出现。
    * 该对象可以出现0次或者多次 (爱好*) 爱好可以出现0次到多次
    ? 该对象只能出现0到1次 (菜鸟?) 表示菜鸟可以出现0次到1次
    + 改对象可以出现1到多次。 (成员+) 表示成员必须出现1次到多次。


      4、ANY:

      可以包含任何元素类型。

      语法:  

      <!ELEMENT 元素名称 ANY>
      例子:
      <!ELEMENT student ANY>

      例:

    复制代码
    <?xml version="1.0" encoding="UTF-8"?>
    <!DOCTYPE studentlist [
        <!--声明根元素下可以包含多个student元素-->
        <!ELEMENT studentlist (student*)>
        <!--声明student下可以包含name,age,sex元素,name必须出现0-1次, age出现0-多次,sex必须出现1次 -->
        <!ELEMENT student (name?, age*, sex)>
        <!--声明name中只能包含文本,不能包含其他标记-->
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!--声明sex为空元素-->
        <!ELEMENT sex EMPTY>
    ]>
    <studentlist>
        <student>
            <name>张三</name>
            <age>20</age>
            <sex/>
        </student>
        <student>
            <name>李四</name>
            <sex/>
        </student>
    </studentlist>
    复制代码

    六、DTD中属性的定义

      语法:

      <!ATTLIST 元素名称 属性名称 属性类型 默认值>

       说明:

      ATTLIST:属性列表关键字。

      元素名称:要修饰的元素名称。

      属性名称:元素谁能够的名称。

      属性类型:CDATA、ID、IDREF/IDREFS、Enumerated。

      属性特点:#REQUIRED、#IMPLIED、#FIXED value、Default value。

      1)#REQUIRED:表示元素属性都必须有该属性的值,不能为空。

      2)#IMPLIED:表示元素属性可以忽略的值,可以为空。

      3)#FIXED value:表示元素属性必须为指定的固定值,固定值在value中指定。

      4)Default value:表示给指定元素默认值,不需要使用Default,直接指定默认值即可。

      属性类型:

      1、CDATA属性

      表示属性值可以是任何字符,包括数字和中文。

      示例:声明student属性name值为任何文本,必须有值

      DTD示例:

      <!ATTLIST student name CDATA #REQUIRED> 

      XML示例:

      <student name="zhangsan" />

      2、ID属性

      表示属性取值必须是唯一的

      示例1:对studentid属性设置为唯一值。并且必须有值。

      DTD示例:

      <!ATTLIST student id ID #REQUIRED> 

      XML示例:

      <student id="10086" />

      示例2:同时对多个属性设置属性,对student的id

      DTD示例:

      <!ELEMENT student (id,name)>

      <!ATTLIST student

        id ID #REQUIRED

        name CDATA #REQUIRED>

      XML示例:

      <student id="10086" name="zhangsan"></student>

      3、IDREF/IDREFS

      IDREF:表示该属性的值指向其他地方声明的ID类型的值。

      IDREFS:同IDREF,但是可以由空格分开多个引用。

      示例:

    复制代码
    <?xml version="1.0" encoding="UTF-8"?>
    <!DOCTYPE categories [
        <!ELEMENT categories (category*)>
        <!ELEMENT category (category*)>
        <!ATTLIST category 
            id ID #REQUIRED 
            name CDATA #REQUIRED 
            parentid IDREF #IMPLIED>  <!--子类中的parentid引用外层的id-->
    ]>
    <categories>
        <category id="c_1" name="电器">
            <category id="c_10" parentid="c_1" name="电视"/>
            <category id="c_11" parentid="c_1" name="冰箱"/>
            <category id="c_12" parentid="c_1" name="冰箱"/>
        </category>
        <category id="c_2" name="手机">
            <category id="c_20" parentid="c_2" name="智能手机"/>
            <category id="c_21" parentid="c_2" name="非智能手机"/>
        </category>
    </categories>
    复制代码

      4、Enumerated

      枚举,预定义一些值,属性的值必须在所列出的值得范围类。

      DTD示例:学生性别只能是男或者女

      <!ATTLIST student sex (男|女) #REQUIRED>

      XML示例:

      <student sex="男">

    七、实体

      在DTD中定义的常量,在XML中使用。用于定义在XML中多次出现的值。

      实体可以分为内部实体和外部实体:

      1、内部实体

      语法:

      <!ENTITY 实体名 "实体值">

      示例:定义

      DTD示例:  

      <!ENTITY writer "Bill Gates">
      <!ENTITY copyright "Copyright W3School.com.cn">

      XML示例:

      <author>&writer;&copyright;</author>

      注意:一个实体由三部分构成: 一个和号 (&), 一个实体名称, 以及一个分号 (;)。

      2、外部实体

      语法:

      <!ENTITY 实体名称 SYSTEM "URI/URL">  

      DTD 例子:
      <!ENTITY writer SYSTEM "http://www.w3school.com.cn/dtd/entities.dtd">
      <!ENTITY copyright SYSTEM "http://www.w3school.com.cn/dtd/entities.dtd">
      XML 例子:
      <author>&writer;&copyright;</author>

  • 相关阅读:
    C# Asp.net 获取上上次请求的url
    Asp.net 中 Get和Post 的用法
    慎用JavaScript:void(0)
    JS验证RadioButton列表或CheckBox列表是否已填写
    .net 中viewstate的原理和使用
    Javascript与C#互相调用
    获取当前页面URL并UTF8编码之
    C#信息采集工具实现
    C#泛型编程
    C#正则表达式提取HTML中IMG标签的URL地址 .
  • 原文地址:https://www.cnblogs.com/futao123/p/5068621.html
Copyright © 2020-2023  润新知