• XML学习笔记(四)Schema介绍篇


    Preface:本文是W3Schools上《Schema指南》的学习笔记。其中大部分内容是对指南的翻译总结。由于原文的例子更详尽生动,如果各位想阅读原文可以到这个网址http://www.w3schools.com/schema/default.asp。同时,W3Schools提供了测试,大家可以测试一下自己的理解程度。

    一、概述

            XML Schema用于描述XML文档结构的文件。另一种用于该用途的文件(技术)是DTD。XML Schema有时又称为XML Schema Definition,所以也会称为XSD。因此Schema文件是以xsd为后缀的。

    下面详细的说明一下所谓的“定义XML文档结构结构”的意义。
    • 定义可以出现在文档中的Element。
    • 定义可以出现在文档中的Attribute。
    • 定义哪些Element是子元素。
    • 定义Element的顺序。
    • 定义子元素的数目。
    • 定义一个元素是否能为空,是否能包含文本。
    • 为每个Element和Attribute定义数据类型。
    • 为Element和Attribute定义默认值和固定值。
    因为有了以上的定义,我们才能更清晰的使用XML描述我们要表达的内容。使XML的接受方能更容易明白内容的含义。

    Schema和DTD的比较
            可以说Schema是DTD的替代品,虽然作用一样,但Schema是比DTD更新,更好的一种技术,因为:

    • Schema是可扩展的,可以随着将来的需要进行扩展。 (可以在其他的Schema中重用现有的Schema;从标准类型中派生创建你自己的数据类型;在同一文档中引用多个Schema。)
    • Schema是用XML编写的。 (因此你无需重新学习一种语言;你可以使用XML的编辑器对Schema进行编辑;可以使用XML Parser去分析Schema;可以使用XML DOM去操作Schema;可以使用XSLT对Schema进行转换。)
    • Schema支持数据类型。 (从而能更好的描述文档支持的内容;更好的验证文档的有效性;更好的与数据库进行数据交互;更好的定义数据约束;更好的定义数据格式;更好的支持各类型数据间的转换。)
    • Schema支持命名空间。
    更重要的是Schema是W3C推荐的标准。

    二、在XML文档中引用Schema

    <?xml version="1.0"?>
    <note
    xmlns="http://www.w3schools.com"
    xmlns:xsi
    ="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation
    ="http://www.w3schools.com note.xsd">
    <to>Tove</to>
    <from>Jani</from>
    <heading>Reminder</heading>
    <body>Don't forget me this weekend!</body>
    </note>

            以上的XML文件引用了note.xsd的Schema文件进行结构定义,这样Parser会根据该Schema文件对XML进行有效性检验。显然关键的地方是文档根元素“note”中属性的定义。下面解析相关属性的意义。

    xmlns="http://www.w3schools.com"
    说明文档的默认命名空间是“http://www.w3schools.com”。关于命名空间的作用,在XML学习笔记(三)中有介绍。

    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    这里定义一个Schema的实例命名空间。只有作了这个定义才能使用schemaLocation属性。xsi是XML Schema Instance的意思。

    xsi:schemaLocation="http://www.w3schools.com note.xsd"
    如上所述,因为我们已经定义了xsi命名空间所以可以使用schemaLocation属性了。schemaLocation属性由成对的值组成可以有多对。(因为一个XML文档可以有多个命名空间,所以schemaLocation值可以有多对)第一个值“http://www.w3schools.com”是要使用schema进行有效验证的命名空间的元素。第二个值“note.xsd”是要使用的schema文档的路径。

    以下是中国XML论坛的两篇贴子可以作为参考和补充:
    http://bbs.xml.org.cn/dispbbs.asp?boardID=23&ID=37706
    http://bbs.xml.org.cn/dispbbs.asp?boardid=1&rootid=&id=9270

    三、Schema文档的基本结构

    首先给出一个完整的Schema文档
    <?xml version="1.0"?>
    <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
    targetNamespace
    ="http://www.w3schools.com"
    xmlns
    ="http://www.w3schools.com"
    elementFormDefault
    ="qualified">
    <xs:element name="note">
    <xs:complexType>
    <xs:sequence>
    <xs:element name="to" type="xs:string"/>
    <xs:element name="from" type="xs:string"/>
    <xs:element name="heading" type="xs:string"/>
    <xs:element name="body" type="xs:string"/>
    </xs:sequence>
    </xs:complexType>
    </xs:element>
    </xs:schema>

    首先必须强调的是<schema>元素是Schema文档的根元素。注意大小写,Schema也是XML,XML是大小写敏感的。<schema>Element的所有子元素都是用于定义XML文档结构的。具体的语法在下篇介绍。在这里我们集中关注<schema>的属性。

    xmlns:xs="http://www.w3.org/2001/XMLSchema"
    这里指明了一个命名空间“http://www.w3.org/2001/XMLSchema”。同时定义了一个前缀“xs”。<schema>自己和所有子元素都使用“xs”前缀,说明属于该命名空间。

    targetNamespace="http://www.w3schools.com"
    targetNamespace是目标命名空间。这语句说明,这个Schema定义的元素(note, to, from, heading, body)是来自“http://www.w3schools.com”这个命名空间的。从另一个角度可以理解为,引用这个Schema进行有效性验证的XML的元素应该是使用该命名空间的。

    xmlns="http://www.w3schools.com"
    因为Schema也是XML。这语句说明这个XML的默认命名空间是“http://www.w3schools.com”。

    elementFormDefault="qualified"
    这句表示在本Schema中定义的Element,如果在XML实例文档出现的话,都要进行命名空间匹配。

    同样给出一篇中国XML论坛的帖子作为参考和补充:
    http://bbs.xml.org.cn/dispbbs.asp?boardID=23&ID=35354


    本文为个人原创,转载请注明出自:http://jackma.cnblogs.com/ 
    Author:JackMa
  • 相关阅读:
    信息检索笔记
    北大课程(变态心理学)
    My life
    Excel小技巧(随机点名)
    Flask基础
    CTF
    GDB
    LD_PRELOAD
    AFL-数据变异
    AFL入门
  • 原文地址:https://www.cnblogs.com/JackMa/p/1073283.html
Copyright © 2020-2023  润新知