一、概述
XML Schema用于描述XML文档结构的文件。另一种用于该用途的文件(技术)是DTD。XML Schema有时又称为XML Schema Definition,所以也会称为XSD。因此Schema文件是以xsd为后缀的。
下面详细的说明一下所谓的“定义XML文档结构结构”的意义。- 定义可以出现在文档中的Element。
- 定义可以出现在文档中的Attribute。
- 定义哪些Element是子元素。
- 定义Element的顺序。
- 定义子元素的数目。
- 定义一个元素是否能为空,是否能包含文本。
- 为每个Element和Attribute定义数据类型。
- 为Element和Attribute定义默认值和固定值。
Schema和DTD的比较:
可以说Schema是DTD的替代品,虽然作用一样,但Schema是比DTD更新,更好的一种技术,因为:
- Schema是可扩展的,可以随着将来的需要进行扩展。 (可以在其他的Schema中重用现有的Schema;从标准类型中派生创建你自己的数据类型;在同一文档中引用多个Schema。)
- Schema是用XML编写的。 (因此你无需重新学习一种语言;你可以使用XML的编辑器对Schema进行编辑;可以使用XML Parser去分析Schema;可以使用XML DOM去操作Schema;可以使用XSLT对Schema进行转换。)
- Schema支持数据类型。 (从而能更好的描述文档支持的内容;更好的验证文档的有效性;更好的与数据库进行数据交互;更好的定义数据约束;更好的定义数据格式;更好的支持各类型数据间的转换。)
- Schema支持命名空间。
二、在XML文档中引用Schema
<?xml version="1.0"?>
<note
xmlns="http://www.w3schools.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3schools.com note.xsd">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
<note
xmlns="http://www.w3schools.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.w3schools.com note.xsd">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
以上的XML文件引用了note.xsd的Schema文件进行结构定义,这样Parser会根据该Schema文件对XML进行有效性检验。显然关键的地方是文档根元素“note”中属性的定义。下面解析相关属性的意义。
xmlns="http://www.w3schools.com"
说明文档的默认命名空间是“http://www.w3schools.com”。关于命名空间的作用,在XML学习笔记(三)中有介绍。xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
这里定义一个Schema的实例命名空间。只有作了这个定义才能使用schemaLocation属性。xsi是XML Schema Instance的意思。xsi:schemaLocation="http://www.w3schools.com note.xsd"
如上所述,因为我们已经定义了xsi命名空间所以可以使用schemaLocation属性了。schemaLocation属性由成对的值组成可以有多对。(因为一个XML文档可以有多个命名空间,所以schemaLocation值可以有多对)第一个值“http://www.w3schools.com”是要使用schema进行有效验证的命名空间的元素。第二个值“note.xsd”是要使用的schema文档的路径。以下是中国XML论坛的两篇贴子可以作为参考和补充:
http://bbs.xml.org.cn/dispbbs.asp?boardID=23&ID=37706
http://bbs.xml.org.cn/dispbbs.asp?boardid=1&rootid=&id=9270
三、Schema文档的基本结构
首先给出一个完整的Schema文档<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w3schools.com"
xmlns="http://www.w3schools.com"
elementFormDefault="qualified">
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string"/>
<xs:element name="from" type="xs:string"/>
<xs:element name="heading" type="xs:string"/>
<xs:element name="body" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.w3schools.com"
xmlns="http://www.w3schools.com"
elementFormDefault="qualified">
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string"/>
<xs:element name="from" type="xs:string"/>
<xs:element name="heading" type="xs:string"/>
<xs:element name="body" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
首先必须强调的是<schema>元素是Schema文档的根元素。注意大小写,Schema也是XML,XML是大小写敏感的。<schema>Element的所有子元素都是用于定义XML文档结构的。具体的语法在下篇介绍。在这里我们集中关注<schema>的属性。
xmlns:xs="http://www.w3.org/2001/XMLSchema"
这里指明了一个命名空间“http://www.w3.org/2001/XMLSchema”。同时定义了一个前缀“xs”。<schema>自己和所有子元素都使用“xs”前缀,说明属于该命名空间。targetNamespace="http://www.w3schools.com"
targetNamespace是目标命名空间。这语句说明,这个Schema定义的元素(note, to, from, heading, body)是来自“http://www.w3schools.com”这个命名空间的。从另一个角度可以理解为,引用这个Schema进行有效性验证的XML的元素应该是使用该命名空间的。xmlns="http://www.w3schools.com"
因为Schema也是XML。这语句说明这个XML的默认命名空间是“http://www.w3schools.com”。elementFormDefault="qualified"
这句表示在本Schema中定义的Element,如果在XML实例文档出现的话,都要进行命名空间匹配。同样给出一篇中国XML论坛的帖子作为参考和补充:
http://bbs.xml.org.cn/dispbbs.asp?boardID=23&ID=35354
本文为个人原创,转载请注明出自:http://jackma.cnblogs.com/
Author:JackMa