• 四、XML语言学习(3)


    XML编程(CURD)

    1、XML解析技术概述
    XML解析方式分为两种:DOM方式和SAX方式
    DOM:Document Object Model,文档对象模型。这种方式是W3C推荐的处理XML的一种方式。
    SAX:Simple API for XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。

    XML解析开发包
    JAXP:是SUN公司推出的解析标准实现。
    Dom4J:是开源组织推出的解析开发包。(牛,大家都在用,包括SUN公司的一些技术的实现都在用)
    JDom:是开源组织推出的解析开发包。

    2、JAXP
    JAXP:(Java API for XML Processing)开发包是JavaSE的一部分,它由以下几个包及其子包组成:
    org.w3c.dom:提供DOM方式解析XML的标准接口
    org.xml.sax:提供SAX方式解析XML的标准接口
    javax.xml:提供了解析XML文档的类

    javax.xml.parsers包中,定义了几个工厂类。我们可以通过调用这些工厂类,得到对XML文档进行解析的DOM和SAX解析器对象。
    DocumentBuilderFactory
    SAXParserFactory

    3、使用JAXP进行DOM解析
    avax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 , DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

    4获得JAXP中的DOM解析器
    调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。

    调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。

    调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。

    5、DOM编程
    DOM解析器在解析XML文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)

    6、Node对象
    Node对象提供了一系列常量来代表结点的类型,当开发人员获得某个Node类型后,就可以把Node节点转换成相应的节点对象(Node的子类对象),以便于调用其特有的方法。(查看API文档)
    Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加、修改、删除XML文档的内容了。

    7、DOM方式解析XML文件
    DOM解析编程
    遍历所有节点
    查找某一个节点
    删除结点
    更新结点
    添加节点

    8、更新XML文档
    javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把Document对象又重新写入到一个XML文件中。
    Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:
    javax.xml.transform.dom.DOMSource类来关联要转换的document对象,
    用javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。
    Transformer对象通过TransformerFactory获得。

    9、SAX解析
    在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。

    SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。

    AX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:
    解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
    解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。
    事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。

    SAX解析原理:
    SAX 是事件驱动的 XML 处理方法
    它是基于事件驱动的
    startElement() 回调在每次 SAX 解析器遇到元素的起始标记时被调用
    characters() 回调为字符数据所调用
    endElement() 为元素的结束标记所调用
    DefaultHandler类(在 org.xml.sax.helpers 软件包中)来实现所有这些回调,并提供所有回调方法默认的空实现

    10、使用SAX方式解析XML
    使用SAXParserFactory创建SAX解析工厂
    SAXParserFactory spf = SAXParserFactory.newInstance();

    通过SAX解析工厂得到解析器对象
    SAXParser sp = spf.newSAXParser();

    通过解析器对象解析xml文件
    xmlReader.parse("book.xml“,new XMLContentHandler());

    这里的XMLContentHandler 继承 DefaultHandler

    public class XMLContentHandler extends DefaultHandler{
    //当前元素中的数据
    private String currentData;
    //取得元素数据
    public void characters(char[] ch, int start, int length)
    throws SAXException {
    currentData=new String(ch,start,length);
    }
    //在解析整个文档结束时调用
    public void endDocument() throws SAXException {
    System.out.println("结束文档");
    }

    11、DOM4J解析XML文档
    Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的

    Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j

    用Dom4j开发,需下载dom4j相应的jar文件

    12、Document对象
    获得Document对象的方式有三种:

    1.读取XML文件,获得document对象            
    SAXReader reader = new SAXReader();              Document   document = reader.read(new File("input.xml"));

    2.解析XML形式的文本,得到document对象.
                 String text = "<members></members>";              Document document = DocumentHelper.parseText(text);

    3.主动创建document对象.
                 Document document = DocumentHelper.createDocument();             //创建根节点
    Element root = document.addElement("members");

    13、获取节点
    1.获取文档的根节点.
    Element root =document.getRootElement();
    2.取得某个节点的子节点.
    List list = root.elements("a");
    Element book2 = (Element)list.get(1);

    Element element=node.element(“书名");
    3.取得节点的文字
    String text=node.getText();

    14、添加节点
    在age节点下添加age节点
    Element age = a2.addElement("age");
    设置文本内容
    age.setText("400");
    将文档写入XML文件
    XMLWriter writer = new XMLWriter(new FileOutputStream("src/4.xml")
    writer.write(document);
    writer.close();

    15在特定位置添加节点
    使用DocumentHelper
    //获取a下面节点
    List<Element> list = book.elements();
    //创建文本和cc标签
    Element cc = DocumentHelper.createElement("cc");
    cc.setText("测试");
    //在特定位置添加:第一个参数表示元素位置,第二个参数表示添加的元素在第一个参数表示元素之前
    list.add(1, cc);

    修改,删除节点
    //获取a节点
    Element a2 = (Element)root.elements("a").get(1);
    //获取第二个a下的name
    Element name2 = a2.element("name");
    //修改name值
    name2.setText("东方不败");
    删除节点
    age2.getParent().remove(age2);

    获取属性值  Element a1 = (Element)root.elements("a").get(0);
    String aa = a1.attributeValue("aa");

    4.设置某节点的属性和文字. newMemberElm.addAttribute("name", "sitinspring");

    5.设置属性的文字 Attribute attribute=root.attribute("name");   attribute.setText("sitinspring");

    16、将文档写入XML文件
    1.文档中全为英文,不设置编码,直接写入的形式.
    XMLWriter xmlWriter = new XMLWriter(newFileOutputStream("src/persons.xml"));
    writer.write(document);
    writer.close();

    2.文档中含有中文,设置编码格式写入的形式;设置回写xml格式化方式
    //设置格式化方式
    OutputFormat format = OutputFormat.createPrettyPrint(); // 指定XML编码                  
    format.setEncoding(“utf-8");        XMLWriter writer = new XMLWriter(newFileWriter("output.xml"),format); writer.write(document); writer.close();

    17、XML约束之Schema
    XML Schema 也是一种用于定义和描述 XML 文档结构与内容的模式语言,其出现是为了克服 DTD 的局限性
    XML Schema VS DTD:
    XML Schema符合XML语法结构。
    DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
    XML Schema对名称空间支持得非常好。
    XML Schema比XML DTD支持更多的数据类型,并支持用户自定义新的数据类型。
    XML Schema定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制。
    XML Schema不能像DTD一样定义实体,比DTD更复杂,但Xml Schema现在已是w3c组织的标准,它正逐步取代DTD。

    XML Schema规定XML文档实例的结构和每个元素/属性的数据类
    Schema文档本身也是XML文档,而不是像DTD一样使用自成一体的语法

    XML Schema 文件自身就是一个XML文件,但它的扩展名通常为.xsd
    和XML文件一样,一个XML Schema文档也必须有一个根结点,但这个根结点的名称为Schema
    应用schema约束 开发xml 过程

    开发xml过程:W3C预先定义元素和属性->Schema文档->XML文档

    编写了一个XML Schema约束文档后,通常需要把这个文件中声明的元素绑定到一个URI地址上,这个URI地址叫namespace名称空间,以后XML文件就可以通过这个URI(即名称空间)引用绑定指定名称空间的元素

    18、XMLSchema文档基本结构
    在W3C XML schema规范中规定:所有的Schema文档都使用<schema>作为其根元素
    <?xml version="1.0"?>
    <schema> ... ...
    </schema>
    <schema xmlns="http://www.w3.org/2001/XMLSchema"
    targetNamespace="http://www.itcast.cn/20140213"
    elementFormDefault="qualified">

    简易元素:指那些仅包含文本的元素。它不会包含任何其他的元素或属性。
    <element name="xxx" type=“string"/>
    复杂元素:复杂类型元素是包含子元素或者属性的元素
    使用<complexType>:表示复杂类型
    <sequence>:表示有顺序
    <complexType>
    <sequence>
    <element name="to" type="string" />
    <element name="from" type="string" />
    </sequence>
    </complexType>

    19、对XML Schema的引用
    Schema和被约束的xml都是xml文档,如何区分哪个是被约束的文档?
    使用名称空间区分被约束文档(使用w3c名称空间)
    xmlns="http://www.w3.org/2001/XMLSchema-instance" 代表当前的文档是一个实例文档(被约束的文档)

    引用自定义的schema,使用自定义的名称空间
    一个标签上不能出现两个同名的属性。给名称空间起一个别名。xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    引用本地xsd文件存放位置,使用schemaLocation:代表的是Schema文档存放的路径.

    20、名称空间
    在XML Schema中,每个约束模式文档都可以被赋以一个唯一的名称空间,名称空间用一个唯一的URI(Uniform Resource Identifier,统一资源标识符)表示。 在Xml文件中书写标签时,可以通过名称空间声明(xmlns),来声明当前编写的标签来自哪个Schema约束文档。如:
    <itcast:书架 xmlns:itcast=“http://www.itcast.cn”>
    <itcast:书>……</itcast:书>
    </itcast:书架>
    此处使用itcast来指向声明的名称,以便于后面对名称空间的引用。
    注意:名称空间的名字语法容易让人混淆,尽管以 http:// 开始,那个 URL 并不指向一个包含模式定义的文件。事实上,这个 URL:http://www.itcast.cn根本没有指向任何文件,只是一个分配的名字。

    21、在名称空间引入Schema
    为了在一个XML文档中声明它所遵循的Schema文件的具体位置,通常需要在Xml文档中的根结点中使用schemaLocation属性来指定,例如:
    <itcast:书架 xmlns:itcast="http://www.itcast.cn"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation=“http://www.itcast.cn book.xsd">
    schemaLocation此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置,两者之间用空格分隔。
    注意,在使用schemaLocation属性时,也需要指定该属性来自哪里。

    基本格式:
    xmlns="URI" 
    举例:
    <书架 xmlns=" http://www.itcast.cn"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation=“http://www.itcast.cn book.xsd">
    <书>
    <书名>JavaScript网页开发</书名>
    <作者>张孝祥</作者>
    <售价>28.00元</售价>
    </书>
    <书架>

    文件清单:xmlbook.xml
    <?xml version="1.0" encoding="UTF-8"?>

    <书架 xmlns="http://www.it315.org/xmlbook/schema"
    xmlns:demo="http://www.it315.org/demo/schema"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://www.it315.org/xmlbook/schema http://www.it315.org/xml/book.xsd
    http://www.it315.org/demo/schema http://www.it315.org/demo.xsd">
    <书>
    <书名>JavaScript网页开发</书名>
    <作者>张孝祥</作者>
    <售价 demo:币种=”人民币”>28.00元</售价>
    </书>
    </书架>

  • 相关阅读:
    winRT Com组件开发流程总结
    win32 COM组件编写
    windows8 APP开发的远程调试
    VS2012中,C# 配置文件读取 + C#多个工程共享共有变量 + 整理using语句
    STL源码--序列式容器
    代码规范
    Visual Studio Code 断点调试配置方法(请按我的步骤 一定可以做到)
    CSS层级关系 学习笔记
    VUE 学习笔记
    CSS 学习笔记
  • 原文地址:https://www.cnblogs.com/highpointengineer/p/10564243.html
Copyright © 2020-2023  润新知