XML的基本用法

一、概述

　　XML全称为可扩展的标记语言。主要用于描述数据和用作配置文件。

　　XML文档在逻辑上主要由一下5个部分组成：

XML声明：指明所用XML的版本、文档的编码、文档的独立性信息
文档类型声明：指出XML文档所用的DTD
元素：由开始标签、元素内容和结束标签构成
注释：以结束，用于对文档中的内容起一个说明作用
处理指令：通过处理指令来通知其他应用程序来处理非XML格式的数据，格式为<?xml-stylesheet href="hello.css" type="text/css"?>

　　XML文档的根元素被称为文档元素，它和在其外部出现的处理指令、注释等作为文档实体的子节点，根元素本身和其内部的子元素也是一棵树。

二、XML文档解析

　　在解析XML文档时，通常是利用现有的XML解析器对XML文档进行分析，应用程序通过解析器提供的API接口得到XML数据。

　　XML解析方式分为两种：DOM和SAX：

　　DOM：用来解析相对较小的XML文件,容易增删改查。DOM的核心是节点，DOM在解析XML文档时，将组成文档的各个部分映射为一个对象，这个对象就叫做节点。使用DOM解析XML文档，需要将读入整个XML文档，然后在内存中创建DOM树，生成DOM树上的每个节点对象。

<?xml version="1.0" encoding="UTF-8"?>
<书架>
    <书>
        <作者>李阳</作者>
        <价格>39元</价格>
        <出版社>高等教育出版社</出版社>
    </书>
    <书>
        <作者>宋吉</作者>
        <价格>40元</价格>
        <出版社>人民出版社</出版社>
    </书>
</书架>

　　使用DOM解析上述XML文档，代码如下：

package com.test.xml;
import java.io.File;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class Demo
{
    public static void main(String args[])
    {
        //得到DOM解析器工厂类的实例
        DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
        try
        {
            //得到dom的解析器对象
            DocumentBuilder db=dbf.newDocumentBuilder();
            //解析XML文档，得到代表文档的document对象
            File file=new File("D:\Eclipse\workSpace\day_050401\src\book.xml");
            Document doc=db.parse(file);
            
            //以文档顺序返回标签名字为书的所有后代元素
            NodeList nl=doc.getElementsByTagName("书");
            
            for(int i=0;i<nl.getLength();i++)
            {
                Element elt=(Element) nl.item(i);
                Node eltAuthor=elt.getElementsByTagName("作者").item(0);
                Node eltPricer=elt.getElementsByTagName("价格").item(0);
                Node eltPublish=elt.getElementsByTagName("出版社").item(0);
                
                String Author=eltAuthor.getFirstChild().getNodeValue();
                String Pricer=eltPricer.getFirstChild().getNodeValue();
                String Publish=eltPublish.getFirstChild().getNodeValue();
                
                System.out.println("-------书籍信息"+(i+1)+"-------");
                System.out.println("作者:"+Author);
                System.out.println("价格:"+Pricer);
                System.out.println("出版社:"+Publish);
            }
            
        } 
        catch (ParserConfigurationException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        } 
        catch (SAXException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        } catch (IOException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
        
    }
}

　　执行结果如下：　

　　SAX：内存消耗较小，适合读取操作。SAX是一种基于事件驱动的API，利用SAX解析XML文档涉及解析器和事件处理器两个部分。解析器负责读取XML文档，并向事件处理器发送事件，事件处理器则负责对事件作出相应，对传递的XML数据进行处理。

　　使用SAX解析XML文档，代码如下：

import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
class Book
{
    private String name;
    private String author;
    private String price;
    public String getName()
    {
        return name;
    }
    public void setName(String name)
    {
        this.name = name;
    }
    public String getAuthor()
    {
        return author;
    }
    public void setAuthor(String author)
    {
        this.author = author;
    }
    public String getPrice()
    {
        return price;
    }
    
    public void setPrice(String price)
    {
        this.price = price;
        
    }
    
}
public class Demo extends DefaultHandler
{
    private List list=new ArrayList();
    private String currentTag;
    private Book book;
    @Override
    public void startElement(String uri, String localName, String name,
            Attributes attributes) throws SAXException
    {
        currentTag=name;
        if("书".equals(currentTag))
        {
            book=new Book();
        }
    }
    @Override
    public void characters(char[] ch, int start, int length)
            throws SAXException
    {
        if("出版社".equals(currentTag))
        {
            String name=new String(ch,start,length);
            book.setName(name);
        }
        if("作者".equals(currentTag))
        {
            String author=new String(ch,start,length);
            book.setAuthor(author);
        }
        if("价格".equals(currentTag))
        {
            String price=new String(ch,start,length);
            book.setPrice(price);
        }
    }
    @Override
    public void endElement(String uri, String localName, String name)
            throws SAXException
    {
        if(name.equals("书"))
        {
            list.add(book);
            book=null;
        }
        currentTag=null;
    }
    public List getBooks()
    {
        return list;
    }
    public static void main(String []args)
    {
        //1.创建解析工厂
        SAXParserFactory factory=SAXParserFactory.newInstance();
        SAXParser sp=null;
        try
        {
            //2.得到解析器
            sp=factory.newSAXParser();
            //3、得到读取器
            XMLReader reader=sp.getXMLReader();
            File file=new File("D:\Eclipse\workSpace\day_050401\src\book.xml");
            //4.设置内容处理器
            Demo handle=new Demo();
            //reader.setContentHandler(handle);
            sp.parse(file,handle);
            //5.读取xml文档内容
            List<Book> list=handle.getBooks();
            for(int i=0;i<list.size();i++)
            System.out.println(list.get(i).getAuthor()+"----"+list.get(i).getName()+"-----"+list.get(i).getPrice());
        } 
        catch (ParserConfigurationException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        } 
        catch (SAXException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
        catch (IOException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
    }
}

　　运行结果如下：

三、dom4j解析XML文档

　　dom4j也是一种用于解析XML文档的开放源代码的Java库。下载地址http://sourceforge.net/projects/dom4j/。

　　使用dom4j进行读取XMl文档操作，代码如下：

import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.security.KeyStore.Entry.Attribute;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;
import org.junit.Test;

public class Demo
{
    //读取xml文件第二本书的出版社
    @Test
    public void read()
    {
         SAXReader reader = new SAXReader();
         try
        {
            Document document = reader.read("C:\Users\Administrator\Desktop\book.xml");
            Element root =document.getRootElement();
            Element book=(Element)root.elements("书").get(1);
            String value=book.element("出版社").getText();
            System.out.println(value);
        }
         catch (DocumentException e)
        {
            // TODO 自动生成的 catch 块
            e.printStackTrace();
        }
    }
    
    //在第二本书上添加一个书名：<书名>平凡的世界</书名>
    @Test
    public void add() throws DocumentException, IOException
    {
        SAXReader reader = new SAXReader();
        Document document = reader.read("C:\Users\Administrator\Desktop\book.xml");
        
        Element book=(Element) document.getRootElement().elements("书").get(1);
        book.addElement("书名").setText("平凡的世界");
        //更新内存
        XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream("C:\Users\Administrator\Desktop\book.xml"),"UTF-8"));
        writer.write(document);
        writer.close();
    }
}

　　运行结果：

　　PS：如果你的项目经常需要更换解析器，建议使用DOM和SAX，这样当更换解析器时不需要更改任何代码，如果没有这样的需求，建议使用dom4j，简单而又强大。

相关阅读:
java中&和&&
java保留字
 最优路径算法合集（附python源码）（原创）
十大经典排序算法（python实现）（原创）
电子欠款单设想（原创）
羽毛球友谊赛规则（附带程序）（原创）
基于python的opcode优化和模块按需加载机制研究(学习与个人思路)（原创）
lazy_import源码解析（原创）
多线程的音频打标记的python实现（原创）
关于塔防游戏的浅析（原创）
原文地址：https://www.cnblogs.com/xujian2014/p/4480198.html