为读取和分析xml文档的内容,需要一个xml解析器。解析器是读取文档,检查其语法是否正确并在它除了文档时完成某些工作的程序。有两种xml解析器是经常使用的。一种遵循称为SAX (xml简单api)规范,另一种遵循称为dom 规范。sax解析器是事件驱动的。只要解析器遇到某种结构(例如,开始标签<price> ),它就会调用必须提供的一个方法。相反,dom解析器则构建表示被解析文档的树。一旦解析器建树完毕,就可以分析此树。对需要大量内存来处理树结构的大型xml来说,sax解析器的效率更高。但是,对大多数应用程序来说,dom解析器更容易使用--解析树给出了数据的完成概况,而sax解析器只给出零散的信息。
在sax解析器分析文档时,会激活事件,而dom解析器则构建文档树。
Document接口描述xml文档的树结构,为了生成实现Document接口类的对象,就需要一个DocumentBuilder对象,为了得到DocumentBuilder,首先调用DocumentBuilderFactory类的静态方法newInstance方法,然后在工厂对象上调用newDocumenBuilder方法。
File f=new File(" "); DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); DocumentBuilder builder=factory.newDocumentBuilder(); Document doc = builder.parse(f);
DocumentBuilder能够从文件,url或者输入流中读取xml文件,其结果是包含数的Document对象。
如果文档位于Internet上,就使用URL;
URL url=new URL(urlname);
也可以从任意输入流中读取文档:
InputStream in=......;
Document doc=builder.parse(in);
一旦创建了新文档或从文件中读取了文档,就可以检查并修改它。
下面是一份简单的xml文档,no是车牌号码,addr是车主地址:
<?xml version="1.0" encoding="GB2312"?> <result> <value> <no>A123</no> <addr>广东省珠海市香洲区</addr> </value> <value> <no>b456 </no> <addr>北京市朝阳区</addr> </value> </result>
用dom解析程序如下:
package dom; import javax.xml.parsers.*; import org.w3c.dom.*; import java.io.*; import java.util.*; public class MyXMLReader{ public static void main(String arge[]){ long lasting =System.currentTimeMillis(); try{ File f=new File("resource/data_10k.xml"); DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); DocumentBuilder builder=factory.newDocumentBuilder(); Document doc = builder.parse(f); NodeList nl = doc.getElementsByTagName("value"); for (int i=0;i<nl.getLength();i++) { System.out.print("车牌号码:" + doc.getElementsByTagName("no").item(i).getFirstChild().getNodeValue()); System.out.println("车主地址:" + doc.getElementsByTagName("addr").item(i).getFirstChild().getNodeValue()); } }catch(Exception e){ e.printStackTrace(); } } }
注意 import javax.swing.text.Document;包中也有一个Document类,不要导入这个包,应导入import org.w3c.dom.Document;这个包
输出:
车牌号码:A123车主地址:广东省珠海市香洲区
车牌号码:b456 车主地址:北京市朝阳区