一、XML概述
1、XML是可扩展标记语言。是由W3C指定并维护的,目前最新的版本是1.0
2、XML作用:
2.1传输数据,它是一种通用的数据交换格式
2.2配置文件。
二、xml语法
1、XML的声明
1.1语法:<?xml version="1.0" encoding="UTF-8"?>
保存在磁盘上的文件编码要与声明的编码一致。
encoding属性的默认 编码是:UTF-8
1.2XML的声明必须出现在XML文档的第一行
2、XML的注释
2.1语法:<!--这是注释-->
2.2注释不能出现在声明之前
3、CDATA区
CDATA是Character Data的缩写
把标签当做普通文本内容;
示例:
<![CDATA[
<itcast>www.itcast.cn</itcast>
]]>
三、DTD约束
1、常用约束:DTD(Document Type Definition)文档类型定义
Schema
2、格式良好的XML:遵循XML语法的文档
有效的XML:遵守约束的文档。
有效的XML文档一定是格式良好的,但格式良好的不一定是有效的
3、单独的DTD文档在保存时要以UTF-8编码进行保存
4、编写DTD
4.1在XML文档中直接编写:
<?xml version="1.0" encoding="gbk"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架/>
4.2引入外部DTD
4.2.1:当引用的DTD文档在本地时,采用如下方式:
<!DOCTYPE 根元素 SYSTEM “DTD文档路径”>
4.2.2:当引用的DTD文档在公共网络上时,采用如下方式:
<!DOCTYPE 根元素 PUBLIC “DTD名称” “DTD文档的URL”>
5、定义元素:
语法:<!ELEMENT 元素名称 使用规则>
使用规则:
(#PCDATA):表示标签主体内容为普通字符串
EMPTY:表示标签没有主体内容
ANY:主体为任意内容
(子元素):标签中的子元素
用逗号分开:按顺序出现
用“|”:选择其中一个
出现次数:
如果元素后面没有+*?:表示必须且只能出现一次
+:表示至少出现一次,一次或多次
*:表示可有可无,零次、一次或多次
?:表示可以有也可以无,有的话只能有一次。零次或一次
6、定义元素的属性
语法:<!ATTLIST 元素名称
属性名称1 属性值类型 设置说明
属性名称2 属性值类型 设置说明
....
>
属性值类型:
CDATA:普通文本数据
A|B|C "A":表示枚举值,只能从A、B、C中取其中一个,A为默认值
ID:表示取值不能重复
设置说明:
#REQUIRED:表示该属性必须出现
#IMPLIED:表示该属性可有可无
#FIXED:表示属性的取值为一个固定值。语法:#FIXED "固定值"
直接值:表示属性的取值为该默认值
StudentDao:
- package com.it.dao;
- import java.io.IOException;
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.transform.TransformerException;
- import org.w3c.dom.Document;
- import org.w3c.dom.Element;
- import org.w3c.dom.Node;
- import org.w3c.dom.NodeList;
- import org.xml.sax.SAXException;
- import com.it.model.Student;
- import com.it.xmlUtil.XMLUtil;
- public class StudentDao {
- public void add(Student s) throws ParserConfigurationException, SAXException, IOException, TransformerException {
- //得到Document对象
- Document doc = XMLUtil.getDocument();
- //构建Student相关的所有Element
- Element e_student = doc.createElement("student");
- e_student.setAttribute("school_id", s.getSchool_id());
- e_student.setAttribute("card_id", s.getCard_id());
- Element e_name = doc.createElement("name");
- e_name.setTextContent(s.getName());
- Element e_add = doc.createElement("add");
- e_add.setTextContent(s.getAdd());
- Element e_phone = doc.createElement("phone");
- e_phone.setTextContent(s.getPhone());
- //建立Element之间的关系
- e_student.appendChild(e_name);
- e_student.appendChild(e_add);
- e_student.appendChild(e_phone);
- doc.getElementsByTagName("exam").item(0).appendChild(e_student);
- //将添加了学生的Element保存
- XMLUtil.saveXML(doc);
- }
- public boolean delete(String school_id) throws ParserConfigurationException, SAXException, IOException, TransformerException {
- boolean result = false;
- //得到Document
- Document doc = XMLUtil.getDocument();
- //得到所有的Student节点
- NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
- //遍历所有的student
- for(int i = 0;i<list.getLength();i++) {
- Node node = list.item(i);
- if(node.getNodeType() == Node.ELEMENT_NODE) {
- Element el = (Element)node;
- //找到需要删除的节点,用他的父节点删除之
- if(el.getAttribute("school_id").equals(school_id)) {
- node.getParentNode().removeChild(node);
- result = true;
- }
- }
- }
- XMLUtil.saveXML(doc);
- return result;
- }
- public Student search(String school_id) throws ParserConfigurationException, SAXException, IOException {
- Student s = null;
- //得到Document
- Document doc = XMLUtil.getDocument();
- //得到所有的Student节点
- NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
- //遍历所有的student
- for(int i = 0;i<list.getLength();i++) {
- Node node = list.item(i);
- if(node.getNodeType() == Node.ELEMENT_NODE) {
- Element el = (Element)node;
- if(el.getAttribute("school_id").equals(school_id)) {
- s = new Student();
- s.setCard_id(el.getAttribute("card_id"));
- s.setAdd(el.getChildNodes().item(1).getTextContent());
- s.setName(el.getChildNodes().item(0).getTextContent());
- s.setPhone(el.getChildNodes().item(2).getTextContent());
- s.setSchool_id(school_id);
- }
- }
- }
- return s;
- }
- public boolean update(Student s) throws ParserConfigurationException, SAXException, IOException {
- boolean result = false;
- //得到Document
- Document doc = XMLUtil.getDocument();
- //得到所有的Student节点
- NodeList list = doc.getElementsByTagName("exam").item(0).getChildNodes();
- //遍历所有的student
- for(int i = 0;i<list.getLength();i++) {
- Node node = list.item(i);
- if(node.getNodeType() == Node.ELEMENT_NODE) {
- Element el = (Element)node;
- if(el.getAttribute("school_id").equals(s.getSchool_id())) {
- el.getChildNodes().item(0).setTextContent(s.getName());
- //此处省略...
- }
- }
- }
- return result;
- }
- }
XMLUtil
- package com.it.xmlUtil;
- import java.io.IOException;
- import javax.xml.parsers.DocumentBuilder;
- import javax.xml.parsers.DocumentBuilderFactory;
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.transform.Transformer;
- import javax.xml.transform.TransformerException;
- import javax.xml.transform.TransformerFactory;
- import javax.xml.transform.dom.DOMSource;
- import javax.xml.transform.stream.StreamResult;
- import org.w3c.dom.Document;
- import org.xml.sax.SAXException;
- public class XMLUtil {
- /**
- * 将内存中的Document保存到磁盘上
- * @param doc
- * @throws TransformerException
- */
- public static void saveXML(Document doc) throws TransformerException {
- TransformerFactory tff = TransformerFactory.newInstance();
- Transformer tf = tff.newTransformer();
- tf.transform(new DOMSource(doc), new StreamResult("resource/student.xml"));
- }
- /**
- * 返回Document
- * @return
- * @throws ParserConfigurationException
- * @throws SAXException
- * @throws IOException
- */
- public static Document getDocument() throws ParserConfigurationException, SAXException, IOException{
- DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
- DocumentBuilder db = dbf.newDocumentBuilder();
- Document doc = db.parse("resource/student.xml");
- return doc;
- }
- }
使用SAX解析XML
- package com.it.sax;
- import java.io.IOException;
- import java.util.ArrayList;
- import java.util.List;
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.XMLReader;
- import org.xml.sax.helpers.DefaultHandler;
- public class SaxXML {
- public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
- //新建ContentHandler用于解析xml
- BeanHandler bh = new BeanHandler();
- SAXParser sp = SAXParserFactory.newInstance().newSAXParser();
- XMLReader xr = sp.getXMLReader();
- xr.setContentHandler(bh);
- xr.parse("resource/book.xml");
- List<Book> list = bh.getList();
- for(Book b:list) {
- System.out.println("书名" + b.getName() + "|作者" +
- b.getAuthor() + "|价格" + b.getPrice());
- }
- }
- }
- class BeanHandler extends DefaultHandler{
- String currentTagName = null;
- List<Book> list = new ArrayList();
- Book book = null;
- //在遇到Element开始标签是进行的处理
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException {
- currentTagName = qName;
- if(currentTagName.equals("书")) {
- book = new Book();
- }
- super.startElement(uri, localName, qName, attributes);
- }
- //在遇到标题结束标志时进行的处理
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException {
- currentTagName = "";
- if("书".equals(qName)) {
- list.add(book);
- }
- super.endElement(uri, localName, qName);
- }
- //遇到需要处理的Textcontent时进行的处理,同时会处理换行,制表符等
- @Override
- public void characters(char[] ch, int start, int length)
- throws SAXException {
- super.characters(ch, start, length);
- if(currentTagName.equals("书名")){
- book.setName(new String(ch,start,length));
- }else if(currentTagName.equals("作者")){
- book.setAuthor(new String(ch,start,length));
- }else if(currentTagName.equals("售价")) {
- book.setPrice(new String(ch,start,length));
- }
- }
- public List<Book> getList() {
- return list;
- }
- }
利用Dom4j解析XML
- package com.itheima.dom4j;
- import java.io.FileOutputStream;
- import java.util.List;
- import javax.xml.transform.sax.SAXResult;
- import org.dom4j.Document;
- import org.dom4j.DocumentException;
- import org.dom4j.DocumentHelper;
- import org.dom4j.Element;
- import org.dom4j.Node;
- import org.dom4j.io.OutputFormat;
- import org.dom4j.io.SAXReader;
- import org.dom4j.io.XMLWriter;
- import org.junit.Assert;
- import org.junit.Test;
- public class Dom4jDemo {
- //得到某个具体的节点内容
- //得到第2本书的主体内容
- @Test
- public void test1() throws Exception{
- //1、得到解析器 xpath
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- //4\得到第2本书元素
- Element book = (Element)root.elements("书").get(1);
- Element name = book.element("书名");
- Assert.assertEquals("JavaScript", name.getText());
- }
- @SuppressWarnings("unchecked")
- @Test
- ////得到第2本书的书名主体内容
- public void test11() throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- String xpath = "//书[2]/书名"; //书名[2]
- Node list = document.selectSingleNode(xpath);
- Assert.assertEquals("JavaScript", list.getText());
- }
- // 2、遍历所有元素节点,打印元素的名称
- @Test
- public void test2()throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- treeWalk(root);
- }
- public void treeWalk(Element element){
- //直接打印它的名字
- System.out.println(element.getName());
- //2、获取它的孩子Node,循环遍历
- int size = element.nodeCount();
- for(int i=0;i<size;i++){
- Node node = element.node(i);
- //判断node是否是元素
- if(node.getNodeType()==Node.ELEMENT_NODE){
- treeWalk((Element)node);
- }
- }
- }
- // 3、修改某个元素节点的主体内容
- //更改第2本书的作者为wzhting
- @Test
- public void test3()throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- //4、得到第2本书的作者
- Element book = (Element)root.elements("书").get(1);
- Element author = book.element("作者");
- //5、设置其内容
- author.setText("王昭珽");
- //更新xml文档
- OutputFormat format = OutputFormat.createPrettyPrint();
- // format.setEncoding("UTF-8");//设置编码
- XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"));
- //默认编码就是UTF-8
- writer.write(document);
- writer.close();
- }
- // 4、向指定元素节点中增加子元素节点
- //向第1本书中增加一个新节点叫<内部价>60</内部价>
- @Test
- public void test4() throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- //4、得到第1本书
- Element book = root.element("书");
- Element price = DocumentHelper.createElement("内部价");
- price.setText("60");
- book.add(price);
- OutputFormat format = OutputFormat.createPrettyPrint();
- XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
- //默认编码就是UTF-8
- writer.write(document);
- writer.close();
- }
- // 5、向指定元素节点上增加同级元素节点
- //向第一本书的售价前面增加 批发价
- @Test
- public void test5() throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- List list = root.element("书").elements();
- Element price = DocumentHelper.createElement("批发价");
- price.setText("10");
- list.add(2, price);
- OutputFormat format = OutputFormat.createPrettyPrint();
- XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
- //默认编码就是UTF-8
- writer.write(document);
- writer.close();
- }
- // 6、删除指定元素节点
- //删除第2本书的作者
- @Test
- public void test6() throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- //通过爸爸删自己
- Element book = (Element)root.elements("书").get(1);
- Element author = book.element("作者");
- author.getParent().remove(author);
- OutputFormat format = OutputFormat.createPrettyPrint();
- XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"),format);
- //默认编码就是UTF-8
- writer.write(document);
- writer.close();
- }
- // 7、操作XML文件属性
- @Test
- public void test7() throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- //3、获取根元素
- Element root = document.getRootElement();
- Element book = (Element)root.elements("书").get(1);
- Assert.assertEquals("传智播客", book.attributeValue("出版社"));
- }
- //8、将xml文档转换为String
- @Test
- public void test8() throws Exception{
- SAXReader reader = new SAXReader();
- //2、加载xml文档
- Document document = reader.read("src/book.xml");
- String text = document.asXML();
- System.out.println(text);
- }
- @Test
- public void test9() throws Exception{
- String text = "<person> <name>James</name> </person>";
- Document document = DocumentHelper.parseText(text);
- OutputFormat format = OutputFormat.createPrettyPrint();
- XMLWriter writer = new XMLWriter(new FileOutputStream("D:/a.xml"),format);
- //默认编码就是UTF-8
- writer.write(document);
- writer.close();
- }
- }