• dom4j和jaxp解析工具的


    dom4j解析中的几个对象

    node

        --branch

        --document 

        --element

        --commment 

        --attribute

        --text

    branch

        --document

        --element

    jaxp解析中的几个对象

    node

        --document

        --element

        --commment

        --attr

        --text


    dom4j解析

    中全部对象都是node对象的子节点,也就是说它把说有对象都单独分离出来看成一个对象,而branch是一个对经常使用节点的封装和关联,如Element对象就包括了有attribute对象和text对象,而document对象就封装了全部节点对象

    jaxp的dom解析

    jaxp的dom解析方式没有branch节点,没有将各个节点进行封装,全部操作的都是node节点;

        并且由于节点间没有关联属性,所以在创建节点后须要进行关联,删除节点时须要找父节点

        细节:node的节点没有获得attribute的方法,仅仅有Element才有获得attribute的方法

    dom4j解析,jaxp的dom解析的共同点

    1.通过依据条件查询后的结果都是一个list集合

    2.改动text或textContent时既能够用Node也能够用Element


    xml文档解析方式有两种dom和sax,经常使用开发工具有两种jaxp,dom4j

    jaxp:将两种解析方法分开了,dom解析和sax解析,sax解析方法没有写方法

    dom4j:把两种解析方式结合起来,取文件时採用sax解析,写文件时採用dom解析,继承了两种解析方式的长处


    关于sax解析:

    sax解析事实上也是把文档载入进内存中,可是这个缓存区仅仅有3M左右的大小(能够用一个大文档,然后打印characters方法中的start值观察),假设文档非常小,所有载入进内存,假设文档非常大,缓存区慢后会自己主动清空缓存区,继续载入兴许数据,这个缓存数组就是characters()方法參数列表中的ch。

    也就是说,假设要读取一个小文档,仅仅须要复写这一个方法就能够了,然后将字符数组转成字符串打印就能够了,或者依据角标取响应的数据。

    public void characters(char[] ch, int start, int length){

        System.out.println(new String(ch,10,2));

    }

    然后文档的读取事实上就相当于IO流中的指针移动

  • 相关阅读:
    WCF Data Contract之集合类型
    LINQ To DataSet
    WCF Data Contract之枚举
    初识Parallel Extensions之TPL(二)
    初识Parallel Extensions之TPL
    java北京行之单例模式的引入
    Strut2 入门
    解决 Eclipse 下使用 Ant 编译出现问题: 警告:编码 GBK 的不可映射字符
    解决 Ant 非法字符: \65279
    [原创]Visual Studio 中引用 Flash 控件
  • 原文地址:https://www.cnblogs.com/yxwkf/p/3924603.html
Copyright © 2020-2023  润新知