• 黄聪:XML操作中常用的XPath表达式


    一些常用的XPath表达式:

    如果XPath的开头是一个斜线(/)代表这是绝对路径。如果开头是两个斜线(//)表示文件中所有符合模式的元素都会被选出来,即使是处于树中不同的层级也会被选出来。以下的语法会选出文件中所有叫做cd的元素(在树中的任何层级都会被选出来):
    //cd


    选择未知的元素
    使用星号(Wildcards,*)可以选择未知的元素。下面这个语法会选出/catalog/cd 的所有子元素:
    /catalog/cd/*

    以下的语法会选出所有catalog的子元素中,包含有price作为子元素的元素。
    /catalog/*/price


    以下的语法会选出有两层父节点,叫做price的所有元素。
    /*/*/price


    以下的语法会选择出文件中的所有元素。
    //*
    要注意的是,想要存取不分层级的元素,XPath语法必须以两个斜线开头(//),想要存取未知元素才用星号(*),星号只能代表未知名称的元素,不能代表未知层级的元素。

    选择分支
    使用中括号可以选择分支。以下的语法从catalog的子元素中取出第一个叫做cd的元素。XPath的定义中没有第0元素这种东西。
    /catalog/cd[1]

    以下语法选择catalog中的最后一个cd元素:(XPathj并没有定义 first() 这种函式喔,用上例的 [1]就可以取出第一个元素。
    /catalog/cd[last()]

    以下语法选出含有price子元素的所有/catalog/cd元素。
    /catalog/cd[price]

    以下语法选出price元素的值等于10.90的所有/catalog/cd元素
    /catalog/cd[price=10.90]

    以下语法选出price元素的值等于10.90的所有/catalog/cd元素 的price元素
    /catalog/cd[price=10.90]/price

    选择一个以上的路径
    使用Or操作数( ¦)就可以选择一个以上的路径。例如:
    /catalog/cd/title ¦ catalog/cd/artist

    选择所有title以及artist元素
    //title ¦ //artist


    选择所有title以及artist以及price元素
    //title ¦ //artist ¦ //price


    选择属性
    在XPath中,除了选择元素以外,也可以选择属性。属性都是以@开头。例如选择文件中所有叫做country的属性:
    //@country


    选择所有含有country这个属性的cd元素:
    //cd[@country]


    以下语法选择出含有属性的所有cd元素
    //cd[@*]
           
    以下语法选择出country属性值为UK的cd元素
    //cd[@country='UK']

  • 相关阅读:
    理解区块链背后的Merkle Tree
    黑科技!当会爬虫的Python遇上会画图的FineBI……
    PlayFramework 1.x 生产环境部署 源码编译
    特别推荐:系统性能提升优先法宝 | 缓存应用实践
    Python爬虫入门教程 38-100 教育部高校名单数据爬虫 scrapy
    BI分析工具选型:从PowerBI到FineBI的9个理由!
    集群的定义以及类别定义
    python cx_oracle 绑定变量
    [故障解决]图文:windows apache无法启用 端口被占用
    设计模式之抽象工厂模式
  • 原文地址:https://www.cnblogs.com/huangcong/p/2182302.html
Copyright © 2020-2023  润新知