一、xpath简介
1、xpath使用路径表达式在xml和html中进行导航 1、 xpath包含标准函数库 2、 xpath是一个w3c的标准、
二、xpath节点关系
1、 父节点 2、 子节点 3、 兄弟节点 4、 先辈节点 5、 后代节点
三、xpath语法
表达式 article 选取所有的article元素的所有子节点 /article 选取根元素article article/a 选取所有属于article的子元素的a元素 //div 选取所有div的子元素,(无论出现在文档的任何地方) article//div 选取所有属于article元素后代的div元素,不管它出现在article之下的任何位置 //@class 选取所有名为class的属性 xpath定位语法 表达式 /article/div[1] 选取article子元素的第一个div元素 /article/div[last()] 选取属于article子元素的最后一个div元素 /article/div[last()-1] 选取属于article子元素的倒数第二个div元素 //div[@lang] 选取所有拥有lang元素的div元素 //div[@lang=’end’] 选取所有lang属性为eng的div元素 xpath特殊符号 表达式 /div/* 获取属于div元素的所有子节点 //* 获取所有元素 //div[@*] 获取所有带属性的title元素 /div/a|//div/p 获取所有div元素的a和p元素 //span |//ul 获取文档中的span和ul元素 article/div/p|//span 选取所有属于article元素的div元素的p元素以及文档中所有的span元素