因为我发现有的时候直接用浏览器的F12复制的Xpath路径在网页监控器中不顶用,因此要学一下xpath的语法
教程内容来自:https://www.bilibili.com/video/BV1BP4y1x7fY
xpath语法规则
符号 | 意义 |
---|---|
/ | 根节点 |
// | 任意位置的标签(标签<>内的第一个词) |
* | 任意元素 |
@ | 属性(<>内的class href style alt src等) |
. | 当前节点 |
.. | 父级节点 |
//* | 任意位置的任意元素 |
常用查找
查找语句 | 意义 |
---|---|
//*[@属性='属性值'] | 查找当前页面属性值的东西 |
//*[text()='文本值'] | 查找标签之间的文本值相对应东西 |
//*[contains(@属性,'值')] | 通过属性模糊查询(模糊查找就不需要完整路径 |
//*[contains(text(),'值')] | 通过文本模糊查询 |
//*[start_with(@属性,'值')] | 元素id是动态的,比如微博每次都在变化(防止爬虫) 但是这个方法就可以稳定找到id中不变的内容 |
//*[]/../.. | 找到稳定节点的匹配值的上上一级,通过子节点找父节点 |
//*[@属性1='值' and @属性2='值'] | 多属性查找 |
//*[name()='svg'] | 特殊的svg标签定位方式 |