相信很多小伙伴已经听说过Xpath,之前小编也写过一篇关于Xpath的文章,感兴趣的小伙伴可以戳这篇文章如何利用Xpath抓取京东网商品信息以及Python网络爬虫四大选择器(正则表达式、BS4、Xpath、CSS)总结。今天小编继续给大家介绍一些Xpath知识点,希望对大家的学习有帮助。
1、Xpath让我们可以使用一种类似于Windows下的文件路径的方式,让我们可以定位到HTML或者XML结构中的具体元素。Xpath本身包含标一些准函数库,可以让我们的Xpath语法更加强大。
![](https://upload-images.jianshu.io/upload_images/26239789-b85180f3f797f236?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
2、在HTML结构中,有一定的层级关系,主要的关系包括:父节点、子节点、同胞节点(兄弟节点)、先辈节点、后代节点。
![](https://upload-images.jianshu.io/upload_images/26239789-41387b934e0cd737?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
一般的,像类似于这种结构,称之为一个节点。如上图,根据层次关系,我们可以知道节点是