Python如何利用Xpath进行解析

用Python做网络爬虫的时候，会对网页的信息进行提取，笔者接触的有正则表达式，BeautifulSoup，Xpath，前面两个都是在国内能够使用的，而Xpath是Chrome的一个插件，因此需要“翻墙”就可以获取到。

笔者在这里提供了Xpath的文件。

一、安装Xpath

链接：https://pan.baidu.com/s/1FsAEKWhqEosMNcaXvxXevg
提取码：y9jv

下载下来后

打开扩展程序，将文件拖进去就可以了Crtl+Shift+X就可以打开Xpath

二、使用Xpath

导入lxml和etree

1     mytree = lxml.etree.HTML(content)
2     # 获取电影的基本信息:
3     name = mytree.xpath('*//div[@class="movie-brief-container"]//h3[@class="name"]//text()')

通过上述方法，就可以建立Xpath的查询。

三、Xpath的解析方法

　　在使用Xpath进行解析的时候，需要对它进行解析，这里附上一些解析的介绍，可以根据他的提示来写Xpath语句

　　https://blog.csdn.net/uvyoaa/article/details/80998271

　https://blog.csdn.net/qq_41338249/article/details/81029717

　　基本解析方式都一样抓住要点。

相关阅读:
逻辑回归(logistics regression) 总结
SQL注入原理
xss绕过过滤之方法
PHP CALC
IP欺骗原理与过程分析
DNS域传送漏洞利用
linux性能测试工具perf
linux设置程序开机自启
Http请求中Content-Type和Accept讲解以及在Spring MVC中的应用
random函数的使用

原文地址：https://www.cnblogs.com/future-dream/p/10260075.html