python爬虫 xpath

导入模块, 代码: from lxml import etree

将HTML文件解析成 Xpath对象代码: html = etree.HTML(text)

调用Xpath解析对象的xpath 方法, 对内容进行解析

常用运算符 |    计算两个节点集    
//book | //cd    返回所有拥有 book 和 cd 元素的节点集

常用函数

contains

last() : html.xpath('//a[last()]') #取多个a标签的最后一个

position :当前位置 html.xpath('//a[positon!=2]') #取多个a标签但不包含第2个a标签

相关阅读:
Python 编码问题（十四）
Python 编程核心知识体系-文件对象|错误处理（四）
Python 编程核心知识体系-模块|面向对象编程（三）
项目中的走查
回滚代码及pod install报错
UI-3
UI-2
UI-1
MarkDown基本语法速记
Swift3.0-closure的@autoclosure和@escaping

原文地址：https://www.cnblogs.com/xuwinwin/p/15800378.html