关于python中selector问题

在做大型的爬虫时，re表达式往往效率不高，scrapy框架为爬虫提供了很好的爬虫方法

scrapy提取数据时有一套自己的机制，即selectors，一般通过特定的XPath，或者特定

的CSS表达式来进行提取HTML中的部分。

Xpath使用在XML文档中，用来对文档中的元素和属性历遍，此时XML时被当作节点树

来对待，它包括元素、属性、文本、命名空间、处理指令、注释、根节点（文档节点）

xpath使用表达路径在xml文档中选取节点

nodename:选取此节点的所有子节点

/：从根节点选取

//：从匹配选择的当前节点选择文档中的节点，不考虑位置

.：选取当前节点

..：选取

相关阅读:
浅谈几种筛法
[jzoj]4271. 【NOIP2015模拟10.27】魔法阵（37种转移的dp）
【gdoi2018 day2】第二题滑稽子图（subgraph）（性质DP+多项式）
礼物（中国剩余定理+拓展gcd求逆元+分治=拓展Lucus）
【GDOI2016模拟3.15】基因合成（回文串+性质+DP）
【NOIP2013模拟】终极武器（经典分析+二分区间）
【GDOI2016模拟3.16】幂（容斥 + 模型复杂转化）
Hbase-cdh5.14.2与kylin集成异常
拉链表
数仓分层的理解

原文地址：https://www.cnblogs.com/laowangxieboke/p/8608428.html