[Python 练习爬虫] XPATH基础语法

XPATH语法：

// 定位根标签

/ 往下层寻找

/text() 提取文本内容

/@xxx 提取属性内容

Sample：

import requests
from lxml import etree

for i in range(1, 21):
    url = "http://www.xxx.com/topic/tv/page/{}".format(i)
    req = requests.get(url).content

    html = etree.HTML(req)

    # 提取文本
    text = html.xpath(
        '/html/body/section/div[1]/div/article[*]/header/h2/a/text()')
    for each in text:
        print(1,each)

    # 提取链接
    # link = html.xpath('//a/@href')
    # for i in link:
    #     print(i)

相关阅读:
将execel表格的数据导入到mysql数据库
 清明听雨
 h5调用底层接口的一些知识
 微信小程序从零开始开发步骤（一）搭建开发环境
 Matplotlib
Numpy
pandas
6 MapReduce的理解
 静态链表
 单链表
原文地址：https://www.cnblogs.com/i-honey/p/8296039.html

最新文章
ACM-ICPC国际大学生程序设计竞赛北京赛区(2016)网络赛 A Simple Job
ACM-ICPC国际大学生程序设计竞赛北京赛区(2016)网络赛 The Book List
Codeforces Round #373 (Div. 2) B
Codeforces Round #373 (Div. 2) A
某集团BI决策系统建设方案分享
 起伏地形环境轮式机器人运动控制研究
 一个简单的多机器人编队算法实现--PID
某公司基于FineBI数据决策平台的试运行分析报告
 扫地机器人算法的一些想法和测试
 大型服装集团BI决策系统的分析主题模块

热门文章
Qual F&Q
高通android开发摘要
 修改C:WINDOWSsystem32driversetchosts 文件有什么作用
 地市级地铁数据管理信息系统解决方案
 SpringCloud微服务框架搭建
 JVM虚拟机
 手动打war包进行部署测试
 在linux，windows上安装ruby on rails开发环境
 Linux环境下Apache ActiveMQ 基本安装
 SpringBoot项目如何进行打包部署