Scrapy数据获取方式

response的属性

# 返回请求的url
response.url

# 返回请求的状态码
response.status

# 返回携带的meta数据
response.meta

# 返回响应头的信息
response.headers

# 返回结对url
response.urljoin

response的选择器

xpath选择器

# 使用获取a标签，取第1个获取的标签，使用extract解析里面全部的数据，返回list
xpathInfo = response.xpath('//*[@id="u1"]/a').extract()
print(xpathInfo)

# 解析并只获取第一个数据
xpathInfoFirst = response.xpath('//*[@id="u1"]/a').extract_first()
print(xpathInfoFirst)

# 使用re匹配获取符号正则规则的数据，返回list
xpathInfoRe = response.xpath('//*[@id="u1"]/a').re('.*闻.*')
print(xpathInfoRe)

# 使用re匹配获取符号正则规则的第一个元素
xpathInfoReFirst = response.xpath('//*[@id="u1"]/a').re_first('.*')
print(xpathInfoReFirst)

css选择器

# 使用css选择器获取数据
cssInfo = response.css("a::text").extract()
print(cssInfo)

相关阅读:
nginx 平滑升级和location配置案例
 nginx
基于zabbix的监控keepalive脑裂
 KVM部署
 基于keepalived的lvs负载均衡http集群
 高可用keepalived
KVM
无向图中生成树,完全图,连通图的区别
 java中 is
第一章——软件工程学概述思维导图
原文地址：https://www.cnblogs.com/studyNotesSL/p/11534869.html

热门文章
keepalived高可用
 KVM虚拟化
 Jenkins流水线项目发布
 jenkins
tomcat
gitlab
rsync配置
 基于proxysql实现的读写分离案例
 PROXYSQL
LNMP