• Scrapy数据获取方式


    response的属性

    # 返回请求的url
    response.url
    
    # 返回请求的状态码
    response.status
    
    # 返回携带的meta数据
    response.meta
    
    # 返回响应头的信息
    response.headers
    
    # 返回结对url
    response.urljoin
    

    response的选择器

    xpath选择器

    # 使用获取a标签,取第1个获取的标签,使用extract解析里面全部的数据,返回list
    xpathInfo = response.xpath('//*[@id="u1"]/a').extract()
    print(xpathInfo)
    
    # 解析并只获取第一个数据
    xpathInfoFirst = response.xpath('//*[@id="u1"]/a').extract_first()
    print(xpathInfoFirst)
    
    # 使用re匹配获取符号正则规则的数据,返回list
    xpathInfoRe = response.xpath('//*[@id="u1"]/a').re('.*闻.*')
    print(xpathInfoRe)
    
    # 使用re匹配获取符号正则规则的第一个元素
    xpathInfoReFirst = response.xpath('//*[@id="u1"]/a').re_first('.*')
    print(xpathInfoReFirst)
    

    css选择器

    # 使用css选择器获取数据
    cssInfo = response.css("a::text").extract()
    print(cssInfo)
    
  • 相关阅读:
    nginx 平滑升级和location配置案例
    nginx
    基于zabbix的监控keepalive脑裂
    KVM部署
    基于keepalived的lvs负载均衡http集群
    高可用keepalived
    KVM
    无向图中 生成树,完全图,连通图 的区别
    java中 is
    第一章——软件工程学概述 思维导图
  • 原文地址:https://www.cnblogs.com/studyNotesSL/p/11534869.html
Copyright © 2020-2023  润新知