• scrapy Selector


    Selector 是一个可以独立使用的模块。我们可以直接利用 Selector 这个类来构建一个选择器对象,然后调用它的相关方法如 xpath、css 等来提取数据。
    
    例如,针对一段 HTML 代码,我们可以用如下方式构建 Selector 对象来提取数据:
    
    复制
    from scrapy import Selector
    ​
    body = '<html><head><title>Hello World</title></head><body></body></html>'
    selector = Selector(text=body)
    title = selector.xpath('//title/text()').extract_first()
    print(title)
    运行结果:
    
    复制
    Hello World
    值得注意的是,response 对象不能直接调用 re 和 re_first 方法。如果想要对全文进行正则匹配,可以先调用 xpath 方法然后再进行正则匹配,如下所示:
    
    复制
    >>> response.re('Name:s(.*)')
    Traceback (most recent call last):
      File "<console>", line 1, in <module>
    AttributeError: 'HtmlResponse' object has no attribute 're'
    >>> response.xpath('.').re('Name:s(.*)<br>')
    ['My image 1 ', 'My image 2 ', 'My image 3 ', 'My image 4 ', 'My image 5 ']
    >>> response.xpath('.').re_first('Name:s(.*)<br>')
    'My image 1 '
    通过上面的例子,我们可以看到,直接调用 re 方法会提示没有 re 属性。但是这里首先调用了 xpath('.')选中全文,然后调用 re 和 re_first 方法,就可以进行正则匹配了。
  • 相关阅读:
    FJSC2020合集
    考试前注意事项
    CSP-S&&NOIP2020游记
    IOI2020集训队作业题单
    对拍程序
    Re:memset 赋值
    2019-12-29 Div.3模拟赛题解
    NOI2020 游记
    边三连通分量算法
    【题解】Code+7 教科书般的亵渎
  • 原文地址:https://www.cnblogs.com/angdh/p/13734791.html
Copyright © 2020-2023  润新知