1、创建对象
Selector类的实现位于scrapy.selector模块,创建Selector对象的时候,可以将页面的Html文档字符串传递给Selector构造器方法
2、选中数据
调用Selector对象的xpath或者css方法(传入xpath或者css选择器表达式),可以选中文档中的某一部分
xpath和css方法返回的是一个SelectorList对象,其中包含每个被选中部分对应的Selector对象,SelectorList支持列表接口,可以使用for循环迭代访问其中的每一个Selector对象
3、提取信息
调用Selector或者SelectorList对象中的方法可以将选中的内容提取出来
extract
SelectorList对象的extract方法会把所有结果收集到一个列表返回给用户
re
利用正则表达式提取想要的内容
extract_first
返回第一个Selector对象调用extract方法的结果。通常SelectorList对象中只包含一个Selector对象的时候就会调用这个方法
re_first