scrapy基础知识之 parse()方法的工作机制思考：

1.因为使用的yield，而不是return。parse函数将会被当做一个生成器使用。scrapy会逐一获取parse方法中生成的结果，并判断该结果是一个什么样的类型；

2.如果是request则加入爬取队列，如果是item类型则使用pipeline处理，其他类型则返回错误信息。

3.scrapy取到第一部分的request不会立马就去发送这个request，只是把这个request放到队列里，然后接着从生成器里获取；

4.取尽第一部分的request，然后再获取第二部分的item，取到item了，就会放到对应的pipeline里处理；

5.parse()方法作为回调函数(callback)赋值给了Request，指定parse()方法来处理这些请求 scrapy.Request(url, callback=self.parse)

6.Request对象经过调度，执行生成 scrapy.http.response()的响应对象，并送回给parse()方法，直到调度器中没有Request（递归的思路）

7.取尽之后，parse()工作结束，引擎再根据队列和pipelines中的内容去执行相应的操作；

8.程序在取得各个页面的items前，会先处理完之前所有的request队列里的请求，然后再提取items。

9.这一切的一切，Scrapy引擎和调度器将负责到底。

相关阅读:
innodb的innodb_buffer_pool_size和MyISAM的key_buffer_size（转自：http://www.java123.net/898181.html）
mysql max_allowed_packet参数值改大后，莫名被还原
windows MySQL5.7.9免安装版配置方法
centos7.2启动级别
saltstack
Jmeter -- 参数化（函数助手和CSV数据文件配置）
Jmeter -- 上下文关联（JSON提取器）
LBS 基于位置的服务
uiautomatorviewer报错 Error taking device screenshot: EOF
python中加入中文注释报错处理

原文地址：https://www.cnblogs.com/huwei934/p/6970951.html