关于pipeline持久化

将糗事百科主页的段子标题和作者数据爬取下来，然后进行持久化存储流程：
    1.爬虫文件爬取到数据后，需要将数据封装到items对象中。
    2.使用yield关键字将items对象提交给pipelines管道进行持久化操作。
    3.在管道文件中的process_item方法中接收爬虫文件提交过来的item对象，然后编写持久化存储的代码将item对象中存储的数据进行持久化存储
    4.settings.py配置文件中开启管道。
　　5.注：可能出错的地方
 
　　- 爬虫文件：qiubai.py
　   　 
 　　　 
 　　- items文件：items.py
 　　

　- pipelines.py
　　 　　- settings.py
　　　
 　- 如果在执行的过程中出现这种错误：
　　

　　这种情况就是该网站坐了反爬，解决办法就是修改headers头，下面我们就通过修改中间件来修改headers。　　- middlewares.py
　　　在该py文件中加入这个类
　　　　-settings.py
　　　

相关阅读:
java 面向对象（十八）：包装类的使用
java 面向对象（十七）：单元测试方法
rxjava2学习
多线程-wait(),notify(),notifyAll()
多线程-Thread.join()的运用
66. Plus One
理解Android View的事件传递机制
78. Subsets
程序员学习与成长的方法(转发)
android查询天气demo,基于mvp+kotlin+rxjava2+retrofit2

原文地址：https://www.cnblogs.com/Utopia-Clint/p/10764963.html