scrapy持久化存储

基于终端指令：

要求：只可以将parse方法的返回值存储到本地的文本文件中

注意：持久批存储对应的文本文件类型只可以为：('csv', 'pickle', 'json', 'xml', 'jl', 'jsonlines', 'marshal')

指令：scrapy crawl xxx -o filePath

好处：简洁高效便捷

缺点：局限性比较强（数据只可以存储到指定后缀的文本文件中）

基于管道：

编码流程：

好处：

面试题：将爬取到的数据一份存储到本地一份存储到数据库，如何实现

相关阅读:
并发编程
网络与WEB 编程
包和模块
元编程
类和对象
【算法题 14 LeetCode 147 链表的插入排序】
剑指offer面试54题
剑指offer 面试51题
剑指offer 面试3题
剑指offer 面试52题

原文地址：https://www.cnblogs.com/nanjo4373977/p/12986396.html