python-爬虫scrapy框架安装及基本使用

今日内容

# scrapy

scrapy startproject 项目名 #创建项目
scrapy genspider 文件名 baidu.com #创建爬虫

#运行
scrapy crawl 文件名

scrapy crawl 文件名 --nolog #运行命令 ---nolog就是不在控制台打印日志

#注意事项：
--nolog：不打印日志，同样如果抛出异常，也不会打印异常

#五大核心组件
1.引擎组件：整个框架的调度者，负责各个组件之间的通信与数据的传递
2.爬虫组件：定义爬取行为和解析规则
3.调度器组件：负责调度所有请求
4.下载器：负责爬取页面
5.管道：负责数据持久化

从小白到大神的蜕变~~

相关阅读:
C#缓存
js 日期相减
无法加载图片信息处理
一些经营性的文章,写得不蛮不错
集线器、交换机、路由器的区别
存储过程使用建议
存储过程优点和缺点
杀人游戏规则介绍（1.0～5.0版本）
C#网络编程(1) 来源出网络的资源收集
谈谈外包软件项目的经验

原文地址：https://www.cnblogs.com/tjw-bk/p/13752072.html