scrapy-redis 0.6.8 配置信息

很多博客的db参数配置都不能用，所以记录一下该版本可用的配置

#启用Redis调度存储请求队列
SCHEDULER = "scrapy_redis.scheduler.Scheduler"
#确保所有的爬虫通过Redis去重
DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
#使用优先级调度请求队列 （默认使用）
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.PriorityQueue'
#具体参数
REDIS_PARAMS = {
    'host': '39.107.253.135',
    'port':'63790',
    'password': '7890',
    'db': 0
}

将url放入redis

from redis import Redis

red = Redis(host='39.107.253.135', port=63790, password='7890', db='8')

for page in range(1, 23, 1):
    p = (page-1)*12
    url = 'https://maoyan.com/cinemas?offset=' + str(p)
    red.lpush('maoyan:start_urls', url)

在爬虫页面

from scrapy_redis.spiders import RedisSpider

class MySpider(RedisSpider):
    name = 'my'
    redis_key = 'maoyan:start_urls'

相关阅读:
VirtualBox 给虚拟机绑定IP
【转】 wget 命令用法详解
[转]python -m SimpleHTTPServer
longene QQ 安装目录
查看mininet交换机中的流表
aircrack-ng 字典破解WPA / WPA2
Win7 64 安装Visual Studio 2010和SQL Server 2008 R2
Floodlight 防火墙是如何起作用的
小米2000万买域名mi.com
Windows JDK环境变量的配置

原文地址：https://www.cnblogs.com/vinic-xxm/p/11753441.html