scrapy 在spider中处理超时

之前处理超时异常时都在downloadmiddleware中处理，但是总感觉很费劲

今天查文档发现可在errback回调中处理

from scrapy.spidermiddlewares.httperror import HttpError
from twisted.internet.error import DNSLookupError
from twisted.internet.error import TimeoutError, TCPTimedOutError


yield scrapy.Request(url=full_url, errback=self.error_httpbin, dont_filter=True, callback=self.parse_list, meta={"hd": header})


def error_httpbin(self, failure):
        # failure.request 就是Request对象，如果需要重试，直接yield即可
        # if failure.check(HttpError):
        # these exceptions come from HttpError spider middleware
        # you can get the non-200 response
        # response = failure.value.response
        # self.logger.error('HttpError on %s', response.url)

        if failure.check(DNSLookupError):
            print("DNSLookupError------->")
            # this is the original request
            request = failure.request
            yield request
            # self.logger.error('DNSLookupError on %s', request.url)
        elif failure.check(TimeoutError, TCPTimedOutError):
            print("timeout------->")
            request = failure.request
            yield request
            # self.logger.error('TimeoutError on %s', request.url)

　　特此记录下，之前没有用这种方式处理超时异常

相关阅读:
Unity3D脚本使用：物体调用物体
Unity3D脚本使用：游戏对象访问
Unity3D 浏览工具
spring的工厂方法
spring运用的设计模式
Jquery ajax 与 lazyload的混合使用（实现图片异步加载）
关于线程安全的一点总结
lazyload的使用心得
ajax原理及应用
$.ajax和$.load的区别

原文地址：https://www.cnblogs.com/fly-kaka/p/15181571.html