• scrapy 6023 telnet查看爬虫引擎相关状态


    Telnet终端(Telnet Console)

    Scrapy提供了内置的telnet终端,以供检查,控制Scrapy运行的进程。 telnet仅仅是一个运行在Scrapy进程中的普通python终端。因此您可以在其中做任何事。

    telnet终端是一个 自带的Scrapy扩展 。 该扩展默认为启用,不过您也可以关闭。 关于扩展的更多内容请参考 Telnet console 扩展

    如何访问telnet终端

    telnet终端监听设置中定义的 TELNETCONSOLE_PORT ,默认为 6023 。 访问telnet请输入:

    telnet localhost 6023
    >>>
    

    Windows及大多数Linux发行版都自带了所需的telnet程序。

    telnet终端中可用的变量

    telnet仅仅是一个运行在Scrapy进程中的普通python终端。因此您可以做任何事情,甚至是导入新终端。

    telnet为了方便提供了一些默认定义的变量:

    快捷名称描述
    crawler Scrapy Crawler (scrapy.crawler.Crawler 对象)
    engine Crawler.engine属性
    spider 当前激活的爬虫(spider)
    slot the engine slot
    extensions 扩展管理器(manager) (Crawler.extensions属性)
    stats 状态收集器 (Crawler.stats属性)
    settings Scrapy设置(setting)对象 (Crawler.settings属性)
    est 打印引擎状态的报告
    prefs 针对内存调试 (参考 调试内存溢出)
    p pprint.pprint 函数的简写
    hpy 针对内存调试 (参考 调试内存溢出)

    Telnet console usage examples

    下面是使用telnet终端的一些例子:

    查看引擎状态

    在终端中您可以使用Scrapy引擎的 est() 方法来快速查看状态:

    telnet localhost 6023
    >>> est()
    Execution engine status
    
    time()-engine.start_time                        : 8.62972998619
    engine.has_capacity()                           : False
    len(engine.downloader.active)                   : 16
    engine.scraper.is_idle()                        : False
    engine.spider.name                              : followall
    engine.spider_is_idle(engine.spider)            : False
    engine.slot.closing                             : False
    len(engine.slot.inprogress)                     : 16
    len(engine.slot.scheduler.dqs or [])            : 0
    len(engine.slot.scheduler.mqs)                  : 92
    len(engine.scraper.slot.queue)                  : 0
    len(engine.scraper.slot.active)                 : 0
    engine.scraper.slot.active_size                 : 0
    engine.scraper.slot.itemproc_size               : 0
    engine.scraper.slot.needs_backout()             : False
    

    暂停,恢复和停止Scrapy引擎

    暂停:

    telnet localhost 6023
    >>> engine.pause()
    >>>
    

    恢复:

    telnet localhost 6023
    >>> engine.unpause()
    >>>
    

    停止:

    telnet localhost 6023
    >>> engine.stop()
    Connection closed by foreign host.
    

    Telnet终端信号

    scrapy.telnet.update_telnet_vars(telnet_vars)

    在telnet终端开启前发送该信号。您可以挂载(hook up)该信号来添加,移除或更新 telnet本地命名空间可用的变量。 您可以通过在您的处理函数(handler)中更新 telnet_vars 字典来实现该修改。

    参数: telnet_vars (dict) – telnet变量的字典

    Telnet设定

    以下是终端的一些设定:

    TELNETCONSOLE_PORT

    Default: [6023, 6073]

    telnet终端使用的端口范围。如果设为 None0 , 则动态分配端口。

    TELNETCONSOLE_HOST

    默认: '127.0.0.1'

    telnet终端监听的接口(interface)。

  • 相关阅读:
    vivado工程移植
    Search Everything 多项查找
    RTL_代码覆盖率
    在ARTIX-7上实现摄像头视频通路
    转:自动生成testbench
    转:winedt中显示中文
    Zynq和microblaze的区别
    转:找不到include xgpio.h;Unresolved include xgpio.h
    DHTMLX 常用技术
    Ubuntu中安装 mercurial – TortoiseHG
  • 原文地址:https://www.cnblogs.com/bonelee/p/9258453.html
Copyright © 2020-2023  润新知