scrapyd 常用部署命令 & 远程监控 & 爬虫脚本

scrapyd 常用部署命令 & 远程监控 & 爬虫脚本

一. 部署&运行
deploy: 部署scrapy爬虫程序

# scrapyd-deploy 部署服务器名 -p 项目名称
scrapyd-deploy ubuntu -p douyu
run : 运行

#curl http://localhost:6800/schedule.json -d project=project_name -d spider=spider_name
curl http://127.0.0.1:6800/schedule.json -d project=douyu -d spider=dy
stop: 停止

#curl http://localhost:6800/cancel.json -d project=project_name -d job=jobid
curl http://127.0.0.1:6800/cancel.json -d project=douyu -d job=$1

二. 允许外部访问配置
定位配置文件： default_scrapyd.conf

find /home/wg -name default_scrapyd.conf

cd /home/wg/scrapy_env/lib/python3.6/site-packages/scrapyd
允许外部访问：

vim default_scrapyd.conf

bind_address = 0.0.0.0
三. 远程监控-url指令:
1、获取状态

http://127.0.0.1:6800/daemonstatus.json

2、获取项目列表

http://127.0.0.1:6800/listprojects.json

3、获取项目下已发布的爬虫列表

http://127.0.0.1:6800/listspiders.json?project=myproject

4、获取项目下已发布的爬虫版本列表

http://127.0.0.1:6800/listversions.json?project=myproject

5、获取爬虫运行状态

http://127.0.0.1:6800/listjobs.json?project=myproject

6、启动服务器上某一爬虫（必须是已发布到服务器的爬虫）

http://127.0.0.1:6800/schedule.json （post方式，data={"project":myproject,"spider":myspider}）

7、删除某一版本爬虫

http://127.0.0.1:6800/delversion.json

（post方式，data={"project":myproject,"version":myversion}）

8、删除某一工程，包括该工程下的各版本爬虫

http://127.0.0.1:6800/delproject.json（post方式，data={"project":myproject}）

四. 常用脚本
循环任务：

while true
do
curl http://127.0.0.1:6800/schedule.json -d project=FXH -d spider=five_sec_info
sleep 10
done

实时时间打印：

echo "$(date +%Y-%m-%d:%H:%M.%S), xx-spider定时启动--"

----------
相关阅读:
算法-排序之快速排序
 springMvc Velocity tool 源码分析
 无线端安全登录与鉴权二
 无线端安全登录与鉴权一之Kerberos
Android ListView OnItemLongClick和OnItemClick事件内部细节分享以及几个比较特别的属性
 dialog横竖屏切换时消失的解决方法
 你还在问android横竖屏切换的生命周期？
动态添加控件时，计算控件大小的解决方法
 想要生成一组三维的颜色渐变数据？
一个PHPer如何深入学习ES搜索引擎？
原文地址：https://www.cnblogs.com/zhaoguangzheng/p/10122694.html