通过正则表达式作为规则,筛检白名单和黑名单以控制访问网页路径,不断自动访问符合条件的网址。可附带下载资源文件。
此程序适合挂机伪装普通用户、挂机博客互踩、挂机论坛下载图片、附件等应用。
使用方法:
首先建立白名单访问规则,比如我们要爬CnBeta的网页,就这样设置,然后点击“在页面中验证”按钮测试符合规则的链接:
然后,如果我们不希望重复爬到编辑推荐的内容的话,就在黑名单中这样设置并验证:
然后点击“开始获取”,程序就开始自动爬了。
其他设置自行尝试吧,都比较简单了。
通过正则表达式作为规则,筛检白名单和黑名单以控制访问网页路径,不断自动访问符合条件的网址。可附带下载资源文件。
此程序适合挂机伪装普通用户、挂机博客互踩、挂机论坛下载图片、附件等应用。
使用方法:
首先建立白名单访问规则,比如我们要爬CnBeta的网页,就这样设置,然后点击“在页面中验证”按钮测试符合规则的链接:
然后,如果我们不希望重复爬到编辑推荐的内容的话,就在黑名单中这样设置并验证:
然后点击“开始获取”,程序就开始自动爬了。
其他设置自行尝试吧,都比较简单了。
转载请遵循此协议:署名 - 非商业用途 - 保持一致
并保留此链接:http://skyd.cnblogs.com/