1.All IT eBooks多线程-写在前面
对一个爬虫爱好者来说,或多或少都有这么一点点的收集癖
~ 发现好的图片,发现好的书籍,发现各种能存放在电脑上的东西,都喜欢把它批量的爬取下来。 然后放着,是的,就这么放着…然后慢慢的遗忘掉…
All IT eBooks多线程-爬虫分析
打开网址 http://www.allitebooks.com/
发现特别清晰的小页面,一看就好爬
在点击一本图书进入,发现下载的小链接也很明显的展示在了我们面前,小激动一把,这么清晰无广告的网站不多见了。
All IT eBooks多线程-撸代码
这次我采用了一个新的模块 requests-html
这个模块的作者之前开发了一款 requests
,