先来看看下面2张图,都是某小说网站的小说内容
newspaper
python3.x安装: pip install newspaper3k
python2.7安装: pip install newspaper
简单的给大家说说它的功能:
首先是获取网页所有url的功能,我们以sina新闻为例子,写代码如下:
提取网页所有文本内容,这次我们随便找个新闻来试试!
最后
这是一个非常不错的库,适合用来写爬虫,如有不懂的地方我在评论区等着你,关注一下,与你共享更多有用的知识。大家加油!
参考来源:https://github.com/codelucas/newspaper