python3使用newspaper快速抓取任何新闻文章正文

newspaper用于爬取各式各样的新闻网站

1，安装newspaper

pip install newspaper3k

2,直接上代码

from newspaper import Article


url = '你想要爬取的网站url'
news = Article(url, language='zh')

news .download()  #先下载
news .parse()    #再解析

print(news.text) #新闻正文
print(news.title) #新闻标题
print(news.html)   #未修改的原始HTML
print(news.authors)  #新闻作者
print(news.top_image) #本文的“最佳图像”的URL
print(news.movies)  #本文电影url
print(news.keywords) #新闻关键词
print(news.summary)   #从文章主体txt中生成的摘要
print(news.images) #本文中的所有图像url

相关阅读:
前端布局定位
CSS优化
CSS工程化
CSS过渡，动画，2D，3D转换
CSS,盒子和美化技巧
HTMl
定位和布局
CSS选择器
八. 实时更新插件 livereload
七. 浏览器插件 View in Browser

原文地址：https://www.cnblogs.com/lvye001/p/9832258.html