一、环境配置
1. 下载安装 python3 .(或者安装 Anaconda)
2. 安装requests和lxml
进入到 pip 目录,CMD --> C:PythonScripts,输入命令:
- pip install requests
- pip install lxml
3. 安装自己喜欢的编辑器
我用的是 python 3.7 + PyCharm 2018版
二、轻松爬取百度网页。
(1)输入代码:
(2)输出结果:
(3)其实只需四行代码,我们就可以把百度首页的内容爬取下来:
- 导入requests库
- 下载百度首页内容
- 更改编码方式
- 打印内容