获取网页
urllib
提取信息
正则表达式
lxml、XPath
Beautiful Soap(html、xml解析器)
保存数据
自动化程序
异常处理 错误重试
代理
Ref.
python3 网络爬虫开发实战 崔庆才
https://cuiqingcai.com/1052.html
urllib
正则表达式
lxml、XPath
Beautiful Soap(html、xml解析器)
异常处理 错误重试
python3 网络爬虫开发实战 崔庆才
https://cuiqingcai.com/1052.html