Python爬虫〇一———爬虫入门

爬虫定义

爬虫是一段代码，用来模仿浏览器访问网站的过程，可以从服务器上获取数据。

按照常规的分类，爬虫可以分为下面几种

门户网站可以通过制定相应的策略或技术手段，防止爬虫程序

爬虫程序可以通过制定相关的策略或技术手段，啪姐门户网站中的反爬机制，从而获取数据

robots.txt是一个君子协议，用来规定网站中哪些数据可以被爬取哪些不可以。我们可以看一下淘宝的这个链接

但是这是个防君子不防小人的协议，并没有从实际的技术上做到反爬。

requests模块是python原生的一款基于网络请求的模块，功能强大，使用方便。使用的流程

相关阅读:
2017-2018-1 20155304 20155332 实验二固件程序设计
《信息安全技术》实验二口令破解
2017-2018-1 20155304 《信息安全系统设计基础》第六周学习总结
2017-2018-1 20155304 20155310 20155337 实验一开发环境的熟悉
2017-2018-1 20155304 《信息安全系统设计基础》第五周学习总结
第五周加分题-mybash的实现
2017-2018-1 20155304 《信息安全系统设计基础》第四周学习总结
2017-2018-1 20155304 《信息安全系统设计基础》第三周学习总结
课下作业2
课下作业1

原文地址：https://www.cnblogs.com/yinsedeyinse/p/13762964.html