python爬虫准备知识---2、为什么选择python来进行爬虫

python爬虫准备知识---2、为什么选择python来进行爬虫

python爬虫准备知识---2、为什么选择python来进行爬虫

一、总结

一句话总结：

c和c++运行效率很高，但是学习和开发成本很大；java的语言代码量很大，一个爬虫程序会随着网址及内容的改变而需要重构，重构时需要花费很多的成本；php并发处理能力弱，速度和效率都达不到爬虫的要求。

1、什么是Urllib？

Urllib是Python内置的HTTP请求库，可以用来做爬虫，但是requests更好用

urlib.request 请求模块
urlib.error   异常处理模块
urllib.parse   url解析模块
urlib.robotparser   robots.txt解析模块

2、response headers和request headers分别是做什么的？

request headers是浏览器告诉服务器，我传过来的数据是什么样，你要怎么解析

response headers是服务器传回来的response的信息

3、with open(...) as ...？

但由于文件读写时都可能产生IOError，为了保证无论是否出错都能正确地关闭文件，我们用try...finally来实现：python 简化了改写法，即用 with open(...) as...；

二、内容在总结中

博客对应课程的视频位置：

我的旨在学过的东西不再忘记（主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法）的偏公益性质的完全免费的编程视频学习网站： fanrenyi.com；有各种前端、后端、算法、大数据、人工智能等课程。

版权申明：欢迎转载，但请注明出处
一些博文中有一些参考内容因时间久远找不到来源了没有注明，如果侵权请联系我删除。

博主25岁，前端后端算法大数据人工智能都有兴趣。

大家有啥都可以加博主联系方式（qq404006308，微信fan404006308）互相交流。工作、生活、心境，可以互相启迪。

聊技术，交朋友，修心境，qq404006308，微信fan404006308

26岁，真心找女朋友，非诚勿扰，微信fan404006308，qq404006308

人工智能群：939687837

作者相关推荐

感悟总结

其它重要感悟总结

感悟总结200813 最近心境200830 最近心境201019 201218-210205
相关阅读:
Qt画笔实现折线图
 Qt动态布局
 ffmpeg录制流媒体，正常方式停止录制
 解决libvlc_media_player_stop时死锁的方法
 Ubuntu 16 修改时区！
qt窗口最小化之后无法打开
 Qt 之去除窗口部件被选中后的焦点虚线框
 WINDOWS中, 如何查看一个运行中的程序是64位还是32位的
 DHTMLX学习总结
 mui plus.uploader.createUpload 上传文件服务端获取文件名中文乱码问题
原文地址：https://www.cnblogs.com/Renyi-Fan/p/13277347.html

python爬虫准备知识---2、为什么选择python来进行爬虫

python爬虫准备知识---2、为什么选择python来进行爬虫

一、总结

一句话总结：

c和c++运行效率很高，但是学习和开发成本很大；java的语言代码量很大，一个爬虫程序会随着网址及内容的改变而需要重构，重构时需要花费很多的成本；php并发处理能力弱，速度和效率都达不到爬虫的要求。

1、什么是Urllib？

Urllib是Python内置的HTTP请求库，可以用来做爬虫，但是requests更好用

2、response headers和request headers分别是做什么的？

request headers是浏览器告诉服务器，我传过来的数据是什么样，你要怎么解析

response headers是服务器传回来的response的信息

3、with open(...) as ...？

但由于文件读写时都可能产生IOError，为了保证无论是否出错都能正确地关闭文件，我们用try...finally来实现：python 简化了改写法，即用 with open(...) as...；

二、内容在总结中

作者相关推荐