• python爬虫准备知识---2、为什么选择python来进行爬虫


    python爬虫准备知识---2、为什么选择python来进行爬虫

    一、总结

    一句话总结:

    c和c++运行效率很高,但是学习和开发成本很大;java的语言代码量很大,一个爬虫程序会随着网址及内容的改变而需要重构,重构时需要花费很多的成本;php并发处理能力弱,速度和效率都达不到爬虫的要求。

    1、什么是Urllib?

    Urllib是Python内置的HTTP请求库,可以用来做爬虫,但是requests更好用

    urlib.request  请求模块
    urlib.error   异常处理模块
    urllib.parse   url解析模块
    urlib.robotparser   robots.txt解析模块

    2、response headers和request headers分别是做什么的?

    request headers是浏览器告诉服务器,我传过来的数据是什么样,你要怎么解析
    response headers是服务器传回来的response的信息

    3、with open(...) as ...?

    但由于文件读写时都可能产生IOError,为了保证无论是否出错都能正确地关闭文件,我们用try...finally来实现:python 简化了改写法,即用 with open(...) as...;

    二、内容在总结中

    博客对应课程的视频位置:

     
    我的旨在学过的东西不再忘记(主要使用艾宾浩斯遗忘曲线算法及其它智能学习复习算法)的偏公益性质的完全免费的编程视频学习网站: fanrenyi.com;有各种前端、后端、算法、大数据、人工智能等课程。
    博主25岁,前端后端算法大数据人工智能都有兴趣。
    大家有啥都可以加博主联系方式(qq404006308,微信fan404006308)互相交流。工作、生活、心境,可以互相启迪。
    聊技术,交朋友,修心境,qq404006308,微信fan404006308
    26岁,真心找女朋友,非诚勿扰,微信fan404006308,qq404006308
    人工智能群:939687837

    作者相关推荐

  • 相关阅读:
    JavaScript你所不知道的困惑(3)
    Android的代码都得自己一个个敲一遍吗?
    现代化农业在美国的兴起与发展
    高内聚与低耦合实现小记
    iOS 载入图片选择imageNamed 方法还是 imageWithContentsOfFile?
    swift笔记——环境搭建及Hello,Swift!
    HDU 4832(DP+计数问题)
    [TJOI2019]甲苯先生的线段树
    2019-8-31-C#-如何写-DEBUG-输出
    2019-8-31-C#-如何写-DEBUG-输出
  • 原文地址:https://www.cnblogs.com/Renyi-Fan/p/13277347.html
Copyright © 2020-2023  润新知