• 吴requests类库 作业总结


    1,在用get方法时,可在网址后加一个问号?表示传递参数

    例:repose=requests.get('http;//httpbin.org/get?name=germey&age=22')

    2 ,也可在get中设置params参数(要求后面添加的参数为字典的形式)

    例:repose=requests.get('http;//httpbin.org/getparams={'name':'germy','age'=22}

    3  ,在获取源代码得到的是杂乱无章的时候,可用josn,即名字.json或json.loads(名字.text)

    4,用get方式获取图片时,如果直接用名字.text输出网页源代码时,得到的是乱码,要获取图片则要获取图片的二进制代码,可以用名字.content

    (如何把网页上的图片爬取下来?在get网址后,用with open(‘新建一个文件名.图片后缀’,‘wb’)as**:      再用**.write(获取图片二进制源码的方式)

    5,在爬取网页数据时,如若不被允许,可以仿造浏览器来爬取

    6,请求要有请求头,有了请求头会更像是浏览器在访问数据,找到网页中F12的请求头代码,,创建一个变量,使得变量={‘请求头名’:‘请求头代码’}

    7,在get获得网页时get(‘网址’,变量名=变量名)

    8,状态码判断:在访问网络不成功时,可用exit()if not 名字.status_code==200

                                  else print(‘Request Successful’)表示如果状态码为200访问不成功时,则退出,否则则输出Request Successful

    9,如何把一个图片上传到网络?

    设置一个变量为files,files={‘files’:open(‘图片名’,‘rb’)}

    value值为操作系统open接口类型(上传文件,图片均用post)

    名字=request.post(‘网址’,files=files)

    10,访问网站出现不安全提示时,可用package下urllib3类库下的警告类库-------urllib3.disable_warnings()再用get访问(‘网址’,verify=False)

    其中verify=False是指不要出现验证方式

    11,访问超时的设置,可以设置访问时间超过多久就退出,用requests类库中Exception类,再导入Timeout

    名字=requests.get(‘网址’,timeout=1)访问该网址超过1秒就停止,输出状态码

  • 相关阅读:
    2.7连接数据库中遇见的相应问题1
    linux bash中too many arguments问题的解决方法
    linux系统补丁更新 yum命令
    安装node,linux升级gcc
    python-导出Jenkins任务
    升级openssl和openssh版本
    linux修改文件所属的用户组以及用户
    linux的Umask 为022 和027 都是什么意思?
    keepalived
    自己编写k8s
  • 原文地址:https://www.cnblogs.com/ZHONGmy/p/9773727.html
Copyright © 2020-2023  润新知