• python:requests模块


    requests模块是我在学习爬虫时学到的一个模块,它的api比较简单好用,这里简介下使用方法。

    其实这个很好使用,几行代码就可以获取一个网页的内容:

    import requests
    
    url = 'http://www.juzimi.com/ju/252304'
    
    response = requests.get(url)
    
    print (response.text)

    它支持很多http请求类型:getpostputdeleteheadoptions

    其中获取的响应内容有2中显示方法

    .content  以字节的方式显示,中文显示为字符

    .text     以文本的方式显示,放两张图就能明白了

    这是content

     

    这是text

     

    Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。

    可以通过.encoding 查看requests使用了什么编码

    也可以手动改变其使用的编码r.encoding= ‘gbk2312’

    Get请求可以传递参数

    import requests
    
    url = 'http://www.juzimi.com/article/33125'
    
    payload = {'page':'1'}
    
    response = requests.get(url,params=payload)
    
    print (response.text)

    可以打印.url,查看构造后的url

     

    定制请求头部

    传一个dictheads参数

    headers = {'user-agent': 'my-app/0.0.1'}

    r = requests.get(url, headers=headers)

    发送post请求

    payload = {'key1': 'value1', 'key2': 'value2'}

    r = requests.post("http://httpbin.org/post", data=payload)

    get方法还有一个cookies参数

    timeout参数

    访问代理

    proxies = {
    
               "http": "http://10.10.10.10:8888",
    
               "https": "http://10.10.10.100:4444",
    
              }
    
    r = requests.get('http://m.ctrip.com', proxies=proxies)

     

  • 相关阅读:
    2019长安大学ACM校赛网络同步赛 J Binary Number(组合数学+贪心)
    棋盘问题
    DP待整理
    Monkey and Banana(DP)
    Ignatius and the Princess IV
    【[kuangbin带你飞]专题十二 基础DP1】Max Sum Plus Plus(DP+滚动数组)
    第三届山东ACM Pick apples
    第三届山东省ACM The Best Seat in ACM Contest
    第三届山东ACM省赛 Pixel density
    第三届山东ACM省赛 n a^o7 !
  • 原文地址:https://www.cnblogs.com/GH-D/p/8306649.html
Copyright © 2020-2023  润新知