• python浏览器伪装


    https://www.jb51.net/article/139587.htm

    python爬虫浏览器伪装

    1.

    #导入urllib.request模块
    import urllib.request
    #设置请求头
    headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0")
    #创建一个opener
    opener=urllib.request.build_opener()
    #将headers添加到opener中
    opener.addheaders=[headers]
    #将opener安装为全局
    urllib.request.install_opener(opener)
    #用urlopen打开网页
    data=urllib.request.urlopen(url).read().decode('utf-8','ignore')

    2.

    #定义代理ip
    proxy_addr="122.241.72.191:808"
    #设置代理
    proxy=urllib.request.ProxyHandle({'http':proxy_addr})
    #创建一个opener
    opener=urllib.request.build_opener(proxy,urllib.request.HTTPHandle)
    #将opener安装为全局
    urllib.request.install_opener(opener)
    #用urlopen打开网页
    data=urllib.request.urlopen(url).read().decode('utf-8','ignore')
     
     
    3.
    #定义代理ip
    proxy_addr="122.241.72.191:808"
    #创建一个请求
    req=urllib.request.Request(url)
    #添加headers
    req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)
    #设置代理
    proxy=urllib.request.ProxyHandle("http":proxy_addr)
    #创建一个opener
    opener=urllib.request.build_opener(proxy,urllib.request.HTTPHandle)
    #将opener安装为全局
    urllib.request.install_opener(opener)
    #用urlopen打开网页
    data=urllib.request.urlopen(req).read().decode('utf-8','ignore')
  • 相关阅读:
    mysql一些基本操作
    redis的简单使用2
    redis的基本conf
    redis的简单使用
    $.ajax()方法详解(转)
    流行的9个Java框架介绍: 优点、缺点等等
    数据库查询,显示为树形结构(easyui+SSM)
    JAVA-汉字转换成汉语拼音(pinyin4j-2.5.0-sources.jar)
    Jquery EasyUI 中ValidateBox验证框使用讲解(转)
    EasyUI验证扩展
  • 原文地址:https://www.cnblogs.com/tao-yuan/p/10409459.html
Copyright © 2020-2023  润新知