• 163music 反爬分析


    # 网易163 音乐的  mp3下载

    view-source:https://music.163.com/#/playlist?id=924680166 这个是网页源代码 链接, 中间的#拿不到具体的数据,所以获取页面的时候,要去除#
    http://music.163.com/song/media/outer/url?id=374621.mp3 下载的一个API吧
    封 IP 的一种报错
    网易云就给我返回了一个{"code":-460,"msg":"Cheating"}  考虑IP代理
    
    1.通过网页的请求头
    User-Agent: 这个是保存用户访问该网站的浏览器的信息,我上面这个表示的是我通过window的浏览器来访问这个网站的,如果你是用python来直接请求这个网站的时候,这个的信息会带有
            python的字眼,所以网站管理员可以通过这个来进行反爬虫。 Referer: 当浏览器发送请求时,一般都会带上这个,这个可以让网站管理者知道我是通过哪个链接访问到这个网站的,上面就说明我是从网易云音乐的主页来访问到这个页面的,若你是用
          python来直接请求是,就没有访问来源,那么管理者就轻而易举地判断你是机器在操作。 authorization: 有的网站还会有这个请求头,这个是在用户在访问该网站的时候就会分配一个id给用户,然后在后台验证该id有没有访问权限从而来进行发爬虫
    2 使用代理ip
  • 相关阅读:
    C语言面试题分类->宏定义
    c语言位运算
    C语言一个程序的存储空间
    收藏的链接-English
    侧滑关闭Activity的解决方案——SwipeBackLayout
    实现ViewPager的联动效果
    由Toolbar造成的ListView最后一项显示不全
    收藏的链接-Stub
    收藏的链接-Git
    收藏的链接
  • 原文地址:https://www.cnblogs.com/zhangchen-sx/p/11006939.html
Copyright © 2020-2023  润新知