• 第七篇:爬虫实战-


    破解极验滑动验证码

    一、介绍

       一些网站会在正常的账号密码认证之外加一些验证码,以此来明确地区分人/机行为,从一定程度上达到反爬的效果,对于简单的校验码Tesserocr就可以搞定,如下

        但一些网站加入了滑动验证码,最典型的要属于极验滑动认证了,极验官网:http://www.geetest.com/,下图是极验的登录界面

     现在极验验证码已经更新到了 3.0 版本,截至 2017 年 7 月全球已有十六万家企业正在使用极验,每天服务响应超过四亿次,广泛应用于直播视频、金融服务、电子商务、游戏娱乐、政府企业等各大类型网站

    对于这类验证,如果我们直接模拟表单请求,繁琐的认证参数与认证流程会让你蛋碎一地,我们可以用selenium驱动浏览器来解决这个问题,大致分为以下几个步骤

    复制代码
    #1、输入账号、密码,然后点击登陆
    #2、点击按钮,弹出没有缺口的图
    #3、针对没有缺口的图片进行截图
    #4、点击滑动按钮,弹出有缺口的图
    #5、针对有缺口的图片进行截图
    #6、对比两张图片,找出缺口,即滑动的位移
    #7、按照人的行为行为习惯,把总位移切成一段段小的位移
    #8、按照位移移动
    #9、完成登录
    复制代码

    二、实现

    复制代码
    安装:selenium+chrome/phantomjs
    
    #安装:Pillow
    Pillow:基于PIL,处理python 3.x的图形图像库.因为PIL只能处理到python 2.x,而这个模块能处理Python3.x,目前用它做图形的很多.
    http://www.cnblogs.com/apexchu/p/4231041.html
    
    C:UsersAdministrator>pip3 install pillow
    C:UsersAdministrator>python3
    Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32
    Type "help", "copyright", "credits" or "license" for more information.
    >>> from PIL import Image
    >>>
    复制代码
     View Code

    案例:

     破解博客园后台登录
     修订版

    用类封装的版本

     svcr
     使用类
  • 相关阅读:
    文件夹打开对话框
    文件打开对话框
    HOOK函数(二)——全局HOOK
    HOOK函数(一)——进程内HOOK
    抓包
    List 访问
    坑爹的EL 表达式。
    tomcat 虚拟目录的安全问题
    框架
    程序员相关词汇
  • 原文地址:https://www.cnblogs.com/mqhpy/p/11370767.html
Copyright © 2020-2023  润新知