• 知乎模拟登录 requests session


    Python 3.5

    # -*- coding: utf-8 -*-
    """
    Created on Wed May  3 16:26:55 2017
    
    @author: x-power
    """
    
    import requests
    import http.cookiejar as cookielib
    import re
    import time
    import os.path
    from PIL import Image
    
    
    
    # 构造 Request headers
    headers = {
        "Host": "www.zhihu.com",
        "Referer": "https://www.zhihu.com/",
        'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:53.0) Gecko/20100101 Firefox/53.0',
    }
    
    
    
    # 构造 cookie 信息
    session = requests.session()
    session.cookies = cookielib.LWPCookieJar(filename='cookies')
    try:
        session.cookies.load(ignore_discard=True) # 如果已经有 cookie信息的话 直接用于登录
    except:
        print("Cookie 未能加载")
    
    # 以后再用session 访问的时候 都带着 本地已经固定的cookie信息,代表都是一台机器发出的请求。
    
    
    def get_xsrf():
        '''_xsrf 是一个动态变化的参数'''
        index_url = 'https://www.zhihu.com'
        # 获取登录时需要用到的_xsrf
        index_page = session.get(index_url, headers=headers) 
        html = index_page.text
        pattern = r'name="_xsrf" value="(.*?)"'
        # 这里的_xsrf 返回的是一个list
        _xsrf = re.findall(pattern, html)
        return _xsrf[0]
    
    
    # 获取验证码
    def get_captcha():
        t = str(int(time.time() * 1000))
        captcha_url = 'https://www.zhihu.com/captcha.gif?r=' + t + "&type=login"
        r = session.get(captcha_url, headers=headers)
        with open('captcha.jpg', 'wb') as f:
            f.write(r.content)
            f.close()
        # 用pillow 的 Image 显示验证码
        # 如果没有安装 pillow 到源代码所在的目录去找到验证码然后手动输入
        try:
            im = Image.open('captcha.jpg')
            im.show()
            im.close()
        except:
            print(u'请到 %s 目录找到captcha.jpg 手动输入' % os.path.abspath('captcha.jpg'))
        captcha = input("please input the captcha
    >")
        return captcha
    
    
    def isLogin():
        # 通过查看用户个人信息来判断是否已经登录
        url = "https://www.zhihu.com/settings/profile"
        login_code = session.get(url, headers=headers, allow_redirects=False).status_code  #allow_redirects 不允许重定向
        if login_code == 200:
            return True
        else:
            return False
    
    
    def login(secret, account):
        _xsrf = get_xsrf()
        headers["X-Xsrftoken"] = _xsrf
        headers["X-Requested-With"] = "XMLHttpRequest"
        # 通过输入的用户名判断是否是手机号
        if re.match(r"^1d{10}$", account):
            print("手机号登录 
    ")
            post_url = 'https://www.zhihu.com/login/phone_num'
            postdata = {
                '_xsrf': _xsrf,
                'password': secret,
                'phone_num': account
            }
        else:
            if "@" in account:
                print("邮箱登录 
    ")
            else:
                print("你的账号输入有问题,请重新登录")
                return 0
            post_url = 'https://www.zhihu.com/login/email'
            postdata = {
                '_xsrf': _xsrf,
                'password': secret,
                'email': account
            }
        # 不需要验证码直接登录成功
        login_page = session.post(post_url, data=postdata, headers=headers)
        login_code = login_page.json()
        if login_code['r'] == 1:
            # 不输入验证码登录失败
            # 使用需要输入验证码的方式登录
            postdata["captcha"] = get_captcha()
            login_page = session.post(post_url, data=postdata, headers=headers)
            login_code = login_page.json()
            print(login_code['msg'])
        # 保存 cookies 到文件,
        # 下次可以使用 cookie 直接登录,不需要输入账号和密码
        session.cookies.save()
    
    
    
    
    if __name__ == '__main__':
        if isLogin():
            print('您已经登录')
        else:
            account = input('请输入你的用户名
    >  ')
            secret = input("请输入你的密码
    >  ")
    login(secret, account)
  • 相关阅读:
    调用Android中的软键盘
    EditText图文混排
    android开源框架
    Android 菜单(OptionMenu)
    onRetainNonConfigurationInstance和getLastNonConfigurationInstance
    Android HttpClient基本使用方法
    Eclipse中文注释乱码解决
    mysql怎么定义外键
    javaproject积累——java 反射 invoke
    Floodlight 启动过程分析
  • 原文地址:https://www.cnblogs.com/A-FM/p/6802535.html
Copyright © 2020-2023  润新知