• python爬虫实践——破解登陆百度


     1 from selenium import webdriver
     2 from selenium.webdriver import ChromeOptions
     3 import time
     4 r'''
     5 步骤:
     6     1、打开文件的查看,显示隐藏文件
     7     2、找到C:UsersadministortraAppDataLocalGoogleChromeUser Data
     8         删除Default文件
     9     3、重新打开浏览器,并登陆百度账号
    10         - 此时会创建一个新的Default缓存文件
    11     4、添加cookies
    12     5、关闭谷歌浏览器后执行程序
    13 '''
    14 # 获取options对象,参数对象
    15 options = ChromeOptions()
    16 
    17 # 获取cookies保存路径
    18 # 'C:UsersadministortraAppDataLocalGoogleChromeUser Data'
    19 profile_directory = r'--user-data-dir=C:UsersadministortraAppDataLocalGoogleChromeUser Data'
    20 
    21 # 添加用户信息目录
    22 options.add_argument(profile_directory)
    23 
    24 # 把参数加载到当前驱动中  chrome_options默认参数,用来接收options对象
    25 driver = webdriver.Chrome(chrome_options=options)
    26 
    27 try:
    28     driver.implicitly_wait(10)
    29     driver.get('https://www.baidu.com/')
    30     '''
    31     BDUSS:*****
    32     '''
    33     # 添加用户cookies信息
    34     # name、value必须小写
    35     driver.add_cookie({"name": "BDUSS", "value": "用户session字符串"})
    36 
    37     # 刷新操作
    38     driver.refresh()
    39 
    40     time.sleep(10)
    41 
    42 finally:
    43     driver.close()
  • 相关阅读:
    学习源代码时的笨方法
    初步学习pg_control文件之十五
    初步学习pg_control文件之十四
    初步学习pg_control文件之十三
    fsync体会
    初步学习pg_control文件之十二
    初步学习pg_control文件之十一
    初步学习pg_control文件之十
    初步学习pg_control文件之九
    JS与原生OC/Swift相互调用总结
  • 原文地址:https://www.cnblogs.com/lweiser/p/11047861.html
Copyright © 2020-2023  润新知