python爬虫实践——破解登陆百度

 1 from selenium import webdriver
 2 from selenium.webdriver import ChromeOptions
 3 import time
 4 r'''
 5 步骤:
 6     1、打开文件的查看，显示隐藏文件
 7     2、找到C:UsersadministortraAppDataLocalGoogleChromeUser Data
 8         删除Default文件
 9     3、重新打开浏览器，并登陆百度账号
10         - 此时会创建一个新的Default缓存文件
11     4、添加cookies
12     5、关闭谷歌浏览器后执行程序
13 '''
14 # 获取options对象，参数对象
15 options = ChromeOptions()
16 
17 # 获取cookies保存路径
18 # 'C:UsersadministortraAppDataLocalGoogleChromeUser Data'
19 profile_directory = r'--user-data-dir=C:UsersadministortraAppDataLocalGoogleChromeUser Data'
20 
21 # 添加用户信息目录
22 options.add_argument(profile_directory)
23 
24 # 把参数加载到当前驱动中  chrome_options默认参数，用来接收options对象
25 driver = webdriver.Chrome(chrome_options=options)
26 
27 try:
28     driver.implicitly_wait(10)
29     driver.get('https://www.baidu.com/')
30     '''
31     BDUSS:*****
32     '''
33     # 添加用户cookies信息
34     # name、value必须小写
35     driver.add_cookie({"name": "BDUSS", "value": "用户session字符串"})
36 
37     # 刷新操作
38     driver.refresh()
39 
40     time.sleep(10)
41 
42 finally:
43     driver.close()

相关阅读:
学习源代码时的笨方法
初步学习pg_control文件之十五
初步学习pg_control文件之十四
初步学习pg_control文件之十三
fsync体会
初步学习pg_control文件之十二
初步学习pg_control文件之十一
初步学习pg_control文件之十
初步学习pg_control文件之九
JS与原生OC/Swift相互调用总结

原文地址：https://www.cnblogs.com/lweiser/p/11047861.html