• 爬虫之selenium和webdriver—基础(四):操作cookie和显式等待与隐式等待


    一、操作cookie

     1 from selenium import webdriver
     2 
     3 driver_path = 'D:chromedriverchromedriver.exe'
     4 driver = webdriver.Chrome(executable_path=driver_path)
     5 driver.get('https://www.baidu.com')
     6 
     7 # 1、获取所有的cookie,get_cookies; 获取一个cookie,get_cookie
     8 for cookie in driver.get_cookies():
     9     print(cookie)
    10     
    11 # 2、根据cookie的key获取value
    12 print(driver.get_cookie('PSTM'))
    13 
    14 # 3、删除所有的cookie
    15 driver.delete_all_cookies()
    16 
    17 # 4、删除某个cookie
    18 driver.delete_cookie('PSTM')

    二、显式等待和隐式等待

    访问采用Ajax技术的页面的时候,程序不能确定某个元素何时能完全加载出来,如果实际页面等待时间过长导致某个元素还没出来,但是程序直接使用了这个webElement,那么就会抛出NullPointer的异常。为了解决这个问题,所以selenium 提供了两种等待方式:显式等待和隐式等待

    1、隐式等待:调用driver.implicity_wait。在获取不可用元素之前,会先等待10s(预设)。

    1 from selenium import webdriver
    2 
    3 driver_path = 'D:chromedriverchromedriver.exe'
    4 driver = webdriver.Chrome(executable_path=driver_path)
    5 driver.get('https://www.baidu.com')
    6 
    7 driver.implicitly_wait(10)  #隐式等待,预设等待时间为10s
    8 driver.find_element_by_id('dsfew') #如果10s后还没有获取到dsfew这个id,那么久抛出异常

    2、显式等待:显式等待是表明某个条件成立后才知晓获取元素的操作。也可以在等待的时候指定一个最大的时间,如果超过这个时间那么抛出一个异常。显示等待应该使用selenium.webdriver.support.exceptes_conditions期望的条件和selenium.webdriver.support.ui.WebDriverWait来配合完成。

     1 from selenium import webdriver
     2 from selenium.webdriver.support.ui import WebDriverWait
     3 from selenium.webdriver.support import expected_conditions as EC
     4 from selenium.webdriver.common.by import By
     5 
     6 driver_path = 'D:chromedriverchromedriver.exe'
     7 driver = webdriver.Chrome(executable_path=driver_path)
     8 driver.get('https://www.baidu.com')
     9 
    10 # 最大等待时间为10s,如果5s时id为sdfsdf被找到,就直接返回,不会等待10s。如果10s后还没找到,就抛出异常
    11 #until里面是期待的条件,也就是需要被找到的元素
    12 WebDriverWait(driver,10).until(
    13     EC.presence_of_element_located((By.ID,'sdfsdf'))
    14 )

    显式等待和隐式等待的区别是:

    隐式等待不管元素被找到与否,都会等待预设的时间。

    显式等待如果找到元素时还没有到预设的时间,那么剩下的时间就不会继续等待。例如:预设等待10s,但是在第5s的时候元素被找到,那么剩下的5秒就不会等待了。

  • 相关阅读:
    mq和kafaka架构方面对比高可用性
    一 mq简介
    gtibook 写api文档
    StackExchang.Redis 不稳定
    Log4Net 帮助类
    Android学习之Recyclerview
    《程序员修炼之道--从小工到专家》读书小计
    Xcode7 使用WebView loadRequest发送HTTP请求的问题
    ashx中应用HttpContext.Current.Session ,呈现未将对象引用设置到实例(转)
    Oracle 删除重复数据只留一条【转】
  • 原文地址:https://www.cnblogs.com/GouQ/p/13093785.html
Copyright © 2020-2023  润新知