• Python+Selenium基本语法


    对Selenium自动化已有了解,最近开始做h5端的自动化,所以总结了下Python+Selenium自动化基本语法

    一、启动浏览器

    1、普通方式启动

    #coding=utf-8
    import time
    from selenium import webdriver
    driver = webdriver.Chrome()  #启动Chrome浏览器
    driver = webdriver.Firefox()  #启动Firefox浏览器
    driver = webdriver.Ie  #启动IE浏览器
    driver.get("http://www.taobao.com")
    time.sleep(3)

    2、Headless方式启动

    Headless Chrome是Chrome浏览器的无界面形态,可以在不打开浏览器的条件下,使用Chrome所有支持的特性

    #coding=utf-8
    import time
    from selenium import webdriver
    options=webdriver.ChromeOptions()
    options.add_argument('--headless')  #设置无界面选项
    options.add_argument('--disable-gpu')
    driver=webdriver.Chrome(options=options)
    driver.get('http://www.taobao.com')
    print(driver.page_source)

    3、加载配置启动浏览器

    Selenium操作浏览器是不加载配置的,加载配置需要手动配置,但是我的代码老报错,具体如下,求指点

    #coding=utf-8
    from selenium import webdriver
    option=webdriver.ChromeOptions()
    option.add_argument('--user-data-dir=')
    driver=webdriver.Chrome(options=option)
    driver.get('http://www.taobao.com')

    二、元素定位

    自动化的核心是定位元素,Selenium提供了八种定位元素的方法,常见如下

    1、定位单个元素

      id定位:driver.find_element_by_id()

      name定位:driver.find_element_by_name()

      class定位:driver.find_element_by_class_name()

      link定位:driver.find_element_by_link_text()

      partial link定位:driver.find_element_by_partial_link_text()

      tag定位:driver.find_element_by_tag_name()

      css定位:driver.find_element_by_css_selector()

      xpath定位:driver.find_element_by_xpath()

    2、定位一组元素取下标定位

      id定位:driver.find_elements_by_id()[]

      name定位:driver.find_elements_by_name()[]

      class定位:driver.find_elements_by_class_name()[]

      link定位:driver.find_elements_by_link_text()[]

      partial link定位:driver.find_elements_by_partial_link_text()[]

      tag定位:driver.find_elements_by_tag_name()[]

      css定位:driver.find_elements_by_css_selector()[]

      xpath定位:driver.find_elements_by_xpath()[]

    3、class定位

       class定位主要是利用元素的css样式表所引用的伪类名称来进行元素查找,实际定位时,会经常发现一个元素的class name是由多个class组成的复合类,以空格隔开

       class含空格解决办法有

    (1)class属性唯一但有空格,选择空格两边唯一的那一个

    (2)空格隔开的class不唯一,用索引定位

    (3)通过css方法定位,空格用.代替

    4、xpath定位

       xpath就是XML path,可以用xpath来定位html文档中的任意元素,xpath定位是对整个文档进行扫描来定位元素,效率比较低

       a.xpath有绝对路径和相对路径,绝对路径用/,相对路径用//

       b.xpath以/开头表示让解析引擎从文档的根节点开始,以//开头表示让解析引擎从文档的任意符合的元素节点开始解析

       c.xpath路径中有/表示寻找父节点的直接子节点,路径中有//表示寻找父节点所有符合的子节点

    5、css定位

       css定位和xpath定位类似,但是css执行速度比较快

    6、xpath和css定位

    三、等待

    1、强制等待

    强制等待就是不管程序是否加载完成,都需要等待对应的时间

    #coding=utf-8
    from selenium import webdriver
    import time
    driver=webdriver.Chrome()
    driver.get('http://www.taobao.com')
    time.sleep(5)
    driver.quit()

    2、隐式等待

    隐式等待通过添加webdriver的implicitly_wait()方法,隐式等待设置了一个最长等待时间,如果在规定的时间内页面加载完成后,会立马执行下一步,否则会等待时间截止才执行下一步,隐式等待对webdriver整个周期起作用,所以只需要设置一次

    #coding=utf-8
    from selenium import webdriver
    import time
    driver=webdriver.Chrome()
    driver.get('http://www.taobao.com')
    driver.implicitly_wait(10)
    driver.quit()

    3、显式等待

    显式等待使用WebDriverWait,配合该类的until()或者until_not()方法,根据判断条件灵活等待,显式等待是程序每隔几秒检查一下条件是否成立,成立了则执行下一步,不成立则继续等待,直到超过了最长等待时间,再抛出异常

    WebDriverWait调用方法:

    WebDriverWait(driver,超时时长,调用频率,忽略异常).until(可执行方法,超时时返回的信息)

    driver:WebDriver实例
    timeout:超时时间
    调用频率是调用until或until_not中的方法的间隔时间,默认是0.5秒
    忽略的异常,如果在调用until或until_not的过程中抛出这个元组中的异常,则不中断代码,继续等待,如果抛出的是这个元组外的异常,则中断代码,抛出异常

    until或者until_not的可执行方法参数一定要是可调用的,即一定要用call()方法,否则会抛出异常,可以用selenium提供的expected_conditions模块中的条件

    #coding=utf-8
    from selenium import webdriver
    from selenium.webdriver.support.wait  import WebDriverWait
    from selenium.webdriver.support import expected_conditions as EC
    from selenium.webdriver.common.by import By
    driver=webdriver.Chrome()
    driver.get('http://www.taobao.com')
    driver.implicitly_wait(10)
    WebDriverWait(driver,5).until(EC.title_is(u"淘宝网 - 淘!我喜欢"))
    #判断某个元素是否被加到dom树种,该元素不一定可见
    WebDriverWait(driver,5).until(EC.presence_of_element_located((By.CSS_SELECTOR,'.btn-login.ml1.tb-bg.weight')))
    #判断某个元素是否可见
    WebDriverWait(driver,5).until(EC.visibility_of_element_located((By.CSS_SELECTOR,)))
    #判断元素是否可见,传定位的element
    WebDriverWait(driver,5).until(EC.visibility_of(driver.find_elements_by_css_selector('.btn-login.ml1.tb-bg.weight')),"未找到该元素")
    driver.quit()

    五、浏览器操作

    #coding=utf-8
    from selenium import webdriver
    import time
    import os
    driver=webdriver.Chrome()
    driver.get('http://www.taobao.com')
    driver.maximize_window()  #浏览器放大
    time.sleep(5)
    driver.get_screenshot_as_file('.\1.png')  #截图
    picture_time=time.strftime("%Y-%m-%d-%H_%M_%S", time.localtime(time.time()))
    directory_time=time.strftime("%Y-%m-%d", time.localtime(time.time()))
    try:
        File_Path = os.getcwd() + '\' + directory_time + '\'
        if not os.path.exists(File_Path):
            os.makedirs(File_Path)
            print("新建目录成功:%s" %File_Path)
        else:
            print("目录已存在")
    except BaseException as msg:
        print("新建目录失败:%s" %msg)
    driver.save_screenshot('.\' + directory_time + '\' + picture_time + '.png')  #截图
    driver.quit()

    六、键盘操作

    调用键盘事件需要引入keys包

    引入方法from selenium.webdriver.common.keys import Keys

    通过send_keys()调用按键

    send_keys(Keys.TAB)

    send_keys(Keys.ENTER)

    send_keys(Keys.CONTRAL,'a')

    七、鼠标事件

    需要引入ActionChains类

    引入方法from selenium.webdriver.common.action_chains import ActionChains

    ActionChains类常用方法:

    perform() 执行所有ActionChains中存储的行为

    context_click() 右击

    double_click() 双击

    drag_and_drop() 拖动

    move_to_element() 鼠标悬停

  • 相关阅读:
    Chrome cookies folder
    Fat URLs Client Identification
    User Login Client Identification
    Client IP Address Client Identification
    HTTP Headers Client Identification
    The Personal Touch Client Identification 个性化接触 客户识别
    购物车 cookie session
    购物车删除商品,总价变化 innerHTML = ''并没有删除节点,内容仍存在
    453
    购物车-删除单行商品-HTMLTableElement.deleteRow()
  • 原文地址:https://www.cnblogs.com/testerlina/p/13336585.html
Copyright © 2020-2023  润新知