• elenium 项目代码的优化与重构之路


      封装元素定位函数

      Selenium 中,经常需要复用某些元素获取的方法,毕竟每次都 find_element_by_xxx 有点太繁琐了。

      我们可以将一些常用的方法进行二次封装,在弄一个简单的函数出来。

      from selenium import webdriver

      import selenium

      from selenium.webdriver.common.action_chains import ActionChains

      # 通过 ID 获取元素

      def id(element):

      return driver.find_element_by_id(element)

      # 通过 CSS 获取元素

      def css(element):

      return driver.find_element_by_css_selector(element)

      # 通过 name 获取

      def name(element):

      return driver.find_element_by_name(element)

      添加几个函数之后,就可以对代码进行重构了。

      其它的一些内容,可以自己在进行进一步的封装,例如 find_element_by_xpath 方法,执行 JS 的方法 driver.execute_script。

      提炼函数到单独的文件中

      函数写完之后,但是还是与所有的 Python 代码混合在一起,可以通过代码分层,将一些函数提炼到一个单独的文件中。例如可以将上文写的几个函数提炼到一个 functions.py 文件中。

      functions.py 文件

      该文件主要用于编写项目中用到的通用函数,可以重复在其它文件中进行使用,而不用在重复编写。

      from selenium import webdriver

      driver = webdriver.Firefox()

      def id(element):

      return driver.find_element_by_id(element)

      # 通过 CSS 获取元素

      def css(element):

      return driver.find_element_by_css_selector(element)

      def return_driver():

      return driver

      注意,我将 driver 获取对象也封装成了一个函数。最终形成的目录结构如下。

      

    Selenium 项目代码的优化与重构之路,滚雪球学 Python 番外篇

      在 main_pro.py 文件中,值需要导入模块对应的函数即可。

      from selenium import webdriver

      import time

      from selenium.webdriver.common.action_chains import ActionChains

      from functions import id,css,return_driver

      driver = return_driver()

      driver.maximize_window()

      driver.get('https://flight.tuniu.com/')

      # 定义好出发和到达的城市

      from_city = "SJZ"

      to_city = "SY"

      from_date = "2021-01-01"

      id("J_FormDepartCity").send_keys(from_city)

      time.sleep(2)

      driver.find_element_by_xpath("//div[@class='autocomplete-suggestions'][1]/div[1]").click()

      id("J_FormDestCity").send_keys(to_city)

      time.sleep(2)

      driver.find_element_by_xpath("//div[@class='autocomplete-suggestions'][2]/div[2]").click()

      # 删除时间控件的只读属性

      driver.execute_script("document.getElementById('J_FormDepartDate').removeAttribute('readonly')")

      # 设置时间大连妇科医院 http://xmobile.bhbyby.com/

      id("J_FormDepartDate").clear()

      id("J_FormDepartDate").send_keys(from_date)

      # 点击一下其他位置,清除浮窗

      ActionChains(driver).move_by_offset(0,10).click().perform()

      # 点击搜索按钮

      time.sleep(1)

      id("J_Search").click()

      依旧是相同的手段,可以将所有的通用内容都提炼到 functions.py 这个文件中,而 main_pro.py 只保留业务逻辑代码。

      再往深处去学习,就涉及基础代码层,业务代码层,测试代码层的编写了。本系列不做展开,滚雪球学 Python 中将有所涉及。代码随着编写的深入是需要不断进行重构与迭代的,项目越大越需要复杂的设计,小 Demo 类的项目一般是用不到特别复杂的层级的,主要是没有必要,分层之后代码写起来比较费劲。

      Selenium 代码异常

      项目除了结构设计的合理以外,还需要较高的异常处理能力,在 Selenium 中,常见的异常都可以在网上查询到。

      最常出现的还是 NoSuchElementException,找不到元素,其它错误异常在代码编写过程中,碰到就去官网查询一下即可,要记住编程是离不开手册的,工作多少年都一样。

      补充知识点 implicitly_wait() 方法

      在使用 Selenium 进行网页元素定位的时候,有时页面加载会慢,可能是受网速影响,也可能其它原因,这时需要一个获取元素的等待时间,之前都是采用 time 模块的 sleep 方法实现的,其实 Selenium 也给我们提供了一个自带的方法,即 implicitly_wait 智能等待,设置一个全局智能等待的时间,那获取元素的时候,就会按照这个时间进行等待,例如设置了 10 秒,如果 5 秒元素获取到了,那智能等待就等于 5 秒,反之,等待 10 秒还没有获取到,就会进行下一步计算或者报错。

      具体的代码格式如下:

      # 设置全局等待时间为 10 秒

      driver.implicitly_wait(10)

      driver.get('https://flight.tuniu.com/')

  • 相关阅读:
    机器学习Python包
    Linux网卡的相关配置总结
    [转]Ajax跨域请求
    [转]git在eclipse中的配置
    java代码运行linux shell操作
    虚拟机NAT模式无法上网问题的解决办法
    [转]关于网络通信,byte[]和String的转换问题
    ARP协议工作流程
    pycharm常用快捷键总结
    数据挖掘主要解决的四类问题
  • 原文地址:https://www.cnblogs.com/djw12333/p/14518674.html
Copyright © 2020-2023  润新知