• seleniium模块的基本使用


    一、selenium模块和爬虫之间具有怎样的关联

    • 便捷的获取网站中动态加载的数据
    • 便捷实现模拟登录

    二、什么是selenium模块

    基于浏览器自动化的一个模块

    三、selenium使用流程

    1、环境安装:pip install selenium -i https://mirrors.aliyun.com/pypi/simple

    2、下载一个浏览器的驱动程序,如谷歌 

    下载路径:http://chromedriver.storage.googleapis.com/index.html

    驱动程序和浏览器的映射关系:http://blog.csdn.net/huilan_same/article/details/51896672

    3、实例化一个浏览器对象

    bro = webdriver.Chrome(executable_path='./chromedriver')

    4、编写基于浏览器自动化的操作代码

    发起请求:get(url)

    标签定位:find系列的方法

    标签交互:send_keys('xxx')

    执行js程序:excute_script('jsCode')

    前进,后退:forward() back()

    关闭浏览器:quit()

    from selenium import webdriver
    from time import sleep
    
    bro = webdriver.Chrome(executable_path='./chromedriver')
    bro.get('https://www.taobao.com/')
    
    # 标签定位
    search_input = bro.find_element_by_id('q')
    # 标签交互
    search_input.send_keys('iphone')
    
    # 执行一组js程序
    bro.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    sleep(2)
    # 点击搜索按钮
    btn = bro.find_element_by_css_selector('.btn-search')
    btn.click()
    
    bro.get('https://www.baidu.com')
    sleep(2)
    
    # 回退
    bro.back()
    sleep(2)
    
    # 前进
    bro.forward()
    
    
    sleep(5)
    
    bro.quit()
  • 相关阅读:
    威尔逊置信区间
    mysql函数
    python操作mysql之pymysql
    oracle 表分区
    Python连接sqlserver数据库之pymssql
    python-subprocess
    python-shutil
    python+logging
    公钥加密-DES-RSA
    python-Web-flask-蓝图和单元测试
  • 原文地址:https://www.cnblogs.com/nanjo4373977/p/12966885.html
Copyright © 2020-2023  润新知