安装模块
pip install selenium
需要下载一个对应浏览器的驱动,例如chorme的驱动(chromedriver.exe)
吧 chromedriver.exe 文件放入运行的python文件所在的目录,或者将chromedriver.exe的路径添加到环境变量path中。
快速上手
from selenium import webdriver
import time
# 获取一个浏览器对象
br = webdriver.Chrome()
# 打开一个页面
br.get('http://www.baidu.com')
# 获取页面的源代码(运行后在内存中渲染的页面元素)
print(br.page_source)
# 根据id查找元素
kw = br.find_element_by_id('kw')
# 往表单输入框中输入内容
kw.send_keys('你好')
# 点击某个元素
br.find_element_by_id('su').click()
time.sleep(3)
# 将页面内容保存成截图
br.save_screenshot('./1.png')
# 设置窗口最大化
br.maximize_window()
time.sleep(2)
# 指定浏览器窗口大小
br.set_window_size(1200, 800)
# 设置浏览器的坐标 四个参数分别是 x坐标 y坐标 窗口的宽 框框的高
br.set_window_rect(100, 200, 300, 500)
# 获取所有cookie
print(br.get_cookies())
print('*' * 10)
# 获取某一个cookie的信息
print(br.get_cookie('BDORZ'))
time.sleep(2)
# 关闭窗口
br.close()
# 退出浏览器
time.sleep(2)
br.quit()
元素对象操作
查找(定位)单个元素(查询符合条件的第一个元素)
# 根据类名查找元素
br.find_element_by_class_name('s_btn')
# 根据元素的name值查找元素
br.find_element_by_name('ie')
# 根据元素的标签名称查找元素
br.find_element_by_tag_name('div')
# 根据链接包裹着的文字查找
br.find_element_by_link_text('地图')
# 根据链接包裹着的部分文字查找
br.find_element_by_partial_link_text('地')
# 根据css选择器规则进行查找元素
br.find_element_by_css_selector('#wrapper')
# 根据xpath规则进行查找元素
find_element_by_xpath('//*[@id="q"]')