Python+Selenium有以下八种定位元素的方法:
1. find_element_by_id()
eg: find_element_by_id("kw")
2. find_element_by_name()
eg: find_element_by_name("wd")
3. find_element_by_class_name()
eg: find_element_by_class_name("bg s_btn")
4. find_element_by_tag_name()
eg: find_element_by_tag_name("input") -- 一般页面上重复标签比较多,所以很难通过标签名去区分不同的元素
5. find_element_by_link_text()
eg: find_element_by_link_text("hao123")
eg: find_element_by_link_text(u"新闻") -- 在中文前面加个小“u”可以有效的避免中文乱码的问题
6. find_element_by_partial_link_text()
eg: find_element_by_partial_link_text("一个很长的文本的一部分") -- 如果一个文本链接很长,可以只取其中一部分
7. find_element_by_xpath()
eg: find_element_by_xpath("/html/body/div/div[2]/div/div/div/from/span[2]/input") -- 通过绝对路径定位
eg: find_element_by_xpath("//input[@autocomplete='off']") -- 通过元素任意属性定位
eg: find_element_by_xpath("//*[@class='bg s_btn']") -- 如果不想指定标签名也可以用星号(*)代替
eg: find_element_by_xpath("//form[@id='form']/span[2]/input") -- 通过层级和属性定位
eg: find_element_by_xpath("//input[@id='kw' and @class='su']/span/input") -- 可以使用逻辑运算符
8. find_element_by_css_selector()
eg: find_element_by_css_selector(".s_ipt") -- 通过class属性定位
eg: find_element_by_css_selector("#kw") -- 通过id属性定位
eg: find_element_by_css_selector("input") -- 通过标签名定位
eg: find_element_by_css_selector("span>input") -- 通过父子关系定位
eg: find_element_by_css_selector("input[autocomplete='off']") -- 通过属性定位
eg: find_element_by_css_selector("span.bg s_btn_wr>input#su") -- 组合定位
用By定位元素:
在使用 By 时需要将 By 类导入
from selenium.webdriver.common.by import By
find_element(By.ID,"kw")
find_element(By.NAME,"wd")
find_element(By.CLASS_NAME,"s_ipt")
find_element(By.TAG_NAME,"input")
find_element(By.LINK_TEXT,u"新闻")
find_element(By.PARTIAL_LINK_TEXT,u"新")
find_element(By.XPATH,"//*[@class='bg s_btn']")
find_element(By.CSS_SELECTOR,"span.bg s_btn_wr>input#su")