一、python+selenium遍历某一个标签中的内容
举个例子:我要获取列表标签<li></li>的内容
根据python+selenium定位到列表整体,使用for循环获取列表文本;可用于校验列表是否存在你需要的文本内容
1.获取内容不包含嵌套层列表
给出代码:
from selenium import webdriver import time d = webdriver.Chrome() d.maximize_window() # 窗口最大化
###登录某网站 d.get('http://xx.xxx.xx.xx:xxxx/') d.find_element_by_xpath('//*[@id="userName"]').send_keys('xxx') d.find_element_by_xpath('//*[@id="userPwd"]').send_keys('xxx') d.find_element_by_xpath('//*[@id="login"]').click() time.sleep(2)
###切换表单,进入到操作页面 d.find_element_by_xpath('//*[@id="menu_ul"]/li[5]/a').click() d.switch_to_frame('mainframe2') d.find_element_by_xpath('//*[@id="nav-accordion"]/li[2]/a').click() d.switch_to_frame('mainframe') d.switch_to_frame('vehIframe')
###定位到要获取标签的顶级元素,并使用for循环获取 names = d.find_elements_by_xpath('//*[@id="vehGroupTree_1"]') lists = [] for i in names: a = i.text lists.append(a) print(a, i.get_attribute("href")) # 打印遍历标签出来的内容和获取href属性的内容 print(lists) print(lists[0].split(' '))
print(len(lists[0].split(' '))) # 打印列表元素数目
注意:有些列表不仅仅包含嵌套列表,还有扩展项(指的是“+”可以展开的那种),这里我们获取的内容只是最外层内容(获取那一层内容取决于定位元素names = d.find_elements_by_xpath('//*[@id="vehGroupTree_1"]')),使用这种方式要想获取嵌套列表的内容,还需要逐层展开(点开)嵌套层才行,否则该元素是隐藏起来的。