安装bs4后,运行测试报错
from bs4 import BeautifulSoup from selenium import webdriver # 登录界面的url url = 'https://passport.bilibili.com/login' # 实例化一个chrome浏览器 browser = webdriver.Chrome(executable_path="../tool/chromedriver_81.0.4044.69.exe") # 窗口最大化 browser.maximize_window() browser.get(url) # 将网页源码转化为能被解析的lxml格式 soup = BeautifulSoup(browser.page_source, 'lxml') print(soup.title.string)
经过测试发现是lxml的问题,使用 pip install lxml 安装,安装完后,在运行还是一样出错, 经百度、知乎的说法是新的库不支持,新版本语法支持改变了
使用 pip install lxml时,自动安装的是最新 4.2.5版本
解决方法一:
卸载新的换老的就可以了
pip uninstall lxml
pip install lxml==3.7.0
方法二:
在报错代码中把函数参数中所有的"lxml"改成"html.parser"
soup = BeautifulSoup(browser.page_source, 'lxml')
改成 soup = BeautifulSoup(browser.page_source, 'html.parser')