其实就是换个浏览器,只是这个浏览器没有图形界面而已。
browser = webdriver.Chrome()
换成
browser = webdriver.Remote(desired_capabilities=DesiredCapabilities.HTMLUNIT)
当然,要先添加相应的模块,和启动服务。
1、下载安装java ,为了运行jar包
2、下载selenium-server-standalone-XXX.jar ,这里特别要注意版本,要跟自己的selenium版本匹配
查看自己已经安装的包的方法,cmd命令进入安装Python的目录下的Scripts
输入 pip list即可查看所有已经安装的包的版本号
3、以上两步完成后,cmd进入到selenium-server-standalone-XXX.jar 的安装目录,
cmd命令输入 java -jar selenium-server-standalone-xxx.jar,代理服务器就跑起来啦
PS:如果无法启动,可能是端口被占用了
4、最后一步就是测试一下HTMLUNIT能否正常使用了
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities from selenium import webdriver htmlunit = webdriver.Remote(desired_capabilities=DesiredCapabilities.HTMLUNIT) htmlunit.get("http://www.baidu.com") print (htmlunit.title)