一、什么是PhantomJS?
一款无界面浏览器。
二、python如何爬取动态加载页面?
selenium+PhantomJS(爬虫终极解决方案)
三、selenium操作PhantomJS
1、下载PhantomJS
https://phantomjs.org/download.html
2、代码示例
#!/usr/local/bin/python3.7 from selenium import webdriver import time # phantomJS路径 path = '/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs' # 创建浏览器对象 browser = webdriver.PhantomJS(path) # 打开百度并操作 url = 'https://www.baidu.com' browser.get(url) time.sleep(1) # 截图 browser.save_screenshot('Reptile/phantomjs_img/baidu.png') # 定位搜索框 search = browser.find_element_by_id('kw') time.sleep(1) # 在搜索框输入内容 search.send_keys('美女') time.sleep(1) # 截图 browser.save_screenshot('Reptile/phantomjs_img/meinv.png') # 关闭浏览器 browser.quit()