selenium + PhantomJS 爬取js页面

from selenium import webdriver
import time
_url="http://xxxxxxxx.com"
driver = webdriver.PhantomJS()
driver.get(_url)
time.sleep(5)
webdata=driver.page_source
#这样就得到了web页面的内容,最好加个延时页面加载需要时间
#下面的就可以对这个页面进行爬取了
.
.
.
.
# 最好要记得关闭浏览器
driver.quit()

在这里标记一个小坑：在爬取页面的下载连接时，出现这样的：http%3A%2F%2Ftencent.myaora.net%2Ftest%2Fupload%2Fopen%2F2017%2F03%2F48023%2Fapk%2F20171114142640_380_0290.apk
一堆的%+大写字母+数字 混淆了真实地址，解决方法就是：

download_url="http%3A%2F%2Ftencent.myaora.net%2Ftest%2Fupload%2Fopen%2F2017%2F03%2F48023%2Fapk%2F20171114142640_380_0290.apk"

urllib.parse.unquote(download_url)# quote & unquote 可以将连接“加密和解密”

相关阅读:
内部类与外部类的调用
Docker学习（十二）中遇到的一些问题汇总
Docker学习（十一）Docker系列结束-新的开始K8S
Docker学习（十）Docker容器编排 Docker-compose
Docker学习（九）Volumn容器间共享数据
Docker学习（八）容器间单向通信
Docker学习（七）实战
Docker学习（六）Dockerfile构建自定义镜像
Docker学习（五) Dockerfile基础命令
Docker学习（四）Docker搭建Tomcat

原文地址：https://www.cnblogs.com/gaigaige/p/7843491.html