爬虫系列之解决动态数据获取(一)

爬虫系列之解决动态数据获取(一)
有时候，我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现，我们要提取的网页元素并不在我们下载到的HTML之中，尽管它们在浏览器里看起来唾手可得。
这说明我们想要的元素是在我们的某些操作下通过js事件动态生成的。举个例子，我们在刷QQ空间或者微博评论的时候，一直往下刷，网页越来越长，内容越来越多，就是这个让人又爱又恨的动态加载。
爬取动态页面目前来说有两种方法
- 分析请求页面
- 通过Selenium模拟浏览器获取
小编不推荐使用方法二，原因很简单，效率低，爬取少量页面数据可以接受，如果我们获取的页面层次多数据量大，那么它的执行效率会死人的。。。。
分析很简单，我们只需要打开了浏览器Ｆ12开发者模式，获取它的js请求文件（除JS选项卡还有可能在XHR选项卡中，当然也可以通过其它抓包工具）
我们打开第一财经网看看，发现无法获取元素的内容
打开Ｎetwork，看下它的请求，这里我们只看它的ｊｓ请求就够了
将它的url放到浏览器看下
我们观察url的规律可以看到每次末尾的url都自增１，这样我们就可以重构请求来获取数据，贴下代码
这里的数值１５８４是小编手动试出来的，还有一种方法就是直接while循环，在判断返回值，如果还有更好的方法，请告知下小编
有时候，一些网站所有的接口都进行了加密操作，我们无法解析ｊｓ,就必须采用selenium+phantomjs进行获取，具体使用请看另一篇。
相关阅读:
BeanShell实现写入文件
 LoadRunner11录制APP脚本（2）
LoadRunner11录制APP脚本（1）
性能测试研究方向
 JMeter录制脚本方式（二）
JMeter常用字符串相关函数
 JMeter中BeanShell用法总结（一）
第二篇：JMeter实现接口/性能自动化（JMeter/Ant/Jenkins）
第一篇：JMeter实现接口/性能自动化（JMeter/Ant/Jenkins）
JMeter设置集合点
原文地址：https://www.cnblogs.com/syketw23/p/7667622.html

最新文章
Redis 键空间通知
 Redis 集群二
 Redis 集群
 Redis Replication
Redis AOF文件
 Redis RDB文件
 Redis服务器操作
 Redis 发布/定阅
 Redis的强大之处
 Redis 与 Lua Script

热门文章
Redis 集合操作
 Redis List操作
 Redis Scan命令
 Redis OBJECT命令
 KEY操作续
 Redis Key操作
 Redis 位操作
 Redis Set命令
 Redis 基础操作
 Redis 授权操作