• (反反爬虫)携程酒店的eleven


    关于携程酒店的爬虫,网上有很多,我仔细看了下,大概的分成了两派:selenuim与python执行JS,夹生饭大佬在知乎的专栏中也讲述的很清楚了,我不想再复刻他的文章了,而且我在github中也找到了开源项目针对携程酒店的,链接点击这里,我在复现夹生饭大佬代码的过程中始终有一段代码没找到

    callback = """
            var callback = function() {
            for (var t = ["A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T", "U", "V", "W", "X", "Y", "Z", "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z"], o = "CAS", n = 0; n < 15; n++) {
                var i = Math.ceil(51 * Math.random());
                o += t[i]
            }
            return o
            };
                """

     在网上别人展示出来的代码中也没有取讲解这个函数是在那找到的。不过就像夹生饭大佬说的一样,获取到数据才是关键!

    点评一下复现的过程,处理JS真的是一个需要经验的活,还不懂这一块,就需要花时间去补。以后会更多的爬类似的网站,自己也希望出类似的教程!

  • 相关阅读:
    chrome sarfri form.submit bug
    ruby首字母大写
    ubuntu 10.04 中文设置
    添加centos用户
    农行的短信提醒很滞后
    从github删除敏感数据
    从github删除敏感数据
    国内有不有做虚拟化或是叫云平台的朋友
    设置rails header编码
    centos5.5
  • 原文地址:https://www.cnblogs.com/pontoon/p/10506005.html
Copyright © 2020-2023  润新知