• nginx-伤心的事


    今天测试接口,总是出问题,测试了两天,整个流程就卡在最后一步。

    每次采用curl,request等请求访问我的服务器都会返回403状态码,网上找了很多资料

    有权限的,有静态文件的,然而很多都没有什么卵用,天下文章一大抄

    找了公司的技术总监帮我看了下,原来是nginx里配置了反爬策略,导致有些请求过不来

    server {
            listen      80;
            server_name xxx.xxx.com;
            charset     utf-8;
    
            #include /etc/nginx/anti_spider.conf;    ###就这个破玩意,
            # max upload size
            client_max_body_size 75M;
    
            location /static {
                alias  /home/data/my_web_project/idfa_switch/allstatic;
            }
    
            location / {
                uwsgi_pass  django;
                include     uwsgi_params;
            }
    
        }

    接下来看看这个破东西到底是什么

    #禁止Scrapy等工具的抓取
    if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
         return 403;
    }
    
    #禁止指定UA及UA为空的访问
    if ($http_user_agent ~ "WinHttp|WebZIP|FetchURL|node-superagent|java/|FeedDemon|Jullo|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|Java|Feedly|Apache-HttpAsyncClient|UniversalFeedParser|ApacheBench|M
    icrosoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|BOT/0.1|YandexBot|FlightDeckReports|Linguee Bot|^$" ) {     return 403;
    }
    
    #禁止非GET|HEAD|POST方式的抓取
    if ($request_method !~ ^(GET|HEAD|POST)$) {
        return 403;
    }
    
    #屏蔽单个IP的命令是
    #deny 123.45.6.7
    #封整个段即从123.0.0.1到123.255.255.254的命令
    #deny 123.0.0.0/8
    #封IP段即从123.45.0.1到123.45.255.254的命令
    #deny 124.45.0.0/16
    #封IP段即从123.45.6.1到123.45.6.254的命令是
    #deny 123.45.6.0/24
    
    # 以下IP皆为流氓
    # deny 58.95.66.0/24;

    可以看到很多请求过来都是返回403.。这次教训记住了,第二次犯错。。

    遇到403不只是权限和静态文件不存在,还有可能是反爬策略,找到这个文件,直接注释了就可以完美解决

  • 相关阅读:
    Java中的几种常用循环 for switch while dowhile
    HTML的各种基本标签
    2017年终总结
    HTML C# ajax结合ashx处理程序实现文件上传
    HTML div鼠标悬停控制子控件显示与隐藏
    HTML 使用CSS 如何去掉文本聚焦框
    HTML input 文本框如何添加提示信息
    CSS 如何通过top left 定位控制div在另一个div的位置
    CSS background 属性
    php支付接口开发-支付宝-开发前期准备
  • 原文地址:https://www.cnblogs.com/52-qq/p/9626845.html
Copyright © 2020-2023  润新知