• 我是怎么处理其他网站恶意爬虫博客园的,希望大家喜欢


    本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

    阅读目录

    本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

    介绍

      今天才写了个随笔,然后不到一个小时就有个网站进行了爬虫,呵呵好速度,而已百度的搜索排名比博客园还高,不过我加了防伪处理,大家看看效果吧。

    现象

     百度搜索情况:

      看到没别人的网站排名还在前面。

        博客园的:

      

      然后再看看爬虫网站的:

     

      看到框出来的地方没,是不是很有意思,让别人一眼就知道是从哪来的,还能给博客园做广告,博客园得谢谢我们这些攻城狮。求感谢!!

    版权处理

      我们怎么来加入版权处理捏。有很多方法。因为爬虫不可能把你这个网站的css和js全部给你爬过来,那整个网站就很臃肿了,还可能出问题,所以这里就有两种处理方法。

    一种是js处理,另一种就是css处理。我觉得css处理比较简便,也不影响速度,就采取了css的处理。

      首先我们可以在 管理->选项->博客设置->页面定制CSS代码,如下:

    在css中加入此段(红色方块)

      然后我们就可以愉快的在随笔中使用这个div的class了。

      我们在随笔中,随便那些地方,肆意妄为的加入这个就行了,然后其他爬虫网站就只能给我们做广告了,是不是小激动一下。当然这个处理比较简单,也比较容易编辑,大家有什么其他的好的想法也可以交流交流,毕竟知识也是有产权的,毕竟是一个字一个字码出来的,希望那些骗流量的网站积点功德。

    今天又在网上搜了下,发现有4,5个网站在爬,其中有一个过滤做的很好,居然把那个div的内容过滤了,还是给大家看下吧。

    --------------------------

    -----------------------------

    ------------------------

      最后一个明显爬网很成功啊,希望博友们发挥下智慧,一起交流交流。

     

    本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

  • 相关阅读:
    2019-2020-1 20175315 20175322 20175334 实验五 通讯协议设计
    bfs思路总结
    蓝桥杯-带分数
    Passive WiFi Tracking
    openWRT刷机设置
    研究生若干事
    Dijkstra算法和Floyed算法
    最小生成树prim算法
    无穷大量0x3f3f3f3f
    杭电OJ题目分类
  • 原文地址:https://www.cnblogs.com/mephisto/p/4143031.html
Copyright © 2020-2023  润新知