• 防采集的几种方法


    经过各种搜索及自己的试验,决定后面做防采集通过混用以下方法来解决,当然采集是无法完全防止的,只能是尽量减少。

    基本方法如下:

    1. 首先简单限制右键、复制等手工获取方法

    2. referer,内容gzip/deflate压缩等常用方法

    3. 内容混淆,加入随机截断,加入背景色随机版权文字

    4. 需要防采集的内容:随机token+AJAX获取动态加密后的内容,然后使用JS解密

    5. 较特殊的方法,乱序输出HTML标签及内容,通过JS进行正常排除并输出,实际上可以合并到上一点

    6. 由于采集一般不采集JS,图片等内容,因此使用JS或图片记录IP,与页面IP进行时间差比对等处理。

    7. 数据分析出采集IP动态封锁,当然也可手工封IP

    混用以上功能,一般采集的人就烦死了,估计也不会继续采集。

    对搜索引擎的影响,可以通过关键字、简介等方式尽量降低,主要取决于你对防采集与搜索引擎的权衡。

    各位觉得有什么更好的方法的可以讨论下~

  • 相关阅读:
    DNS服务器原理简述、搭建主/从DNS服务器并实现智能解析
    JQuery02
    JQuery01
    python05
    python04
    python03
    Liunx命令
    Python运算符及注释
    python01
    原生JDBC+mybatis
  • 原文地址:https://www.cnblogs.com/iblaze/p/web_anti_collect.html
Copyright © 2020-2023  润新知