服务端能够通过三种途径进行robot检測:
第一种,利用http的User-Agent header进行推断,这样的是最正常的推断,但这样的不能检測出不友好的请求,它能够伪造。
另外一种,限制请求频率。也就是进行流控。普通用户不可能在一定的时间内请求过多次,所以能够检測出。
但请求方能够进行随机。限时进行请求。
第三种。依据日志进行分析来检測robot,这样的能够检測出slow robot.
原文:http://blog.csdn.net/hongchangfirst/article/details/24704869
作者:hongchangfirst
hongchangfirst的主页:http://blog.csdn.net/hongchangfirst