98、搜索引擎反作弊的一些方法

这篇也是在阅读了吴军老师的《数学之美》一书后，所写的一些笔记

下面来引用书中的一些搜索引擎反作弊的一些方法：

他们发现通信模型对于搜索反作弊依然适用。

在通信中解决噪音干扰问题的基本思路有两条

1、从信息源出发，加强通信(编码)自身的抗干扰能力

2、从传播来看，过滤掉噪音，还原信息

（1）搜索引擎作弊从本质上看就如同对(搜索)排序的信息加入噪音，因此反作弊的第一条是要增强排序算法的抗噪声能力。

（2）其次是像在信号处理中去噪音那样，还原原来真实的排名。

那些卖链接的网站，都有大量的出链，而这些出链的特点与不作弊的网站的出链相比，特点大不相同

每一个网站到其他网站的出链数目可以作为一个向量，它是这个网站固有的特征。

(1)可以计算这些向量的余弦距离，有些网站的出链向量之间的余弦距离几乎为1，一般来讲，这些网站通常是一个人建的，

目的只有一个：卖链接。发现了这个规律后，改进PageRank算法，使得购买的链接基本上不起作用

(2)反作弊的另一个工具是图论。在图中，如果有几个节点两两互相都链接在一起，被称为一个环

作弊的网站一般需要互相连接，以提高自己的排名。这样在互联网这张大图中就形成了一些环

图论中有专门的发现环的方法，可以直接应用到反作弊中。

相关阅读:
正则表达式学习（转自csdn过客）
javascript学习笔记(二)－－继承
sql 中print 输出变量值
禅语摘录
dTree的分析和二次开发,ajax加载dtree节点（下）(转)
UpdatePanel的各种情况
Cocos2dx制作帧动画
Cocos2dx中文显示乱码
Struts2 过滤器与拦截器
创业不是纸上谈兵，把你的商业计划扔进垃圾桶吧

原文地址：https://www.cnblogs.com/weizhen/p/7675746.html