• 搜索排序的作弊与反作弊,面壁人与智子的巅峰对决


    搜索引擎已经是目前网络流量最大入口,在大搜上,基本上大家打开网页做的第一件事情就是打开一个搜索引擎,然后键入你感兴趣的内容,然后开始浏览。如果是个电商的网站,你打开以后,基本上也是直接键入你感兴趣的内容,然后开始浏览。

    电商的搜索引擎带入到店铺和商品的流量是巨面壁人大的(天空飘来一首歌:`不要问我流量有几多,我会告诉你很多很多`),流量的巨大必然带来销量的巨大,这些都是钱啊,有人的地方就有江湖,从小的思想品德课老师就告诉我们:马克思说过,一有适当的利润,资本就会非常胆壮起来。只要有10%的利润,它就会到处被人使用;有20%,就会活泼起来;有50%,就会引起积极的冒险;有100%,就会使人不顾一切法律;有300%,就会使人不怕犯罪,甚至不怕绞首的危险。所以,搜索排序舞弊就变成了一条又黑又长的地下黑色产业链了。

    今天,我们以一个特殊的形式来说说搜索排序中的作弊和反作弊

    1. 人物介绍


    • 面壁人:是一个为了追求利润不择手段的资本家

    • 智子:高智能的系统,专门和**面壁人**做斗争

    • 光糕喜通:一个没啥原则,只要出钱就可以给你做事的人

    • 耍蛋师:他的技能就是耍蛋,这可是一个技术活

    2. 荒蛮时代


    其实在荒蛮时代之前还应该有个规矩时代,那是第一代电商时代,以亚马逊这种B2C的电商为代表,因为所有的商品都是他自营的,所以不存在作弊一说,想怎么排就怎么排,反正都是我自己的东西,直到像ebay,易趣,淘宝之类的平台型电商出现,才开始了荒蛮时代。

     荒蛮时代,是线上购物刚刚兴起的时候,那时候在线上买商品还不是那么普及,而且商品的数量也没那么多,作弊主要体现在能把商品显示出来就行了,对于排名其实没有那么大的需求,而且那时候不管是商家还是平台,大家都是新手,那些个武林绝学都还在某个山洞里面藏着没有公布于众。

    面壁人新上了一个商品,是一条红色的ZARA的连衣裙,商品标题写成了ZARA红色连衣裙,上了以后发现搜索裙子找不到啊,于是,面壁人把商品的名字改成了ZARA红色裙子,连衣裙,长裙,短裙,超短裙,绣花裙,这一下不管是搜索裙子,连衣裙,长裙,短裙,超短裙,绣花裙都能搜到这个商品了,曝光机会一下大大提高了,面壁人觉得很爽,本来一天才1,2单,现在每天有6,7单了,这只是改了一下标题。

    到这一步,智子刀已经拿手上了,但还是忍着了,毕竟面壁人还不是特别离谱,至少标题描述的和实际商品差别不是那么大。

     

    面壁人尝到了甜头,但还是不满足,面壁人发现热门搜索词里面有个H&M裙子,每天搜索量巨大,但是没我的商品啊,这还了得,改标题,改成ZARA,H&M,Mango,红色裙子,连衣裙,长裙,短裙,超短裙,绣花裙,呵呵,流量更多了,一天有个10来单了。

    到这一步,智子刀已经举起来了......

     

    面壁人一看,我去,改个标题威力这么大,好,打开搜索排行榜,把前100名的搜索词挨个撸了一遍,标题变成了ZARA,H&M,Mango,NIKE,ADIDAS,红色,绿色,黄色,紫色,裙子,连衣裙,长裙,短裙,超短裙,绣花裙,裤子,鞋子,呵呵,么么哒,销量准备翻翻了。

     

    智子刀落......

     

    面壁人:我X,你没说不能改标题啊!!!

     

    智子一想也是,于是说:我们订个规则吧,我们都退一步,我去改我的程序,保证近义词,同义词都能找到你的商品,这样你就算是连衣裙,搜裙子也能找到你的商品,怎么样,大哥够意思了吧?

     

    面壁人:恩,够,够意思,够意思。

     

    智子:你呢,也老实点,以后商品标题不能超过10个字,不能出现两个以上的物品词,不能出现两个以上的品牌词,颜色,品牌这种词我另外给你个地方写,你别写标题里面了,以后你每改一个标题,我就这么检查一遍,如果你违反规则了,那么就只能咔擦了。

     

    面壁人:..........

     

    智子:并且我还告诉你,我后面有大哥哦,我大哥和你一样是人类,他会不定期抽查你的商品描述哦,要是他觉得不符合要求,直接干掉你哦。

     

    面壁人心想:哼哼,抽查哦,这么多商品,你哪抽查得过来,我改了只要你大哥没看到就没事,嘿嘿。。

     

    面壁人有一天发现好像关键词次数出现得越多,好像排的越靠前啊,他只说不能出现两种物品词,没说不能出现多次啊,我改成ZARA红色连衣裙连衣裙连衣裙连衣裙连衣裙,嘿嘿,也排前面啊,爽。

    终于有一天被智子的大哥抽查到了。

     

    面壁人:我X,真背,不过没事,这次被查了,后面应该不会查我了,接着改。

     

    智子:我告诉你,你心里那小九九别以为我不知道,我现在能力变强了,我大哥抽查的时候我在后面看着,我会学习的哦,我大哥每干掉一个人,那个规则我就学会了,我就会用到你的商品身上哦。你注意点哦!

     

    面壁人:呃。。。。。。。

    就这样,面壁人不停发现关键字上的新作弊规则,而智子不断强化自己的识别规则,两边都累得够呛,终于有一天,出现了下面的对话。

     

    智子:嘿,每天和你这么斗真累,你现在也做大了,我们商量个事呗。

     

    面壁人:唉,是累,死了好多脑细胞想个规则出来,一旦被发现了又要重新想,烦死了。你说商量,商量啥啊?

     

    智子:我有个兄弟,他叫光糕喜通,你去找他,你可以去他那里买关键字,你想什么关键词都行,一个一块钱,有人搜这个关键字的时候,不管你啥商品,右边最上面的位置给你,怎么样,那可以排名第一的位置啊。

     

    面壁人:嘿,还有这事,好啊好啊,一块钱,便宜!!没问题!!

    于是,智子面壁人第一次握手言和......智子轻松了不少,面壁人每天花点钱就有了相应的流量,订单也不错,抬头一看日历,恩,明年就是北京奥运会了,备点货,多和光糕喜通君交流交流,明年多卖点吧。

    3. 规则时代


    规则时代,大家的线上购物习惯已经慢慢被培养起来了,线上的商品也越来越多了,线上的交易金额也越来越大了,总之,是电商的爆发时代了,网上购物已经成为一种常态,作为商家,竞争已经越来越激烈了,不靠点小手段很难获取到流量了,于是作弊开始成规模的爆发了,但这个时代作弊还基本上是单兵作战,还没有集团化。

    虽然有广告系统帮忙,但是广告系统可不是我一个人用,大家都在用,竞价越来越高,之前只要一块钱就能排第一个,现在10块钱都排不了第一啊。而且人们越来越聪明了,知道右边的是广告,都不怎么点,怎么办呢?面壁人每天愁得满头大汗。

     

    面壁人到底脑子活,哼哼,商品标题上我做不了文章,那我做做排序的文章总可以吧?他发现,这个商品要是点击次数多,排序上也占便宜啊,于是没事就拼命点啊点,呵呵,还真有点效果,排序真的越来越好了。

     

    智子也没闲着,出了一条规定:同一个关键词的同一个IP地址的点击,每天最多算3次,同一个商品的点击,每天最多算20次,其他的点击都不算,看你怎么玩,跟姐斗,还嫩点呢。

     

    面壁人:我X,真够狠啊!

     

    面壁人到底是面壁人,点击不行,我直接买总可以吧?于是,面壁人每上一件商品,就自己注册个号来买,而且一买就买100件,销量瞬间就上去了,关键词的排名蹭蹭往上涨啊,没多久就排到第一名了,这时候,自然流量哗哗进来,真正的销量自然上去了,好开心啊。

     

    智子一看形势不对啊,于是,紧急出了一条新规则,凡是单个订单商品数量超过1个的,就按1个处理,也就是说不管你一个订单买了多少件商品,姐都只算你买了一个。

     

    面壁人想,哼,小意思,我多注册几个号,反正注册号也不要钱,搞他几百个号,轮着买,反正也不用真寄出去东西,随便秒杀智子啊,你不就关注订单么,我订单多啊。

     

    智子:新规则:同一IP地址买订单太多了,加入黑名单,这个IP的购买行为都不记入排序中

     

    面壁人:我靠!!跟我斗!看来单兵作战不行了啊,只能发动群众了啊,于是找来他的亲戚朋友,有需要就找亲戚朋友们帮着下单,这下总不能靠单个订单和IP地址干掉我了吧?而且面壁人们联合起来了,我帮你刷,你也帮我刷,反正不用真正寄东西出去,只要下了单就行了,让我们联合起来,玩死智子吧。

     

    智子:小样,跟我玩,姐要出大杀器了!新规则:订单必须真寄东西,订单号要来我这备案哦,不然算无效订单,而且这种无效订单多的帐号,一旦进入黑名单,以后这种账户下的订单全部不计入排序中。

     

    面壁人:吐血。。。。

     

    智子:姐再给你补一刀,你商品的评论也很重要哦,你刷得再靠前,但是你质量不好,有些个差评啥的,直接影响你的店铺分数哦,店铺分数低,排序受影响哦,你得保证商品质量哦,而且还得好好伺候你的顾客哦。

     

    面壁人:吐血的平方。。。。

     

    智子:姐还有很多规则哦,你听着哦,巴拉巴拉巴拉......

     

    面壁人:吐血的立方。。。

    正当面壁人被吊打得皮肉开裂的时候,有个叫耍蛋师的找到了面壁人,跟他说:来,我帮你刷,我是专业的,我们公司的员工遍布全国各地(的网吧中),IP地址分散,智子没辙,而且我们是真实的人在那边帮你操作哦,真实的帐号哦,可以下真实的订单哦,你不用真寄东西,我们提供真实的快递单号,智子查不出来,怎么样?给我个商品,两天,包你上搜索第一页,价格嘛?只要998!!!现在搞活动,只要668,保证上第一页,你想啊,上了第一页,668不瞬间挣出来了啊?

     

    面壁人一想,也是啊,上了第一页还怕没销量,反正没上还能退款,just do it!!

    在这个时代快结束的时候,职业**耍蛋师**登上了舞台,他们专业,他们深知中国互联网的规则:那就是没规则,他们也深知中国的国情:那就是人多,闲人更多,网吧的闲人那是多得不能再多了,在打游戏的间隙,接个任务,到各大电商平台下几单,一包烟钱就到手了,why not?这一年的年底,面壁人带着女朋友看了个电影,电影说的是关于一张价值连城的船票的故事。

    4. 智能时代


    智能时代,网上购物已经是常态了,连老婆都能在网上买到了,作为商家,到了如果不花钱基本上已经得不到流量的时代了,新开个店,不砸些钱,一个单都接不到,而作为平台方,已经到了如果不遏制作弊,将会严重影响用户体验的程度了。这个时代的作弊,已经完全产业化了,因为只凭个人能力,不可能和平台对峙了,于是出现了各种各样的作弊工作室。

    上个时代中,最后以耍蛋师的登场结束了,而且耍蛋师简直所向披靡,只要给钱,没有刷不了的单,你再牛逼,订出了无数的规则,但总没有人牛逼吧,我这可是真正的人在下单哦。

    正当耍蛋师happy得不行的时候,有一天,突然发现几乎所有的账户好像都不起作用了。怎么刷都不好使了,怎么回事??

     

    智子:我进化了,哼哼,沉寂了这么久,我get到了新技能,这些年我默默无闻的,其实我是在闭关修炼,为了能和你对抗,我已经挥刀自宫把之前的武功全部砍掉了,如今我已炼成葵花宝典,就等着和你较量了。

     

    耍蛋师:什么鬼?

     

    智子:我用葵花宝典这门绝学分析了这么多年的用户行为数据,我已经知道了哪些订单是真订单,哪些订单是假订单,虽然有时候会搞错,但是准确率还是相当高的哦,最关键的是,我已经不用什么规则了,你找个人下个订单试试,我基本能预测出这个订单是真的还是假的。

     

    耍蛋师:卧槽!这么厉害,真人都不行?我是真下单啊,我是真快递单号啊,我是全国各地订单啊。。。

     

    智子:那又如何,你这次交易行为就不像个正常交易。

     

    耍蛋师:哪不像了?

     

    智子:店家是新店家,刚开店才4,5天,哥们,你上来就直接打开这个商品的链接,点加入购物车,结算,付款,整个过程5秒钟,大哥,这是1万块的苹果笔记本啊,你连和店家打个招呼都不打,直接下单,你是真土豪呢?还是脑子进了水?

     

    耍蛋师:我靠!!!变超级赛亚人了啊!!我再叫个经验丰富的小弟买个看看。

     

    智子:呵呵,还是被我抓到了,这哥们倒不是直接打开链接了,是搜了个词再点进去买的,但是你看看你这小弟搜了个什么词,和商品标题长得一模一样,整个搜索结果就这一个商品,他是懒得翻页吧?这和直接打开商品链接有啥区别??后面的行为我都懒得看了...

     

    耍蛋师:卧槽,又阵亡一个,再上

     

    智子:恩?这哥们行为像真的,但是这个账户有问题哦,之前这个账户已经有多次交易被列为高危了,我觉得这像个作弊的账户啊,恩,不管了,宁可错杀一万,高危!干掉!这个帐号已经被列为超级高危账户了,以后他的交易都会被列为假交易。

     

    耍蛋师:。。。。。再上!

     

    智子:这哥们正常搜索了,还翻了几页,然后点进去了,礼貌的和客服MM进行了深入的交谈,互相留了微信号,然后下了一单,3天后来了个好评,还晒了图,像真交易哦,但不好意思,还是要干掉,谁叫你和客服MM说话的?

     

    耍蛋师:不是你说的要聊天才真实吗??!!!

     

    智子:你不知道女人是善变的么???我通过统计发现啊,有一类交易叫静默交易,就是啥也不说,就直接下单了,而且这类交易在很多分类中比例还挺高的,你这商品就在这个类目下啊,不好意思,这次被静默掉了。

     

    耍蛋师:我顶你个肺啊!!!

     

    智子:嘻嘻,我还有很多其他的方式判断哦,比如页面停留时间,如果是比较贵的商品,你是不是货比三家了。。。总之还有很多哦,哦,顺便告诉你,这葵花宝典啊,内功心法是机器学习,后面还有深度学习,神经网络。。我们慢慢切磋呗。。。

     

    耍蛋师:看来我只能修炼我的内力了,尽量让交易显得真实才是王道啊。。。。你等着。。。

    就这样,智子耍蛋师就这么你来我往一直较量着,有时耍蛋师占了上风,有时智子占着上风,而且这场较量会一直持续下去。。。

    而我们,正处在这个时代中,下个时代什么时候来临,我也不知道。。。

    5. 后记


    作弊和反作弊是一个永远不会结束的话题,作为一个技术人员,能做的其实比较有限,就像高考作弊一样,技术上只能提供监控录像,手机信号屏蔽器这种东西,但这两个东西真的只能抵挡低端的作弊行为,就像上面提到的智子,能做的也很有限,而人的想象是无限的,特别是在有高利润驱动的时候,想象力更是无限,所以想光靠技术来阻住搜索排序的作弊,其实是很难的,抱歉,关于人的无限想象力有多么的黑暗,不能再说了(其实我也不知道)。

    本篇文章只是很浅的说了一下搜索排序中几个常见的作弊和反作弊的场景,真实的反作弊就是在雄兔脚扑朔,雌兔眼迷离,双兔傍地走 安能辨我是雌雄这种扑朔迷离的场景下辨出真正的雌雄来。难度可想而知了。

    最后,本篇所有内容都是个人臆想,请勿对号入座。

    原文作者:西加加语言

    http://cssteach.com/show-16-105-1.html

  • 相关阅读:
    Python操作MySQL之SQLAlchemy
    mysql 中的视图详解。
    mysql终端下进行数据库备份与备份导入。
    python函数的特性。再后面再讲函数装饰器。
    序列解包(for x,y in zip(keys, values):)详解。
    jinja2.exceptions.TemplateAssertionError: no filter named 'zip'(这一类的问题的解决办法)
    flask
    网络基础知识
    测试用例设计要注意的问题
    使用tailf命令查看日志
  • 原文地址:https://www.cnblogs.com/cssteach/p/5589991.html
Copyright © 2020-2023  润新知