• 锐推榜的平衡策略


    郑昀@玩聚RT 20091116

    一、锐推榜上榜阈值是否需要与Followers数目成正比?

        terryxxy建议道:

    『如果让我设计 @rtmeme ,被RT者的阈值应该和其follower数成正比,也就是说,名人由于容易被关注,需要更多次的RT才能上榜。就不容易出现这种了 http://is.gd/4VW9X

        terry的意思是,如果一条Twitter消息(下称Tweet)被人们转发次数大于等于某一个阈值(比如6次),那么如果能定位这条消息的原作者以及转发第一人是谁,就可以根据这两个人的Twitter账户被关注人数(或Followers数目),相应地调整上榜阈值。从而得到这样的效果:关注者越多,他的Tweet以及他转发别人的ReTweet上榜越困难。

    我的回答是:

        锐推榜(含@rtmeme)承担的不只是一两个角色,比如有趣的推,比如尽量早地发现好推,比如推特上热度衡量等等。为了保证有趣,有时候会特地设计一些规则。

        但每种规则都会有利有弊。

        锐推榜有一个考虑,是尽量在没有成为尽人皆知的热门消息前把好推送到人们面前。上榜与原作者以及转发第一人的关注者数/followers数挂钩,无论是线性还是非线性的,都意味着那些动辄关注者四千到8千乃至一万的中国Twitter用户之大量好推可能永远无法第一时间上榜甚至被忽略,@rtmeme 将把第一时间报道好推热推权拱手相让。

        毕竟,锐推榜是机器自动生成的。如果是人在挑选审核,相信会好很多,但那已不是我们的本意。

    二、为何有时锐推榜删除转发第一人的评论呢?

        锐推榜让一条消息上榜前,通常会把RT最前面的第三方评论删除,否则当后面的人转发rtmeme的消息时连带转发了评论文字,就无法通过锐推的语义信息指纹来合并统计了。抱歉,别无他意。

        放在原消息后面的评论是不会删除的。删除最前面的评论,是因为当一轮一轮转发后,机器很难判定真正的消息主体在哪里,从而无法计算信息指纹,无法合并后续锐推,造成转发票数少。这也是Twitter原发式转发统计的困境。如果是新浪微博或Yahoo!meme就不会有此问题。Twitter引入Retweet API后估计会减少此问题的发生。

        当然有大量人转发包含转发第一人的包含评论的锐推时,它的语义信息指纹就有可能与上榜原推不一样。此时,机器还会判定两条上榜消息之间的语义相似度,也能阻止相似推上榜。但有时转发者的评论信息含量较大时,也无法阻止二次上榜。

        举例:

    第一次上榜的:

    RT @riku RT @neso: 奥巴马撞倒防火墙是本周国内推友的一场集体春梦,并在奥巴马朝墙吐了几口口水后达到了高潮。(转发50余次)

    第二次上榜的:

    RT @duola RT @riku: 人人都有意淫的权利 RT @neso: 奥巴马撞倒防火墙是本周国内推友的一场集体春梦,并在奥巴马朝墙吐了几口口水后达到了高潮。(转发20余次)

  • 相关阅读:
    欧拉回路一个定理的证明
    NOIP2018 初赛数学第二题解析
    linux 减少Terminal路径的方法
    网络挖坑
    linux 记录
    河南游记 Day0

    NOI2018 Day 1 你的名字
    大佬的几行fastIO
    Codeforces 781B. Innokenty and a Football League
  • 原文地址:https://www.cnblogs.com/zhengyun_ustc/p/1604005.html
Copyright © 2020-2023  润新知