• 抖音流量这么大,为什么你视频的播放量总停在500左右?


    [作者:DeepLearningStack,阿里巴巴算法工程师,开源TensorFlow Contributor]

    今天说说产品相关的东西。因为实际需要,也是兴趣使然,我稍微仔细研究了下这个东西,确实很有意思。

    自媒体时代,很多人都想借着流量做点什么,但是这条路是真的难。尤其是抖音,考验的是面向算法和内容两方面的运营能力。

    两种模式对比

    我记得特别清楚,第一次发抖音的时候,拍的是一个桂林漓江的景色,刚发出没多久其播放量就开始猛涨,我兴奋不已。可是在几个小时之后,播放量稳稳地停在了604这个数字上,就好像这个视频从抖音上下架了一样。

    接下来的日子里,除了一段描述我本人考研状元(考研数学145分)的视频稍微火了一下(播放量19w),其他所有的视频播放量,其平均值基本都500左右。

    后来我做了调研,并且找到做类似产品的同学聊了聊,发现这和推荐的机制,以及推荐算法是有很大关系的。

    我们把“为什么播放量均值总是停在500左右”留在后面解答。

    同时为了引出推抖音的推荐机制,我决定还是以微信公众号这件自媒体产品做个类比来详细说明(之所以这么类比,是因为最近在做公众号,所以比较熟悉)。

    显而易见,同样是面向自媒体的产品,腾讯微信公众号与抖音,除了在媒体形式上存在差异(文字和短视频),还有一个重要的区别,那就是搜索与推荐的区别。

    这么说也不本质。如果更本质一点,应该是主动与被动的区别。

    就这么一个交互上的不同,背后是差异化十分显著的产品逻辑。

    如果我们想关注一个公众号,需要用户主动去搜索或者扫其二维码。当我们想推广一篇文章的时候,也需要一些用户主动地分享到朋友圈中。在这个生态圈中,所有的活动都需要用户主动去参与。可以说,没有主动性,闷死牢笼中,永无出头之日。所以公众号类自媒体特别依赖朋友圈,其实勉强解释一下也觉得合理,你的圈子基本说明了你的“画像”。

    而抖音的玩法就很不一样了,这是一款由算法深度参与且落地的产品。和一般的推荐机制相似,需要对用户进行画像。虽然你可能非常熟悉,但我还是要描述一下基本过程。

    当我们注册了抖音之后,在不断滑动屏幕的同时,一些视频会被动地推荐到我们的眼前。如果你在浏览过程中留下了一些“痕迹”,那么这些“痕迹”将会形成针对你本人的画像,这个画像就是你本人的描述。

    有哪些东西算是你的“痕迹”?我总结至少有以下几点:

    • 点赞

    • 转发

    • 停留时长

    • 评论

    • 关注

    • 发表的视频类型

    其他隐性的肯定还有,但是上面的几点基本能够刻画出你本人的喜好了。和一般的机器学习或者深度学习算法性质相同,数据量越大,训练的结果就越好,你的画像刻画的就越准确。

    当每个人都有了自己的画像之后,视频开始按照和每个用户画像的匹配度进行分发,也包括你发的视频。

    目前视频推荐还是需要一些tag作为辅助信息的,它由用户主动标记。在抖音上,tag以“话题”为名暴露给用户,比如下图中红框标出的部分。(抖音可以互关一波哈)

    “话题”对推荐具有十分重要的导向。虽然一些例如卷积神经网络的算法模型可以直接分析视频,但整个计算过程既耗时又耗资源,不一定全量使用这种方法。另一方面,tag由视频作者创建,他几乎是最了解视频内容的人,所以这个信息也相对可靠。

    因此,要想推广一个视频,tag要认真甄选。

    抖音的“闯关模式”

    现在我们回答开头提出的问题——为什么是500这个数字?

    这是刻意指定的规则,我称之为“闯关”模式,而且很多外部竞品也在效仿这个方式。具体是这样的,请看下图。

    上图中所谓的摘除视频,确确实实是从推荐系统中摘除了,几乎不会有被动曝光的机会。但据说还有“挖坟”功能,意思大概是即使被摘除的视频,也可能因为某些条件被触发而复活推荐。

    所以,播放量总维持在500的原因是——第一关没过,且视频被推荐系统摘除。

    到底有多少关卡?据不可靠消息,关卡大概一共有这么几个。

    • 第一关:流量300-500

    • 第二关:流量3000

    • 第三关:流量1.2~1.5万

    • 第四关:流量10~12万

    • 第五关:流量40~60万,开始介入人工审核

    • 第六关:流量200~300万,伴随人工审核

    • 第七关:流量700~1100万,伴随人工审核

    • 第八关:流量3000万级

    过关门槛是什么?是根据用户留下“痕迹”的统计指标设定的阈值。一般来说,这些指标的权重从高到低排列如下:

    完播率  >  点赞率  >  评论率  >  转发率  >  关注率

    而且比较可怕的是,这个周期非常短暂,短暂到你几乎没反应过来的时候,这阵风就已经过了。从视频产生开始,到第八关可能只经过一周左右。

    长尾和冷启动

    看到这你也别泄气,这太正常不过了。和大部分推荐场景一样,用户整体服从一个极端长尾的分布。

    这就是“旱的旱死,涝的涝死”分布。

    不仅是算法领域,在任何时候几乎都存在这种分布。当这种分布已经形成,并处于极端的两极分化,它的形态就不再容易改变了。

    一般情况下,推荐系统会优先推荐大众认为好的内容,它一旦被推荐,就会收到更多的流量,只能越来越好,因此进入良性循环。这对于长期稳定处在这个体系中的所有用户来说,其实没有什么不公平。


    但对于新进场的用户却十分不公平,因为新用户得不到被推荐的机会,这就是臭名昭著的“冷启动”问题。具体来说,推荐系统并没有见过它的任何数据,所以不可能做出其进入大流量场的决策。但从理论上讲,他确实可能具有优质内容的潜力,如果一味的按照旧的标准进行推荐,那么该用户将活活被推荐系统闷死。

    对于推荐场景来说,冷启动问题十分臭名昭著。新的血液进不去,整个系统可能永远处于一个停止不前的状态,推荐的机制也会因为数据分布的极度“稳定”而变得十分单一。不仅如此,还可能会出现大批用户因为得不到利益而选择退场的情况。短视频如此,电商也如此,只要是推荐领域,冷启动问题都是必须要缓解的。

    所以像短视频推荐这种产品,一般对新入场的用户都有扶新机制。扶新机制会给予新用户一定时间内特殊的照顾。其实对于旧人新发的视频,可能也存在这样的机制。但无论怎么样,这个分布已经形成,就无法解决的很干净。

    至于到目前为止,“闯关”模式有没有被改进甚至换掉,我也不是很清楚,但从实验上看,即使有差异,也应该和上面的框架不会相差太多。

    “闯关”对平台的好处

    再回过头来看这个机制对平台的好处。

    一个是减少垃圾信息的传播,提高流量资源的使用效率。如果不设立这种闯关模式,流量资源会被分散在质量良莠不齐的广大以屌丝为主的群体中。这就有点像用钱投资,相当于钱没有投到利润最大化的资源上。

    另一个好处是刻意制造了稀缺性。这一点很重要,因为它让所有用户都看到了高位用户所得到的丰厚利益,从而隐形的给广大屌丝用户画了个饼——只要你能火,你就能发财。所以,花钱推广的功能就顺理成章的成为了抖音的一个重要的变现功能点,你可以花钱推流量,也可以推粉丝。这个功能点,似乎只有平民用户才会用得到。所以,从收入变现上来讲,抖音上所有的用户都是有金钱价值的用户。

    结语

    目前,短视频领域还在处于上升期,优质的内容总有机会被展示,至少它的想象空间仍然是十分巨大的。相对于做公众号,在抖音上除了提供优质的内容,还需要做足面向算法的运营工作。

    你可能有想法去拍抖音,去做各种形式的自媒体。但你会很犹豫,因为你觉得现在进场会比较晚,并且抖音的短周期十分碰运气,优质的内容又对核心竞争力有碾压式的要求,还会遇到冷启动问题,所以你觉得不如不做。

    但是,种一棵树最好的时间是十年前,其次是现在。

    而且,运气也需要实力的积累。

    欢迎大家关注我的公众号,“互联网西门二少”,我将继续输出我的技术干货~

  • 相关阅读:
    异象石(引理证明)
    Codeforces Round #664 (Div. 2)
    2020 年百度之星·程序设计大赛
    Codeforces Round #663 (Div. 2)
    Codeforces Round #662 (Div. 2)
    相等运算符
    Unicode编码
    算术运算符
    强制类型转换到Boolean
    强制类型转换到Number
  • 原文地址:https://www.cnblogs.com/deep-learning-stacks/p/13251410.html
Copyright © 2020-2023  润新知